Le phénomène ChatGPT a tenu en haleine beaucoup de personnes pendant le week-end. Un tour sur Twitter montre les différents tests réalisés avec ce chatbot promu par OpenAI. Et le moins que l’on puisse dire est que le succès a été au rendez-vous, au point que ce lundi, la page pour tester ChatGPT n’acceptait plus de tests. Pour mémoire, OpenAI est une société basée à San Francisco avec, parmi ses fondateurs, Elon Musk et Peter Thiel, mais aussi AWS et Infosys. L’objectif de l’entreprise est de promouvoir et de développer des solutions d’intelligence artificielle.
Parmi les projets d’OpenAI, les développeurs connaissent notamment Copilot, réalisé avec GitHub. Cet assistant au code fait régulièrement parler de lui, y compris sur le plan judiciaire. En l’espèce, le projet ChatGPT repose sur GPT-3, une IA basée sur le traitement du langage naturel entraînée avec 175 milliards de paramètres. Cette IA est déclinée en différentes initiatives comme Dall-E pour la génération d’image à partir de texte et ChatGPT pour le chatbot capable de créer un échange de manière naturelle sur n’importe quel sujet.
Un entraînement spécifique et déjà des interdictions
Dans un article, OpenAI explique comment fonctionne et a été entraîné ChatGPT. « Nous avons entraîné ce modèle à l'aide de l'apprentissage par renforcement à partir de la rétroaction humaine (RLHF), en utilisant les mêmes méthodes qu'avec InstructGPT (des modèles intégrant l’humain dans la boucle), mais avec de légères différences dans la configuration de la collecte de données ». Cette technique donne des résultats plus pertinents qui ont agréablement surpris les testeurs du week-end. A noter que pour entraîner ces modèles, OpenAI utilise des instances HPC sur le cloud Azure de Microsoft.
ChatGPT essaye de ne pas tomber dans le travers des récents tests de chatbots qui ne filtrent pas les biais, les propos haineux, complotistes, offensants, discriminatoires, etc (comme Meta qui a récemment débranché son IA Galactica). Mais si OpenAI reconnait des efforts dans ce domaine, il souligne que les résultats du chatbot ne sont pas infaillibles et pêche par l’absence de sens critique et de la nuance. Certains sites ont déjà annoncé l’interdiction de commentaires générés par ChatGPT comme Stack Overflow jugeant les résultats peu fiables. D’autres prêtent déjà à ce système la vocation de battre en brèche le suprématie de Google dans la recherche. Il y a de multiples cas d’usages qui devront se confronter aux questions d’éthiques. Notons qu'inexorablement ces IA génératives sont appelées à se développer et à séduire bon nombre de personnes.