Ce mercredi, Microsoft a publié un billet de blog décrivant les changements à venir pour le chatbot IA de Bing, tandis qu'OpenAI a publié un message sur son blog technique jeudi avec plus de détails sur la façon dont elle a également ajusté son modèle. Les deux entreprises font en effet face à un boom d'activité sur leurs chatbots respectifs et les erreurs se multiplient. Pour sa part, la dernière version de Bing Chat n'est sortie que depuis une semaine, mais a rapidement gagné en popularité. La firme de Redmond évoque dans un post un « engagement accru » depuis le lancement du navigateur dopé à l'IA dans 169 pays. Selon elle, environ 71 % des utilisateurs ont donné un « coup de pouce » aux réponses fournies par Bing Chat
Reste que certains retours ont poussé Microsoft à intervenir. Qu'il s'agisse d'une conversation prolongée avec un journaliste du New York Times où Bing s'interrogeait sur le mariage du journaliste, d'insultes racistes ou de menaces présumées à l'encontre des utilisateurs qui le testaient, l'outil n'a pas été tout à fait à la hauteur de ce que les utilisateurs attendaient d'un chatbot. Par ailleurs, des requêtes souffraient d'un déficit d'actualisation. Dans ce cadre, Microsoft a promis de renforcer la base de données de l'agent conversationnel.
OpenAI et Microsoft font face à des bugs de leurs outils
Jeudi, OpenAI a publié un long article sur son blog détaillant les changements apportés à son modèle. Deux phrases, cependant, se détachent : « nos directives sont explicites sur le fait que les examinateurs ne doivent favoriser aucun groupe politique », indique le post. « Les biais qui peuvent néanmoins émerger du processus décrit ci-dessus sont des bugs, pas des caractéristiques ». Le post d'OpenAI faisait indirectement référence aux rapports selon lesquels ChatGPT favorisait les points de vue libéraux.
Microsoft prévoit de résoudre ses propres problèmes de plusieurs manières. Tout d'abord, l'entreprise envisage d'ajouter une option pour mieux contrôler la précision et la créativité des réponses fournies par Bing. Dans le monde de la génération d'image par l'IA, cela se présente souvent sous la forme d'un curseur pour sélectionner le « guidage », c'est-à-dire le degré d'adéquation entre le résultat de l'algorithme et l'invite d'entrée (un accompagnement plus faible laisse à l'algorithme plus de place pour la créativité, mais peut également fausser les résultats dans des directions inattendues). Microsoft a déclaré que cela se manifeste d'une manière inattendue, car les utilisateurs utilisent le chatbot pour le « divertissement social », faisant apparemment référence aux longues et étranges conversations qu'il peut produire.
Trop sollicité, Bing sort des clous
Mais l'éditeur a également déclaré, pour le meilleur ou pour le pire, il est probable qu'elle atténue la façon dont Bing interagit avec les utilisateurs au cours de sessions de chat prolongées. « Nous avons constaté que dans les sessions de chat longues et prolongées de 15 questions ou plus, Bing peut devenir répétitif ou être incité/provoqué à donner des réponses qui ne sont pas nécessairement utiles ou conformes à ce que nous avons conçu », a déclaré la société. Elle avance la raison selon laquelle le modèle devient « confus » sur ses réponses, et peut être orienté à produire « un ton où le style de réponse n'est pas attentionné ». Il s'agit d'un « scénario qui nécessite beaucoup d'incitations », mais qui peut se produire, selon Microsoft. Dans un tel cas, il propose de « rafraîchir le contexte de manière plus facile ».
Enfin, l'équipe Bing envisage d’autres fonctionnalités telles que la réservation de vols ou l'envoi d'e-mails. Elles seront ajoutées dans de « futures versions ». Subjectivement, notre confrère d'IDG lors d'un teste avait trouvé que Bing était un peu primaire et correct, établissant des directives strictes auxquelles il essaie de se conformer. Une fois ces limites dépassées, « Sydney », comme certains l'appellent, peut révéler une personnalité bizarre, sauvage et parfois peu attrayante. Mais il est également vrai qu'à l'heure actuelle, la partie créative de ChatGPT et de Bing est celle avec laquelle les utilisateurs ont le plus recours. Reste à savoir comment Microsoft équilibrera les deux.