Face à GPT-4 d'OpenAI, Google lance partiellement Gemini

Google a fait un pied de nez aux rumeurs de retard dans le lancement de son LLM multimodal nommé Gemini. La firme présente les versions Ultra, Pro et Nano de son modèle qui se veut un concurrent direct à GPT-4 d'OpenAI. La déclinaison la plus performante reste pour l'instant cantonnée au stade expérimental.

En début de semaine, plusieurs médias rapportaient l’annulation de plusieurs évènements organisés par Google pour le lancement de son LLM multimodal, Gemini. Certains voyaient déjà un décalage au début pour les premiers pas du modèle. Et bien, la firme de Mountain View a décidé de faire mentir en partie les rumeurs. S’il n’y a point d’évènements, Google lance bien officiellement aujourd’hui Gemini, mais de manière partielle.

Après avoir énuméré les efforts de la firme sur l’IA, Sundar Pichai, CEO de Google et Alphabet, indique dans un communiqué, « Aujourd'hui, nous passons à l'étape suivante avec Gemini, notre modèle le plus performant et le plus général à ce jour, qui offre des performances de pointe dans de nombreux tests de référence. Notre première version, Gemini 1.0, est optimisée pour différentes tailles : Ultra, Pro et Nano ».

Gemini Pro et Nano font leurs premiers pas, Gemini Ultra en retard

Dans le détail, Gemini Pro est disponible immédiatement dans Bard, le chatbot de Google lancé en début d’année. Il sera accessible uniquement en anglais dans 170 pays. La société prévoit l’intégration d’autres langues et pays prochainement. Pour mémoire en France, il avait fallu attendre juin pour le voir se déployer. La version nano de Gemini, quant à elle, trouvera sa place dans le smartphone Pixel 8 via Android 14 avec plusieurs fonctionnalités comme le résumé d’enregistrement, le smart reply dans Gboard, etc. Enfin, l'éditeur prévoit d’intégrer Gemini dans d’autres services comme Search, Ads, Chrome et Duet AI dans les prochains mois.

Les développeurs et les clients entreprises pourront à partir du 13 décembre avoir accès à Gemini Pro via l’API de AI Studio ou via Vertex AI de Google Cloud. Les développeurs Android pourront se servir de la version nano du LLM. Enfin, il reste Gemini Ultra qui est l’itération à l’origine des rumeurs de retard. Dans un communiqué Google, « nous procédons actuellement à des vérifications approfondies sur la confiance et la sécurité du modèle ». Il ajoute, « nous mettrons Gemini Ultra à la disposition de certains clients, développeurs, partenaires et experts en matière de sécurité et d’éthique pour des essais préliminaires ». La firme donne rendez-vous au début de l’année prochaine pour voir les performances de Gemini Ultra dans la version « Bard Advanced ».

Une bataille à distance Google/OpenAI

Pour mémoire, Gemini est un LLM multimodal. C’est-à-dire qu’il est capable de générer du texte, des images, de l’audio, de générer du code (Python, Java, C++ et Go). Il est en concurrence avec GPT-4 et la dernière version Turbo annoncée lors du premier DevDay d’OpenAI. On notera d’ailleurs que dans sa communication, Google a réalisé des benchmarks avec GPT-4 et non avec la déclinaison Turbo plus récente.

La bataille est donc lancée sur la course aux LLM multimodaux. Google essaye de profiter d’une petite baisse de régime d’OpenAI après la crise de gouvernance et le sort de Sam Altman. En début de semaine, Axios soulignait que l’éditeur allait retarder à 2024 le lancement de GPT Store , un outil de personnalisation de ChatGPT.