Sous la pression de l’ascension fulgurante de Deepseek, OpenAI avait au début du mois février évoqué le lancement d’une version intermédiaire pour son LLM GPT motorisant son assistant ChatGPT avant la présentation cette année de la version 5. C’est aujourd’hui chose faite avec l’annonce de GPT-4.5. Connu sous le nom de code Orion, il est actuellement le plus grand modèle du fournisseur. Une annonce suivie de près par les analystes qui s’interrogent sur la viabilité des grands modèles de langage par rapport aux modèles plus petits et à moindre coût affichant des bonnes performances sur certaines tâches.
Dans le cadre de GPT-4.5, OpenAI reprend les recettes de formation de ses prédécesseurs avec une phase d’apprentissage non supervisé et du renforcement par l’humain. La société a indiqué avoir investi beaucoup dans les capacités de calcul au point que Sam Altman, CEO d’OpenAI a indiqué sur Twitter : « Nous nous sommes beaucoup développés et nous n'avons plus de GPU ». Une raison pour laquelle, GPT-4.5 est dans un premier temps réservé aux abonnés de la formule à 200$ HT par mois. Les clients ChatGPT Plus et Team devraient y avoir accès dans le courant de la semaine prochaine, le temps de rajouter « des dizaines de milliers de GPU », assure Sam Altman. Pour les utilisateurs passant par l’API, le fournisseur facture 75$ HT pour chaque million de jetons d'entrée (environ 750 000 mots) et 150$ pour chaque million de jetons de sortie. À titre de comparaison, GPT-4o ne coûte que 2,50$ par million de jetons d'entrée et 10$ par million de jetons de sortie.
Des performances au rendez-vous sur certaines tâches
A ce prix-là, la performance est-elle au rendez-vous ? Dans son tweet, le dirigeant clarifie un point : « GPT-4.5 n’est pas un modèle de raisonnement » au même titre que GPT-4o. Cependant, la grande taille du modèle lui donne un avantage sur des tâches nécessitant de la connaissance. Ainsi sur des questions factuelles simples, GPT-4.5 surpasse GPT-4o et les modèles de raisonnement d'OpenAI, o1 et o3-mini, en termes de précision. La société souligne aussi que son dernier modèle hallucine moins souvent. Multimodal, il est capable de travailler sur des fichiers et des images, mais pas sur la voix ou la vidéo.
Sur les tests de connaissances, GPT-4.5 affiche de bonnes performances et moins d'hallucinations. (Crédit Photo: OpenAI)
S’il n’est pas doté de capacité de raisonnement, GPT-4.5 est cependant capable de traiter certaines tâches complexes. Dans certains tests, il égale ou surpasse les autres modèles sans raisonnement. OpenAI souligne dans son blog que le modèle est performant sur la capacité à comprendre l'intention humaine, un élément que les tests ont du mal à évaluer. Il répond sur un ton plus chaleureux et plus naturel et obtient de bons résultats dans des tâches créatives telles que l'écriture et la conception. Il n’en demeure pas moins que sur d’autres tests, les LLM de raisonnement dépassent les capacités des modèles de connaissance. Une réalité qui fait dire à OpenAI, « le raisonnement sera une capacité essentielle des futurs modèles et que les deux approches de la mise à l'échelle - le préapprentissage et le raisonnement - se complèteront ».
Commentaire