Lancé en mai dernier, le LLM orienté multimodal, GPT-4o ne cesse d’évoluer. Après une version mini présenté à la mi-juillet, OpenAI annonce une version intégrant une fonction dédiée pour les développeurs pour simplifier le processus de générations de résultats « bien définis » et « structurés » depuis les modèles d’IA.
Baptisé GPT-4o-2024-08-06, le LLM propose aux développeurs de spécifier les résultats souhaités. « Cette fonctionnalité est particulièrement précieuse pour les développeurs qui ont besoin de valider et de formater les outputs d’IA dans des structures comme les schémas JSON », explique la start-up dans un blog. Elle ajoute que « les développeurs sont souvent confrontés à des difficultés » sur ces validations et formatages. OpenAI précise qu’une version préliminaire du LLM est disponible sur Azure OpenAI de Microsoft.
Une tarification à préciser
Les deux sociétés estiment que le schéma JSON sert pour maintenir la cohérence entre les plateformes, gérer les contraintes d’interface utilisateur basé sur le modèle, et générer automatiquement d’UI. « Ils sont également essentiels pour définir la structure et les contraintes des documents JSON, en veillant à ce qu'ils respectent des formats spécifiques avec des propriétés et des types de valeurs obligatoires. Ils améliorent la compréhensibilité des données grâce à l'annotation sémantique et servent de langage spécifique à un domaine pour optimiser les exigences de l'application », expliquent les entreprises.
Le LLM prend en charge deux types de sorties structurées : le schéma JSON défini par l'utilisateur et le mode strict ou une sortie d'outil plus précise. La sortie définie par l'utilisateur est prise en charge par GPT-4o-2024-08-06 et GPT-4o-mini-2024-07-18. Par ailleurs, le mode strict limité est supporté par tous les modèles qui supportent l'appel de fonction, y compris les modèles GPT-3.5 Turbo, GPT-4, GPT-4 Turbo et GPT-4o. Microsoft n'a pas encore publié le prix du nouveau modèle sur son portail de tarification.