En novembre 2023, Snowflake avait dévoilé son service Cortex « qui héberge des modèles d'IA, des LLM et des fonctions vectorielles à la pointe de l'art », expliquait Sridhar Ramaswamy, alors senior vice-président de l’IA et devenu en février dernier CEO. A l’occasion de son évènement à San Francisco, la société a annoncé plusieurs mises à jour à Cortex.
Un studio IA et ML en no-code
En premier lieu, elle a présenté Studio IA et ML doté d'une interface no-code via un chatbot nommé Playground. Cette fonctionnalité donne aux entreprises de rapidement créer, affiner et déployer des applications IA avec différents LLM comme Google, Meta, Mistral, Reka et Arctic. « Actuellement en preview privée, Playground peut aider les entreprises à accélérer le développement d'applications d'IA et fournir une interface pour trouver le LLM le plus performant et le plus rentable pour un cas d’usage spécifique », a déclaré l’éditeur. Mais, selon les analystes, avec le lancement de Playground, le fournisseur viserait plusieurs objectifs, y compris celui de rattraper son rival Databricks. « L’introduction d’une interface no-code est sans doute aussi motivée par la pression croissante du marché et des concurrents qui ont déjà adopté ces environnements de développement conviviaux », a déclaré Steven Dickens, vice-président du cabinet de recherche et de conseil The Futurum Group. « Le succès de plateformes comme Databricks, qui offrent des outils complets de développement de l'IA et de l'apprentissage machine, n’est certainement pas étranger à cette décision, d’autant que Snowflake est souvent perçue comme une solution trop coûteuse et complexe », a ajouté le consultant.
Databricks offre une interface low-code via ses notebooks collaboratifs et ses intégrations avec MLflow. « L’incursion de Databricks dans l'espace low-code date d’il y a trois ans, quand le fournisseur de data lakehouse a acquis la startup allemande 8080 Labs et son outil de datascience bamboolib pour l’intégrer dans sa plateforme », a rappelé Hyoun Park, analyste en chef chez Amalgam Insights. Selon les analystes, un autre rival, Oracle, a également développé ses capacités de développement low-code avec APEX. Par ailleurs, d’après Steven Dickens, Playground pourrait aider Snowflake à conserver un peu de sa part de marché et à attirer des utilisateurs. Afin d'aider un plus grand nombre d’entreprises à améliorer les performances LLM et à offrir des expériences personnalisées, Snowflake a introduit Cortex Fine-Tuning, actuellement en preview publique. « Cortex Fine-Tuning est accessible via Playground ou une simple fonction SQL », a précisé la société.
Des capacités de construction de chatbots renforcées avec Analyst et Search
L’ajout de fonctionnalités supplémentaires, en particulier Analyst et Search, renforcent les capacités de développement de chatbots de Cortex et devraient aider les entreprises à créer des bots capables de répondre à des questions sur leurs données, qu'elles soient structurées ou non, en utilisant le langage naturel. Construit avec les modèles Llama 3 de Meta et Mistral Large, Analyst propose aux entreprises de construire des applications au-dessus de leurs données analytiques dans Snowflake. « Avec l’introduction de Cortex Analyst, Snowflake peut conserver un écosystème plus fermé centré sur Snowflake tout en offrant une passerelle vers les LLM open source », a expliqué Hyoun Park. Cependant, Stevens Dickens fait remarquer que des concurrents comme Databricks, Elastic, Oracle et Teradata, proposent déjà des capacités similaires. Analyst, qui devrait être présenté sous peu en preview publique et a été testé par des clients comme Zoom et Bayer.
Quant à Search, la fonctionnalité utilise la technologie d'extraction et de classement de Neeva ainsi que sa capacité d'intégration Arctic (le LLM maison présenté en avril dernier) pour aider les utilisateurs à créer des applications à partir de documents et d'autres ensembles de données textuelles par le biais d'une recherche hybride, combinant une approche vectorielle et textuelle. Snowflake a acquis Neeva en mai de l’année dernière pour sa technologie de recherche basée sur l’IA désormais intégrée à la plateforme AI Data Cloud. Selon Hyoun Park, Search peut aider les entreprises à combler le fossé entre leur compréhension initiale des documents en tant que données et leur capacité à traduire les documents en capacités d'IA. « Même si le développement d'applications à partir de données structurées traditionnelles est assez commun, la capacité de créer des applications à partir de documents et de données non structurées n'est pas encore très répandue au sein des entreprises », a estimé le consultant.
Plusieurs fonctionnalités bientôt disponibles pour tous
Lors du Snowflake Summit, le fournisseur a promis de rendre bientôt disponibles une série de fonctionnalités et de capacités. Parmi elles, la fonctionnalité Guard qui s'appuie sur Llama Guard de Meta, une protection des entrées-sorties basée sur LLM, pour filtrer et signaler les contenus sensibles dans les données et les actifs de l'entreprise, y compris les échanges violents et haineux, les discussions en rapport avec l'automutilation ou avec des activités criminelles. Une autre fonctionnalité appelée Document IA, présentée en juin 2023, sera aussi bientôt accessible à tous. « Document AI, qui exploite la technologie acquise avec le rachat d'Applica par Snowflake l'année dernière, promet d’aider les entreprises à mieux utiliser les données non structurées », souligne le fournisseur.
« Snowflake Copilot, un assistant text-to-SQL, sera bientôt généralement disponible », a encore annoncé le fournisseur, ajoutant que Copilot combine Mistral Large avec le modèle de génération SQL propriétaire de Snowflake pour accélérer la productivité de tous les utilisateurs SQL. À noter encore que la fonctionnalité Model Registry, introduite en juin de l'année dernière, est désormais ouverte à tous. Selon Snowflake, cette capacité offre un référentiel unifié pour les modèles d'apprentissage machine d'une entreprise. Il permet aux utilisateurs de centraliser la publication et la découverte des modèles, rationalisant ainsi la collaboration entre les datascientists et les ingénieurs ML.