Snowflake revient à Paris pour faire son show à l’occasion de son Data cloud world tour. Sur cette journée, 800 personnes étaient attendues et pas moins de 28 partenaires étaient présents. L’objectif est clair : rappeler aux clients et aux prospects français la valeur de son data cloud. Pour ce faire, le spécialiste du data warehouse qui se présente souvent comme franco-américain est revenu sur les annonces phares faites lors de son Snowflake Summit en juin dernier. Pour mémoire, les deux grandes innovations produits concernent Snowpark Container Services et Document AI. Le premier service est la suite logique de Snowpark, introduit en juin 2021 et disponible à tous depuis fin janvier 2022. En juin 2023, la firme a donc annoncé Snowpark Container Services en étendant son framework via un runtime Kubernetes ou Docker pour différentes applications.
Dans ce cadre, l’éditeur s’est associé à des dizaines de fournisseurs de logiciels et d’applications tiers, incluant Alteryx, Astronomer, Dataiku, Hex, Nvidia, SAS, pour ne citer qu’eux afin de proposer aux clients un accès sécurisé à une large gamme de produits et de solutions au sein de leur compte Snowflake. Benoît Dageville, co-fondateur de Snowflake et président responsable produit, précise que pour l’heure le service est en private preview mais que plusieurs entreprises ont d’ores et déjà développé des applications complètes dessus. « Snowpark et Snowpark Container services sont deux services importants pour l’IA et le ML » poursuit le co-fondateur de Snowflake.
Frank Slootman, CEO de Snowflake, est revenu sur les deux annonces phares faites en juin : Snowpark Container Services et Document AI. (Crédit : CS)
Document AI, un LLM maison
En parallèle, l’éditeur a introduit Document AI, un LLM maison construit à partir d’Applica, une plateforme d’IA pour la compréhension des documents, basée en Pologne et que la firme a acquis en août 2022. En construisant son propre LLM, Snowflake apporte une palette d’outils supplémentaires aux utilisateurs afin que ces derniers exploitent mieux les documents et utilisent à bon escient leurs données non structurées. Avec Document AI, les entreprises peuvent, entre autres, extraire des documents des contenus tels que les montants des factures ou les termes des contrats et affiner les résultats à l'aide d'une interface visuelle et du langage naturel. Si par défaut l’outil utilise un modèle « zero shot » - ce qui signifie que tout utilisateur peut obtenir de bons résultats sans avoir à affiner ou à entraîner le modèle – il est toujours possible de le faire en modifiant les réglages pour améliorer les résultats.
Et Document AI n’est que l’un des multiples services que la firme veut créer à terme. « On va élaborer un ensemble de services de très haut niveau, très avancés. On a commencé avec Document AI actuellement en private preview, qui permet d'exécuter des LLM sur n'importe quel document, qu’il s’agisse des documents PDF, des images, etc » poursuit Benoît Dageville. Il prend ainsi l’exemple de contrats qu’une entreprise aurait à traiter. « Par exemple, pour des contrats, on peut créer des pipelines, ingérer, extraire toutes les informations présentes dans ces documents, les clauses, les signataires du contrat, les red lines et automatiquement le système LLM va extraire ces informations et les stocker de manière semi structurée dans snowflake. Par la suite, elles pourront être interrogées en langage naturel ».
Démonstration du processus de traitement de documents par Document AI. (Crédit : DR)
A l’avenir, d’autres services avancés qui utilisent les LLM devraient donc rejoindre Document AI et seront accessibles à tous les utilisateurs. Benoît Dageville précise que d’autres services suivront pour la recherche avancée. Pour cela, l’entreprise compte s’appuyer sur l’une de ses récentes acquisitions, Neeva, une société de recherche qui exploite en particulier l’IA générative pour permettre aux utilisateurs d'interroger et de découvrir des données d’une façon différente de ce que l’on peut trouver jusqu’à présent sur Bing ou Google Search et ce, sans publicité. Et si pour l’heure le co-fondateur de Snowflake n’en dévoile pas plus à ce sujet, il promet que l’intégration de Neeva va se faire très vite.
La plateforme de Snowflake regroupe aujourd'hui Snowpark Container Services, Streamlit (fruit d'une acquisition) et expériences alimentées par les LLM. (Crédit : DR)
L’IA, future épine dorsale de Snowflake ?
Lors de la plénière, l’équipe dirigeante a également évoqué le sujet qui brûle toutes les lèvres : la stratégie IA des entreprises. Face à cette technologie qui croît à vitesse V et qui se démocratise au sein des différentes équipes – IT et métiers – l’entreprise veut montrer qu’elle apporte tous les outils nécessaires. « Pour qu’une entreprise ait une stratégie IA, il faut d’abord qu’elle ait une stratégie data » tient à rappeler Frank Slootman, CEO de Snowflake. Et sur ce point, on ne peut que lui donner raison. La data est au cœur des solutions d’intelligence artificielle et plus précisément de l’IA générative. Or, ce sont les données non structurées – des documents, des fichiers, des images, des vidéos – qui posent aujourd’hui problème. Pour un utilisateur humain, il est simple de regarder une vidéo et d’expliquer de quoi il s’agit. Pour une machine, c’est impossible indique Benoît Dageville. « La seule façon d'interroger ces données non structurées, c’est d'utiliser des modèles d’IA, des LLM, qui vont extraire de l'information semi-structurée sur ces fichiers pour en faire quelque chose d’exploitable. On est en train de vivre une révolution » ajoute-t-il.
« L’une de nos priorités majeures, c’est l’intégration de l’IA de manière à simplifier et à garder la gouvernance face à la pression qui existe aujourd’hui qui consiste à utiliser ces technologies et, de temps en temps, à le faire tout en ignorant les règles de sécurité et de gouvernance. Ce qui constitue un énorme risque en soit » admet Benoît Dageville. « Mais d’un autre côté, il faut que l’on prouve que l’on peut faire quelque chose avec cette technologie. Il y a une tension entre la sécurité, la gouvernance et avancer le plus vite possible ». Et si certains avaient oublié la vision de Snowflake, Benoît Dageville n’hésite pas à rappeler le chemin emprunté par l’entreprise : « Notre la vision la plus importante de Snowflake, c’est de bouger les workflows dans la plateforme Snowflake et vice-versa, soit bouger les données vers les traitements » et d’ajouter « Snowflake va être l’équivalent de l’iPhone pour les applications data ».