espère que sa base de données vectorielle serverless répondra à la demande autour de l'IA générative tout en réduisant les coûts et les incontournables tâches de gestion de l'infrastructure. Cependant, les analystes pensent que Pinecone Serverless, la base de données vectorielle serveurless de Pinecone, risque de faire peu d'adeptes. « Pourquoi mettre en place et administrer une base de données distincte, même si elle présente les avantages de l'évolutivité serverless, si l’on peut avoir la même fonctionnalité à partir de la base de données que l’on utilise déjà et dans laquelle on gère déjà ses données », se demande ainsi Doug Henschen, analyste principal chez Constellation Research. Outre les bases de données vectorielles comme Milvus, Weaviate et Chroma, les fournisseurs de services de bases de données comme MongoDB, Couchbase, Snowflake et Google BigQuery, entre autres, ont déjà ajouté des fonctions d'intégration et de recherche vectorielles ou prévoient de les ajouter bientôt. « L'ajout de l'intégration et de la recherche vectorielles n'est pas favorable au développement d'un marché des bases de données vectorielles émergentes », a encore déclaré M. Henschen.
Selon les experts, les bases de données vectorielles et la recherche vectorielle sont deux technologies utilisées par les développeurs pour convertir des informations non structurées en vecteurs, aujourd'hui plus communément appelés « embeddings ». À leur tour, ces embeddings rendent le stockage, la recherche et la comparaison des informations plus faciles, plus rapides et nettement plus évolutifs pour les grands ensembles de données. L'avantage de la recherche vectorielle en termes de mise à l’échelle lui a aussi permis de gagner la faveur des développeurs qui créent des applications basées sur l'IA générative. En effet, plus il y a de données qui peuvent être transmises à un grand modèle de langage (LLM), plus le modèle peut générer des réponses précises, ce qui rend l'application de la couche supérieure plus efficace. Cependant, Doug Henschen de Constellation Research n’est pas convaincu que les entreprises accepteraient de payer pour un service de base de données supplémentaire destiné uniquement au développement d'applications basées sur l'IA, même si les bases de données vectorielles, comme celle de Pinecone, sont dotées de fonctions et de fonctionnalités pour les développeurs et les scientifiques des données travaillant sur l'IA.
La stagnation des budgets IT, autre facteur défavorable
De plus, le lancement de Pinecone Serverless intervient à un moment où les budgets IT des entreprises continuent de stagner. « Même si l'IA générative suscite beaucoup d'intérêt, les budgets n'augmentent pas encore en conséquence », a déclaré Tony Baer, analyste principal chez dbInsight. « La stagnation des budgets peut être attribuée à l'immaturité du domaine : tout, des outils aux modèles de fondation en passant par les services d'exécution, n'en est qu'à ses balbutiements, et, à part les copilotes et les requêtes en langage naturel, les entreprises cherchent encore à identifier les cas d’usage gagnants », a ajouté M. Baer. Tout en alimentant la demande d'IA générative, Pinecone s'attend à ce que la nouvelle base de données serverless aide les entreprises à réduire les coûts et les incontournables tâches de gestion l'infrastructure. « La réduction des coûts est rendue possible par la séparation des tâches de lecture, d’écriture et de stockage », a déclaré Pinecone, ajoutant que la base de données vise à réduire la latence en adoptant une architecture dans laquelle le clustering vectoriel s'appuie sur le stockage « blob » (Binary Large Object).
Selon le fournisseur, grâce à ses algorithmes d'indexation et d'extraction, la base de données peut effectuer une recherche vectorielle rapide et efficace en termes de mémoire à partir d'un stockage en mode blob sans sacrifier la qualité de l'extraction. Selon M. Baer, « la nouvelle indexation vectorielle confère à Pinecone un avantage sur les autres bases de données vectorielles et opérationnelles ». Selon l'analyste, Pinecone prend en charge près d'une douzaine de types d'index. L'attribut serverless de la base de données représente aussi un avantage. « Du fait de leur nature RAG (Retrieval Augmented Generation), les charges de travail auront les caractéristiques de n'importe quelle charge de travail axée sur les requêtes (en termes analytiques), qui sont sujettes aux pics. Sans serverless, les clients doivent fournir une capacité Just-in-Case « au cas où » qui risque souvent de rester muette », a expliqué M. Baer. Le choix du serverless par Pinecone a aussi une autre raison : rendre les choses un peu plus simples pour les développeurs, car ils n’auront plus besoin de provisionner les serveurs.
Commentaire