Copilot Studio était encore il y a peu un moyen d'étendre les capacités de Power Virtual Agents, le service cloud de création de chatbots en low/no code de Microsoft, en y ajoutant de la GenAI et le support d'interactions conversationnelles plus générales. Mais utilisant les outils Azure OpenAI pour travailler avec des sources de données supplémentaires, Copilot Studio a fini par devenir un outil beaucoup plus flexible avec des capacités de compréhension du langage améliorées.
Lors de la Build 2024, Microsoft a tracé une nouvelle voie pour les capacités d'IA de Power Platform, en les alignant sur les outils de développement low/no code de la plateforme et en ajoutant la prise en charge des flux et des connecteurs Power Automate. Il s'agit d'un changement important de Power Platform, mais qui tire parti de l'adoption par Microsoft de la GenAI en tant qu'outil de construction et d'exécution d'agents autonomes. La dernière bêta de Copilot Studio équivaut donc à une refonte complète de la stratégie de Power Platform en matière d'IA, évoluant au-delà des chatbots vers des workloads orchestrés par l'IA. Bien que les chatbots soient toujours pris en charge, il y a maintenant beaucoup plus à construire dans le canevas de développement no code de Copilot Studio, basé sur le web.
Des processus automatisés augmentés aux bots
Au cœur du nouveau Copilot Studio se trouve une meilleure compréhension de la manière dont les modèles tels que GPT 4.0 peuvent fonctionner avec des descriptions d'interface structurées, comme celles utilisées par OpenAPI pour générer dynamiquement des requêtes et analyser et formater des réponses en utilisant le langage naturel. Ici, au lieu d'utiliser OpenAPI, l'IA générative est utilisée pour orchestrer les connecteurs Power Platform existants et nouveaux, ce qui vous permet de converser avec votre agent et de voir ses réponses dans n'importe quel client de chat pris en charge. Il y a beaucoup de choses à apprécier dans cette approche. Travailler avec de longues transactions a toujours été un problème, et les outils de mémoire sémantique au cœur des flux de travail pilotés par l'IA sont une solution prometteuse, en particulier lorsqu'ils sont utilisés pour maintenir l'humain dans la boucle.
L'aspect le plus important de cette refonte est la possibilité prévue d'utiliser un déclencheur pour exécuter un flux qui englobe une série de tâches différentes pilotées par l'IA. Au lieu d'être des outils de chat ponctuels, ils sont désormais un moyen de gérer des transactions à long terme, en modifiant les étapes sur la base des derniers résultats. Le fonctionnement est simple : si l'on déclenche par exemple une série d'actions en fonction d'un courrier électronique entrant, on pourra alors utiliser Copilot Studio pour élaborer workload lancé par un événement dans Microsoft Graph. Il peut s'agir d'extraire les détails de l'expéditeur de Dynamics 365, de générer automatiquement une réponse sur la base du courrier entrant et de l'historique des interactions CRM de l'expéditeur, et d'envoyer un message à Teams, détaillant les actions effectuées et énumérant les suivis possibles nécessitant une intervention humaine. Il s'agit d'un ensemble d'actions très différentes de celles gérées par la première génération de l'assistant IA de la Power Platform. Il s'agit désormais d'un moyen de travailler avec ces workloads long terme spécifiques qui nécessitent la gestion d'informations entre les opérations ainsi qu'un mélange d'actions automatisées et manuelles. En utilisant un agent pour gérer cela, il est possible non seulement envoyer des réponses en langage naturel basées sur les données de l'application, mais aussi d'acheminer les notifications et les interactions vers la bonne personne.
La construction d'agents dans Copilot Studio
Cela nécessite une intégration avec les différents cloud de Microsoft, en particulier Graph et le Dataverse de Power Platform. Par conséquent, la dernière génération de Copilot Studio s'appuie sur la métaphore de conception de flux de Power Automate. Au lieu de construire des applications de chat (ou plutôt de construire des applications de chat), il est possible d'utiliser l'IA pour gérer et contrôler les flux de travail. En fait, on pourra utiliser Copilot Studio avec les flux Power Automate existants, afin d'intégrer l'IA dans les processus métier existants. Les flux sont traités comme l'une des actions disponibles : conversationnelles, connecteurs, flux et invites. Ces actions sont l'une des nouvelles fonctionnalités les plus intéressantes, fonctionnant comme les plugins ChatGPT ou les compétences dans Semantic Kernel. Elles se comportent comme un sujet de Copilot Studio, mais au lieu de se connecter au contenu, elles permettent à votre agent Copilot Studio d'accéder aux API et aux données externes. Vous pouvez même les connecter à un code personnalisé et à une logique d'entreprise, mélangeant ainsi les techniques traditionnelles de développement de logiciels d'entreprise avec l'IA no-code.
Des connecteurs reliés aux données réelles
L'une des nouveautés les plus importantes est le connecteur Copilot. À l'instar des connecteurs utilisés dans Power Apps et Power Automate, ces connecteurs relient votre application à des données et des API externes. Les outils de ce type sont d'autant plus importants dans une application basée sur l'IA, en particulier une application utilisant la GenAI, car ils fournissent la base nécessaire pour réduire le risque de résultats incontrôlables. Copilot Studio peut utiliser les connecteurs Power Platform existants et étendre ce que Microsoft appelle ses "connaissances". Il s'agit d'un ensemble de sources d'information comprenant les outils de chatbot existants et les sources d'information Microsoft telles que Dataverse et Fabric, ainsi que l'utilisation de Dataverse comme moyen de préparer les données provenant d'autres sources d'entreprise pour les utiliser dans les sorties RAG (retrieval augmented generation). Il y a cependant des limites, avec seulement deux sources Dataverse par application (et seulement quinze tables dans chaque source). Les données personnalisées provenant d'applications métier sont importées sous forme de JSON, prêtes à l'emploi.
Cela peut sembler peu, mais on n'utilise pas Copilot Studio pour créer et exécuter des applications autonomes à grande échelle ; celles-ci nécessitent vraiment de travailler avec des frameworks tels que Prompt Flow d'Azure AI Studio. L'ajout d'un connecteur à un agent dans Copilot Studio est assez simple. Il faut commencer par ajouter des connaissances à son application, en ajoutant une connexion d'entreprise. Ces connexions héritent des autorisations de l'utilisateur, ce qui garantit que les utilisateurs obtiennent des résultats sans enfreindre les limites de sécurité. Cette approche est essentielle pour créer des applications d'IA pour des secteurs réglementés.
Des workflow alimentés par l'IA avec des actions conversationnelles
La situation devient plus intéressante lorsque l'on commence à utiliser des actions conversationnelles dans les applications. C'est là que l'agent sous-jacent commence à afficher des comportements autonomes, en analysant la demande de l'utilisateur et en l'utilisant pour construire une orchestration à travers un ensemble connu d'actions, de connexions et de composants, avant d'utiliser la GenAI pour assembler une réponse en langage naturel. Ici, la demande de l'utilisateur est une invite d'orchestration utilisée pour démarrer l'interaction. Dans une version ultérieure, le système sous-jacent utilisera sa connaissance des API qu'il utilise pour demander des informations supplémentaires, si nécessaire. Pour l'instant, cependant, l'utilisateur est limité à un moyen utile, bien que basique, d'ajouter une extension en langage naturel à une application d'IA existante que vous avez déjà construite et testée dans Copilot Studio. Il suffit donc de modifier son application, d'ajouter une extension ou une action et de choisir une action conversationnelle. On devra ensuite définir quelques configurations de base avant d'éditer l'action. Un déclencheur est une invite qui définit l'action, décrivant ce à quoi elle sert. Il sert à déterminer quand et comment l'action est invoquée. Une fois le déclencheur en place, vous pouvez construire l'action. Il s'agit d'un flux de processus qui n'a pas d'interface utilisateur. L'outil d'édition de Microsoft n'affiche aucun composant d'interaction avec l'utilisateur, ce qui garantit que le processus s'exécute à l'intérieur de son Copilot et n'interrompt pas son flux. Une fois publiée, on peut ajouter l'action au catalogue Microsoft 365 Copilot, où elle est traitée comme un plug-in et activée dans le cadre d'une conversation de l'utilisateur avec Copilot.
Le coût de la version améliorée de Copilot Studio est étonnamment bas. Comme il s'agit d'un service d'arrière-plan, il n'y a pas de licence par utilisateur, mais une tarification par message, avec 25 000 messages pour 200 $ par mois. Un message est une demande qui déclenche une réponse, un message qui nécessite des opérations d'IA générative comptant pour deux messages standard. Pour l'instant, on ne sait pas exactement comment acheter de la capacité supplémentaire. Il existe une autre option à 30 $ par utilisateur pour une utilisation avec Microsoft 365 uniquement. La version initiale de Copilot Studio constitue un moyen simple de concevoir des chatbots, en infusant des technologies existantes avec de l'IA générative. Cette nouvelle mise à jour, actuellement en bêta, va beaucoup plus loin, reliant les outils d'IA modernes à l'automatisation des processus, avec la promesse d'un développement no-code d'agents autonomes. L'association de techniques familières et d'une orchestration alimentée par l'IA permet à la génération actuelle d'outils d'IA de faire ce qu'elle fait le mieux : travailler avec des API bien définies et riches en sémantique, et fournir des résultats dans un format facile à comprendre pour un humain.