Dès 2017, certains se plaignaient que la fonction dictée sous Windows était épouvantable, en particulier parce qu'elle fonctionnait en local et que les utilisateurs devaient entraîner individuellement. Aujourd’hui, Microsoft annonce qu’à partir de 2020, les utilisateurs de Word pourront accéder à son service de dictée dans le cloud, nettement supérieur à ce que peut faire son traitement de texte en local. Au passage, le fournisseur ajoute aussi à son logiciel de bureautique l’accès à la fonction de transcription.

Ouvrez Word, cliquez sur le bouton du micro en haut à droite, et vous en ferez vous-même l’expérience : à moins d’avoir spécifiquement formé le modèle et à moins de parler très distinctement, Windows arrive à reconnaître la plupart des mots. Mais, « la plupart », ce n'est pas suffisant, car l’utilisateur doit souvent faire des corrections, éditer et interrompre son flux de travail.

Par contre, si vous avez déjà utilisé Cortana - ou un autre service dans le cloud, comme Google Assistant ou Amazon Alexa - la précision de la reconnaissance est de bien meilleure qualité. Chaque fois que Microsoft présente ses services de retranscription dans le cloud, comme c’était le cas lors de la dernière conférence Build, tout fonctionne merveilleusement bien. C'est ce niveau de précision avancé que Microsoft offrira à Word pour le web, à partir de 2020.

Des fonctions payantes

L’éditeur précise qu’il utilisera OneDrive et Azure Speech Services pour stocker en toute sécurité les fichiers audio des utilisateurs, ce qui implique que le service sera lié à Office 365 ou à la version entreprise, Microsoft 365. Apparemment, ce service ne sera pas non plus gratuit : « La transcription audio sera disponible début 2020 dans Word pour le web, avec intégration dans la version desktop de Word, et les applications mobiles suivront au printemps. Les abonnements et les tarifs exacts seront annoncés avant la disponibilité générale », a déclaré Microsoft.

L’utilisateur pourra télécharger les enregistrements audio et Word les transcrira en les séparant par intervenant. Dans un billet de blog, Microsoft a expliqué que cette transcription apparaîtra dans une barre latérale de Word sous forme d’extraits ou en totalité dans la fenêtre principale de Word pour être éditée. Il est intéressant de noter que le GIF de démonstration mis en ligne par Microsoft montre que la transcription est instantanée, alors que d'autres services de transcription dans le cloud ont besoin d’un peu de temps pour effectuer le traitement. Il semble également que la transcription sera synchronisée avec l'enregistrement, comme le fait OneNote, une autre application de Microsoft.

Microsoft un concurrent sérieux en 2020

Si la précision de la transcription, la rapidité du traitement et le prix du service de transcription de Word se confirment, Otter.ai, probablement le meilleur service de transcription sur Internet actuellement disponible, a du souci à se faire. Ce service offre 600 minutes de transcription gratuite par mois, mais le traitement prend un certain temps, et la précision et la répartition des interventions entre les orateurs ne sont pas toujours parfaites. Otter a cependant jusqu'en 2020 pour perfectionner son service et revoir, si nécessaire, ses options tarifaires. Certes, Microsoft arrive un peu tard sur la dictée et la transcription le cloud, mais la commodité, l'immédiateté et le poids d'Office en entreprise en feront un concurrent redoutable.