Annoncée le 27 novembre, la dernière version du framework d'apprentissage machine open source et multiplateformes ML.NET 3.0 de Microsoft permet d’intégrer des modèles d'apprentissage machine dans les applications et s’enrichit de capacités d'apprentissage profond pour la détection d'objets, la reconnaissance d'entités nommées et la réponse aux questions. La prise en charge de ces scénarios d'apprentissage profond a été rendue possible grâce aux intégrations et à l'interopérabilité avec les modèles TorchSharp et ONNX. La version 3.0 met également à jour l'intégration avec le framework de renforcement du gradient LightGBM et apporte aussi une meilleure prise en charge des scénarios de traitement des données grâce à des améliorations et des corrections de bogues pour DataFrame et de nouvelles fonctionnalités d'interopérabilité IDataView. Le chargement, l'inspection, la transformation et la visualisation des données sont aussi plus puissants.
En mai dernier, la firme de Redmond avait annoncé la détection d'objets dans ML.NET Model Builder. Ces capacités s'appuient sur les API de détection d'objets alimentées par TorchSharp et introduites dans ML.NET 3.0. L'API de détection d'objets exploite certaines des dernières techniques de Microsoft Research et s'appuie sur une architecture de réseau neuronal basée sur Transformer et construite avec TorchSharp. La détection d'objets est incluse dans le package Microsoft ML.TorchSharp 3.0.0. Ce framework propose également certains modes de traitement du langage naturel, notamment la réponse aux questions et la reconnaissance des entités nommées. Ces scénarios sont débloqués en s'appuyant sur les fonctions existantes de classification de texte RoBERTa de TorchSharp introduites dans ML.NET 2.0. Le dernier environnement de l'éditeur américain s’enrichit par ailleurs de capacités d'apprentissage machine (AutoML), en particulier le balayage AutoML qui prend désormais en charge la similarité des phrases, la réponse aux questions et la détection d'objets.
La gestion des valeurs nulles améliorée
Des mises à jour de DataFrame ont été effectuées dans ML.NET 3.0, y compris des scénarios de chargement de données étendus, avec des données désormais importables depuis et exportables vers des bases de données SQL. Cette opération s'effectue via ADO.NET, qui prend en charge les bases de données compatibles avec SQL. Toujours dans DataFrame, les performances arithmétiques ont été améliorées dans les scénarios de clonage de colonnes et de comparaison binaire. La gestion des valeurs nulles a été améliorée lors des opérations arithmétiques, ce qui réduit le nombre d'étapes de transformation des données. Des améliorations ont été apportées au débogueur afin d'améliorer la lisibilité des résultats pour les colonnes dont les noms atteignent une certaine longueur. Tensor Primitives comprend un nouvel ensemble d'API qui supporte les opérations sur les tenseurs. Microsoft travaille actuellement sur les futures versions .NET 9 et ML.NET 4.0. Avant cela, l'entreprise prévoit de mettre à jour Model Builder et ML.NET CLI de façon à intégrer la version ML.NET 3.0. Elle envisage aussi d'étendre les scénarios et les intégrations d'apprentissage profond et d'apporter des améliorations à DataFrame. Enfin, Microsoft a déclaré qu'elle continuerait à développer les API de System.Numerics.Tensors et à les intégrer à ML.NET.
Commentaire