Pour les chercheurs en intelligence artificielle, reconnaître les mots au moment où ils sont prononcés par un locuteur ou saisis au clavier par un utilisateur représente l’un des plus importants défis techniques, pointent dans un blog de Facebook quatre membres de son équipe FAIR (Facebook Artificial Intelligence Research). Avec l’augmentation régulière des données en ligne se fait aussi plus pressant le besoin en outils flexibles pour mieux comprendre le contenu de jeux de données de plus en plus grands, afin d’obtenir les classifications les plus pertinentes, soulignent les chercheurs.
C’est pour cette raison que le laboratoire FAIR vient de mettre en open source sa bibliothèque fastText. Disponible sur le référentiel GitHub, celle-ci permet de bâtir des solutions évolutives de représentation et de classification de textes. Parallèlement, l’équipe a également publié ses travaux de recherche. Deux documents sont disponibles : « Enriching word vectors with subword information » et « Bag of tricks for efficient text classification ».