Les ingénieurs de Facebook ont de multiples défis à relever pour faire évoluer Graph Search, le moteur de recherche du réseau social. La principale contrainte est le très grand volume de données à parcourir. Si l'on prend l'exemple d'une recherche de restaurants japonais à New York appréciés par des personnes provenant du Japon, elle devrait générer des centaines, voire des milliers de résultats et finalement elle n'en sort que deux. Le moteur de recherche, en version beta actuellement, n'a tout simplement pas la puissance de traitement pour passer au crible les millions de connexions des personnes japonaises pour effectuer la recherche, souligne des ingénieurs du réseau social, lors d'un point presse à Menlo Park en Californie.

« Nous avons encore beaucoup de travail à faire » a déclaré Michael Curtiss, ingénieur qui a travaillé sur le moteur de recherche Unicorn, plateforme de Graph Search. « Une requête de ce type est très difficile en matière de ressource informatique et commence par recenser les 100 millions d'abonnés au Japon et trie ensuite en une fraction de seconde toutes les pages aimées par les personnes au Japon », ajoute le scientifique. Il reste pragmatique, « c'est pratiquement insoluble dans ce laps de temps. Le risque est de ne pas donner les bons résultats ».

Optimisation des requêtes et efforts sur le matériel


Facebook a choisi différentes approches pour répondre à ce problème et à d'autres concernant le big data et Graph Search. Une de ces voies concerne un concept des bases de données connu sous le nom «optimisation des requêtes », afin d'améliorer la rapidité et l'efficacité de certains types de recherche. Dans le cas du restaurant japonais, cette méthode pourrait s'appliquer en commençant par tracer les avis sur les restaurants, puis affiner sur les goûts des gens plutôt que de commencer par le Japon.

Le réseau social relève les défis au niveau du matériel, par l'ajout de mémoire flash supplémentaire, mais aussi d'autres fonctionnalités serveurs utilisées dans les datacenters pour amortir l'augmentation du trafic engendré par Graph Search. « Nous avons besoin de travailler au sein du datacenter, d'acheter de nouvelles plateformes matérielles, avec de nouveaux types de serveurs pour répondre aux besoins de calcul d'Unicorn »,  explique Soren Lassen, directeur de l'équipe infrastructure de Graph Search.

Facebook a commencé à déployer le moteur de recherche le mois dernier sur un nombre limité d'utilisateur aux Etats-Unis. Il est conçu pour permettre aux gens de passer au peigne fin les mille milliards de connexions entre les abonnés  pour rechercher des personnes, des lieux, des photos et des centres d'intérêt, le tout dans un langage clair. Rien n'interdit selon les ingénieurs, des requêtes très longues comme « les amis de mes amis qui vivent à New York et qui aime Downton Abbey », car Graph Search utilise des indices comme « aime » et la localisation pour classer plus facilement les résultats. Les responsables ont indiqué que le moteur de recherche intégrera d'autres paramètres comme les commentaires des utilisateurs, la mise à jour des statuts pour compiler et classer les résultats. Ils concluent en précisant que cette intégration n'est pas une priorité.