Google bloque des contenus Drive en violation avec son service

Plusieurs rédactions dans le monde, y compris en France, ont eu la désagréable surprise de ne plus accéder à leurs contenus sous Google Drive. Les contenus, inaccessibles plusieurs heures durant, ont été mystérieusement jugés indésirables par le géant américain.

Plusieurs médias dans le monde, dont en France les rédactions de BFM, RTL ou encore du groupe Mondadori, n'ont pas pu pendant plusieurs heures ouvrir leurs fichiers hébergés dans le cloud de Google. L'impossibilité de pouvoir accéder à ces contenus, essentiellement des documents textes, a été justifiée par un message les considérant comme « inappropriés » et « en violation des termes du service du géant du cloud. » Un tel blocage peut être effectué lorsque des contenus abusifs ou malveillants (incitation à la haine raciale, pornographie...) sont détectés par Google, ce qui remet sur le devant de la scène la question de la violation des données personnelles et de la possibilité pour la firme de Mountain View de « lire » le contenu des fichiers de ses utilisateurs.

Depuis juin dernier, Google a officiellement arrêté, pour la version grand public et donc gratuite de son service, d'accéder aux contenus des fichiers de ses clients en automatisant sa technique. Mais cela ne suffit apparemment pas pour calmer les ardeurs des défenseurs de la vie privée. « Nous devrions tous être parfaitement conscients que tout le contenu que nous créons, manipulons ou modifions à l'intérieur de ces services de cloud est évalué et nettoyé, non pas par des gens, mais des machines», a indiqué au New York Times Dana Gardner, présidente et analyste en chef chez Interarbor Solutions. « Et ni les machines, ni leurs programmeurs ne sont infaillibles. » Plus taquin, l'Electronic Frontier Foundation n'a pu s'empêcher de tweeter que « Google a accidentellement rappelé au monde que votre contenu dans le cloud est en fait sur un serveur scanné par des algorithmes. » Et d'ajouter : « Le souci rencontré par Google Docs est le résultat inévitable du recours à des filtres automatisés pour déterminer si le contenu est abusif. »

Pas d'analyse de contexte à ce jour

Amené à s'expliquer sur ce qui s'est passé, un porte-parole de Google a confirmé au Washington Post qu'un système automatisé permettant d'identifier les contenus abusifs était bien utilisé. « Bien qu'il puisse identifier des groupes de données qui pourraient suggérer une violation, le système ne prend pas en compte le sens du contenu », a indiqué ce porte-parole. On est donc loin d'une simple erreur de paramétrage, et cela pose la question de fond qui est de savoir jusqu'à quel point l'utilisateur est prêt à laisser un système informatisé aussi puissant et sécurisé qu'il soit, mettre le nez dans ses affaires personnelles.