Google met la main sur ReCaptcha et sa technologie de numérisation
Google a racheté la start-up ReCaptcha, jusqu'ici filiale de l'université Carnegie Mellon, pour un montant non divulgué. Ce faisant, le géant de l'Internet ne met pas seulement la main sur l'inventeur de la technologie Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart) permettant de distinguer les utilisateurs humains d'un site des robots logiciels. Il s'arroge également une technologie de reconnaissance optique de caractères (OCR) particulièrement intéressante pour son projet Google Books.
En effet, pour ses images Captcha de lettres que l'internaute doit recopier pour prouver qu'il est bien un humain et non un robot spammeur, ReCaptcha scanne des journaux et des livres anciens, car les robots ont du mal à déchiffrer des lettres mal encrées ou usées par le passage du temps. C'est donc un outil idéal pour une société qui ambitionne de numériser l'ensemble des ouvrages tombés dans le domaine public, d'autant que ReCaptcha a déjà fait ses preuves en aidant à l'indexation de l'ensemble des archives du New York Times.