Présente dans 130 pays avec 24 bureaux dans le monde dont le siège à Paris et le centre de Palo-Alto, Criteo n'est plus vraiment une start-up. Spécialisée dans le marketing à la performance avec plus de 8500 annonceurs dans sa clientèle, toute son activité repose sur l'analyse d'innombrables données pour permettre de cibler au mieux les publicités en fonction du comportement antérieur de chaque internaute, cela en temps réel puisque l'affichage de la publicité ne doit pas ralentir celle de la page consultée. Le big data est une réalité pour l'entreprise depuis des années mais le cluster Hadoop ne la satisfaisait plus totalement.
« Nous avions besoin d'une meilleure solution d'analyse pour traiter une grande quantité de données » explique Romain Niccoli, co-fondateur et CTO de Criteo. 20 To de données sont ainsi ajoutées à une base dont la taille s'exprime en Po (péta-octets, milliers de To). Le choix de Criteo s'est porté sur la solution HPE Vertica, une base de données verticale. Romain Niccoli justifie ce choix par le bas coût total de possession et l'évolutivité, en plus évidemment des performances techniques intrinsèques. L'outil permet d'améliorer la rapidité du ciblage publicitaire.
Le cluster Hadoop est maintenu comme moteur de calcul et HPE Vertica sert à l'analyse des données structurées et non-structurées. Les performances sont entre 50 et 1000 fois supérieures à ce qui aurait pu être obtenu avec d'autres entrepôts de données selon le fournisseur.