Sapphire : Hasso Plattner prône le stockage vertical et en mémoire
L'information au bout des doigts. SAP, comme les autres, l'avait promis. Au final, les doigts doivent patienter des minutes voire des heures pour obtenir l'information. Hasso Plattner, cofondateur de SAP et président du conseil d'administration, l'a reconnu lors de son intervention à la conférence Sapphire de l'éditeur allemand à Orlando, le 13 mai dernier. Mais il a fait une promesse : si les bonnes technologies sont adoptées d'ici 18 à 24 mois, le patron d'une entreprise de la taille de SAP devrait pouvoir accéder à n'importe quelle donnée du progiciel en moins d'une seconde.
Trois piliers technologiques sont nécessaires pour parvenir à ce résultat, selon Hasso Plattner : le multicoeur (et des applications parallélisées), des bases de données en mémoire et du stockage en colonne. Le docteur Plattner a fait précéder son intervention d'une série d'affirmations interpellant l'auditoire (voir en encadré ci-dessous). Son but était de pointer le fait que la puissance de calcul continue d'augmenter, mais que cette puissance est gâchée, du fait de solutions de stockage totalement inadaptées.
Le stockage en colonnes, ignoré par tous - « y compris par SAP »
Comme Hasso Plattner ne peut guère intervenir sur les supports de stockage, il a fait part d'une expérience menée avec des étudiants d'une faculté scientifique allemande sur la façon de ranger les données en base et d'y accéder. Hasso Plattner a ainsi découvert une technologie « qui existe depuis 15 ans, mais que les éditeurs comme SAP ont ignorée jusque là », le stockage en colonne (ou stockage vertical). Cette technique, mise en oeuvre par quelques bases spécialisées comme Sybase IQ ou Vertica, consiste à accéder aux données par colonnes et non par lignes.
Selon les experts du domaine, cette méthode accélère grandement les accès lorsqu'il s'agit de lire les données. C'est pourquoi Sybase l'a implémentée, par exemple, dans sa base destinée aux solutions décisionnelles, ou pourquoi Google s'en est inspiré pour concevoir sa base BigTable qui stocke les éléments de ses pages Web.
Vu le taux de compression du stockage vertical, tout peut tenir en mémoire
[[page]]
En outre, a indiqué Hasso Plattner, le stockage vertical affiche « des taux de compression 10 fois supérieurs à ceux du stockage traditionnel ». Sachant qu'une carte-mère actuelle peut accueillir jusqu'à 144 Go de RAM, « et que cela devrait monter à un demi-téraoctet dans 18 mois », cela ouvre des perspectives intéressantes pour monter toute une base de données en mémoire vive. En revanche, le stockage vertical donne des résultats bien moins bons lorsqu'il s'agit de mettre les données à jour, c'est pourquoi - malgré les rodomontades du fondateur de Vertica, Michael Stonebraker - il n'est pas utilisé pour les applications transactionnelles. Dès lors, les données de production doivent passer par le filtre de l'ETL pour alimenter un entrepôt de données qui servira de support à des applications analytiques ; autant dire, a expliqué Hasso Plattner, que l'information date un peu quand on la présente sous une forme lisible au dirigeant de l'entreprise.
Un accès dans la seconde à toute donnée dans 250 millions d'enregistrements
Avec son équipe universitaire, Hasso Plattner a décidé de passer outre les traditionnelles objections. « Nous avons étudié les solutions dont on disait qu'elles ne marcheraient jamais. » Au final, ils ont abouti à un prototype dont la démonstration sur scène était plutôt bluffante : une interface Excel 2007 couplée au système de recherches de données T-REX, de SAP, et à une variante - développée pour l'occasion - du langage de requête SQL, permettait d'accéder dans la seconde à des données de production (une base empruntée à un gros client, totalisant 250 millions d'enregistrements). Pour parvenir à ce résultat, Hasso Plattner est parti du principe que les bases transactionnelles avaient rarement besoin de mettre des données à jour : « dans 15% des cas pour les applications de prise de commande, dans 5 à 10% des cas pour les applications financières ». Du coup, la chose peut être réglée grâce à des insertions, ce qui permet de ne jamais verrouiller la base.
Parmi les autres avantages, le stockage vertical élimine la nécessité de réaliser des agrégats (sous-ensembles présélectionnés de la base), et élimine aussi la redondance des informations : reprenant des champs couramment dupliqués, Hasso Plattner a expliqué qu'il y a un nombre limité de pays, de devises... ou de sexes. Au final, la base s'en trouve réduite d'un facteur 20.
Arguant bien du fait qu'il n'est pas un dirigeant exécutif de SAP, Hasso Plattner s'est refusé à prendre tout engagement sur la transformation de ce prototype en produit. Il espère bien néanmoins pouvoir revenir sur scène dans un an avec un projet mené cette fois par la R&D de SAP.