Les Big Data, avalanche de données générée par les réseaux sociaux, les capteurs mobiles, compteurs électriques et autres dispositifs ne peuvent généralement pas être traitées en l'état par les solutions de BI. Trop d'informations déversées sans discernement, mais qui peuvent receler des « pépites », expliquait Andy Mendelsohn, senior vice-président, responsable des technologies serveur d'Oracle, en introduction de son keynote au deuxième jour d'OpenWorld. Oracle n'avait jusque-là pas présenté d'offres spécifiques pour les prendre en compte. C'est chose faite sur OpenWorld 2011. Avec la « Big Data Appliance », le fournisseur combine une plateforme matérielle et un ensemble de logiciels pour acquérir les données, les organiser et les charger dans Oracle Database 11g, afin de les analyser.
Un châssis de 18 serveurs Sun X4270 M2
Cette fois, la solution ne repose pas exclusivement sur des logiciels Oracle puisqu'elle recourt, d'une part, au framework Hadoop adapté au traitement intensif de données, d'autre part au langage Open Source R, conçu pour l'analyse statistique. Oracle les associe à sa nouvelle base de données NoSQL pour gérer et subdiviser les gros volumes aux formats changeants. Une base qu'il complète de son ETL, Data Integrator for Hadoop, et de l'outil Loader for Hadoop qui permet d'utiliser MapReduce pour créer des jeux de données à charger dans la base 11g.
La partie matérielle fonctionne sous Oracle Linux et héberge une machine virtuelle Java Hotspot. Son châssis, similaire à celui de l'Exadata, loge 18 serveurs Sun X4270 M2, propose 12 coeurs Intel par noeud (216 au total), 48 Go de mémoire par noeud (soit au total 864 Go) et 24 To de stockage par noeuds (432 To). Elle s'utilise en association avec la machine Exadata et la prochaine Exalytics. L'ensemble peut gérer les donnés structurées et non structurées dans des bases SQL ou non SQL.
Surveiller les patients à distance
Pour justifier l'arrivée d'Oracle sur ce terrain où plusieurs concurrents ou partenaires ont poussé leurs pions (EMC/Greenplum, notamment, ou IBM/Netezza), Andy Mendelsohn a éclairé les champs d'applications possibles. La santé, en premier lieu : au moyen de capteurs, la surveillance à distance des patients permet de remonter des données brutes en continu, de les analyser pour déceler l'anomalie et intervenir en cas d'urgence. Les services basés sur la localisation en temps réel des personnes pour des services de recherche, ou des invites promotionnelles. Ou encore le marketing pour segmenter l'analyse des ressentis sur les réseaux sociaux.
Entre lundi et mardi, plusieurs sessions plus détaillées ont abordé l'analyse statistique avancée avec le langage R, la gestion des Big Data reposant sur Hadoop et Exadata, ou encore l'utilisation d'Hadoop avec Oracle Database 11g.
Illustration : Andy Mendelsohn, senior vice-président, responsable des technologies serveur d'Oracle, sur OpenWorld 2011 (crédit : MG).
Ci-dessus : L'utilisation de l'appliance Big Data se combine avec celle des machines Exadata et Exalytics (source : Oracle)
OpenWorld 2011 : Oracle bâtit une solution pour traiter les Big Data
Une appliance de plus s'ajoute au catalogue Oracle. Cette fois, il s'agit de prendre à bras le corps le phénomène Big Data. Pour le faire, Oracle ne rechigne pas à recourir lui aussi  au framework Open Source Hadoop MapReduce dans un assemblage de logiciels qui comprend aussi le langage d'analyse statistique R, avec, qui l'aurait cru, une base NoSQL maison.