Avec son outil logiciel Big Data SQL, dont la sortie est prévue d'ici l'automne, Oracle espère attirer l'attention sur un marché de l'analyse des données très encombré. Cette solution est capable de générer une requête SQL unique exécutable aussi bien par la propre base de données d'Oracle que par les magasins de données Hadoop et NoSQL. « Il peut remplacer la Big Data Appliance d'Oracle, qui intègre la distribution Hadoop de Cloudera », a déclaré Neil Mendelson, vice-président d'Oracle, Big Data & Advanced Analytics. « Actuellement, les entreprises mènent de nombreux tests autour du big data au sens large, mais certains facteurs bloquent le passage en production de ces projets. En particulier, le manque d'intégration entre Hadoop et d'autres systèmes, la difficulté à trouver les bonnes compétences, plus des préoccupations en matière de sécurité », a ajouté le VP d'Oracle. « Big Data SQL va mettre à profit les compétences que possède tout administrateur de base de données Oracle. En effet, Big Data SQL permet d'utiliser au maximum le dialecte SQL ».
Cependant, il faudra aussi aller piocher un grand nombre d'éléments dans la pile technologique d'Oracle. En effet, pour profiter au mieux de Big Data SQL, il faut que l'utilisateur installe et fasse tourner une base de données Oracle sur une machine Exadata de l'éditeur. « Dans ce cas, la machine Exadata et Big Data Appliance peuvent partager une interconnexion pour l'échange de données », a expliqué Neil Mendelson. En outre, Big Data SQL est uniquement compatible avec la version 12c de la base de données d'Oracle, disponible depuis l'année dernière. Or, la plupart des clients actuels de la base de données d'Oracle utilisent toujours les versions 11g et antérieures. Cet investissement dans Big Data SQL présente néanmoins certains avantages. « Les clients pourront notamment utiliser les fonctions de sécurité avancées de la base de données Oracle dans les magasins Hadoop et NoSQL », a expliqué le VP d'Oracle. « Les règles de sécurité définies pour les données dans la version 12c sont simplement « poussées » dans ces autres environnements », a-t-il ajouté.
Limiter le déplacement des données
Toujours selon Neil Mendelson, Oracle a prévu de rendre son outil Big Data SQL compatible avec d'autres systèmes maison. Le logiciel sera disponible partout dans les prochains mois. Son prix sera annoncé au moment de la sortie. « Big Data SQL n'a pas pour ambition de remplacer les moteurs SQL déjà existants pour Hadoop, comme Hive et Impala, lesquels seront toujours livrés avec la Big Data Appliance d'Oracle », a précisé le VP d'Oracle. « Nous voulons vraiment résoudre un problème plus large. L'un des grands défis auxquels sont confrontés les scientifiques dans le domaine des données se situe essentiellement au niveau du déplacement des données entre les systèmes », a-t-il dit. Selon lui, Big Data SQL permet d'envoyer des requêtes vers différents types de magasins en limitant au minimum le déplacement des données et en utilisant des requêtes plus efficaces grâce à la technologie Smart Scan de la pile logicielle Exadata.
Au premier abord, Big Data SQL pourrait apparaître comme un autre moyen de faire de la mutualisation de requêtes, une solution connue et utilisée ici et là depuis un certain temps. Selon Curt Monash, analyste de Monash Research, « l'outil a aussi ses inconvénients ». En particulier, « fédérer une requête à travers différents systèmes a toujours un coût réseau », a-t-il ainsi déclaré. « Souvent, il faut aussi que la requête soit planifiée par un optimiseur qui ne pondère pas forcément de façon optimale toutes les parties de la requête », a ajouté l'analyste. « Si le gain en performance pour le déplacement des données est assez important pour compenser ces inconvénients, il serait encore mieux de déplacer les données avant de lancer la requête, comme c'est le cas habituellement », préconise-t-il encore.
Un filtrage local
Mais Big Data SQL « utilise la consolidation des données en donnant la priorité à une pile principale », a déclaré Curt Monash. « Un prédicat fait, dans ce cas-là, partie de l'instruction SQL. Au lieu de tout faire dans le lieu de traitement principal - en l'occurrence, un cluster pourrait le faire lui-même - vous faites descendre certains prédicats au niveau où sont stockées les données. C'est tout l'intérêt d'Exadata », a ajouté l'analyste. « Une grande partie du filtrage est effectué localement, de sorte que l'impact sur le réseau n'est pas aussi négligeable qu'il pourrait être autrement. Ce facteur atténue les objections sur la fédération de données. C'est une bonne idée, tout comme Exadata est une bonne idée. Mais il serait exagéré de dire que Big Data SQL apporte quelque chose de nouveau », a tempéré l'analyste. « Toutes ces solutions sont déjà connues, mais Oracle les met en oeuvre dans son environnement fermé particulier ».
Oracle veut faire de SQL l'espéranto du big data
4
Réactions
Avec Big Data SQL, Oracle veut mettre à profit les compétences que possède tout administrateur de base de données Oracle.
Newsletter LMI
Recevez notre newsletter comme plus de 50000 abonnés
Ou comment essayer de continuer a vendre des licences très onéreuses face à une vague essentiellement open source qui vous submerge...
Signaler un abusPour faire du big data utiliser Oracle SGBD 12c, c'est comme vouloir déménager un appartement de 200m² avec une twingo... le in memory ? un coffre de toit plaqué or sur la twingo... guère plus.
Quant au besoin du SQL et sa lourdeur....
Bref Oracle SGBD reste un produit généraliste de la dernière décennie : monolitique, non scalable a l’échelle des besoins du cloud et économiquement et techniquement non pertinent pour le big data.
Bref si les solution big data sont nées c'est bien parce que les acteur traditionnels étaient hors jeu.
CE qui fait la force du "big Data" et des modèles de données qui lui sont liés est le soulagement qu'éprouvent les développeurs à s'être enfin débarassés de SQL. Je ne suis pas certain du succès du machin sur ce point.
Signaler un abusPar contre, et c'est là que votre article pêche. La force du nouvel outil Oracle est le passage en mode "Big Data" et donc l'amélioration des performances applicatives sans aucun nouveau développement. Là par contre les DSI vont s'y retrouver.
Un article un petit peu à coté donc (selon moi)
CE qui fait la force du "big Data" et des modèles de données qui lui sont liés est le soulagement qu'éprouvent les développeurs à s'être enfin débarassés de SQL. Je ne suis pas certain du succès du machin sur ce point.
Signaler un abusPar contre, et c'est là que votre article pêche. La force du nouvel outil Oracle est le passage en mode "Big Data" et donc l'amélioration des performances applicatives sans aucun nouveau développement. Là par contre les DSI vont s'y retrouver.
Un article un petit peu à coté donc (selon moi)
Il faudrait mettre en perspective Big Data SQL avec les autres nouvelles fonctionnalités de la base 12c :
Signaler un abus- l'In-Memory pour faire de l'analytique extremement rapidement sur les données transactionelles (les plus fraîches) sans déplacer les données dans un data warehouse (on reste dans la même base)
- le Multitenant pour réduire les resources nécessaires aux bases, consolider et provisionner très rapidement des bases avec des données (DBaaS, DataMart-as-a-Service...) et en économisant le stockage (snap clone/copy on write).
On tient la un modèle qui permet de faire des jointures entre des données stockées dans Hadoop, NoSQL, des bases relationelles de type OLTP ou DWH et ce en SQL (un langage qui fête ses 40 ans cette année).
De plus, l'aspect performance est adressé via un réseau très rapide (infiniband), des optimisations des appels (direct-to-wire), et des fonctionnalités qui ont fait leurs preuves (Smart Scan, Smart Index, functions offload...) et toute cela unifié par l'optimiseur de la base Oracle (qui hérite de 35 ans de savoir faire).
Enfin, nul doute que d'autres fonctionnalités comme le Flex Cluster ou le Global Data Services... viendront renforcer ce Big Data Management System.