BigQuery, de plus en plus attractif pour les utilisateurs Hadoop

Contenu

Cloud computing

Google annonce des améliorations dans BigQuery, l'outil de gestion du Big Data lancé par le géant de l'Internet en 2010 en tant que service capable d'analyser le big data à l'intérieur et à l'extérieur de l'écosystème de Apache Hadoop. Malgré cela, avec ces mises à jour approfondies, le service cloud renforce son fonctionnement indépendant et cherche à attirer les utilisateurs Hadoop, le leader actuel de l'analyse Big Data.

Alors que la deuxième génération d'Hadoop essaie de surmonter ses faiblesses telles que le manque de vitesse et de complexité, tout en renforçant ses avantages évidents, Google oriente le développement de BigQuery vers la commercialisation du service en tant que alternative pour que.

Même si BigQuery est compatible avec Hadoop et que les deux produits ont été créés directement ou indirectement par Google, leurs chemins ne semblent pas destinés à se croiser. S'ils l'ont fait jusqu'ici, malgré cela Google montre qu'il veut les séparer de plus en plus pour booster son avantage compétitif sur tous les fronts, y compris sa rivalité avec AWS Kinesis.

En réalité, BigQuery cherche à être une alternative réalisable à l'option open source présentée par MapReduce et le système de fichiers distribué Hadoop (HDFS). Avec la mise à jour en profondeur qui, entre autres améliorations, permet de combiner les résultats des requêtes de plusieurs tables de données, Google entend exploiter le la vitesse et le analyse en temps réel fourni par Dremel, le produit sur lequel la conception BigQuery est basée.

Analyse de données cloud

Conçu comme un service qui facilite requête rapide dans le cloud une fois que l'utilisateur a envoyé des données à Google via l'API BigQuery, votre mise à jour continue de se concentrer sur les requêtes de type SQL. Dans cette nouvelle version, de nouvelles fonctionnalités sont ajoutées avec la fonction susmentionnée de joindre les données de plusieurs tables dans une seule requête au moyen d'une nouvelle clause JOIN, pas de limite sur la taille des données.

Jusqu'au moment, BigQuery ne pouvait gérer que des groupes de données d'un maximum de 8 Mo et, d'autre part, ajouter des fonctionnalités pour importer des horodatages d'autres systèmes, interrogez les données datetime ou ajoutez des colonnes aux tables existantes et recevez des e-mails automatiques lorsqu'ils ont accès à plus d'ensembles de données.

Dans les mots de Ju-kay Kwek, Chef de produit, les changements se traduisent par plus de vitesse, simplicité et facilité d'utilisation:

Actuellement, avec BigQuery, les idées commerciales peuvent être obtenues directement via des requêtes de type SQL, avec moins d'effort et à une vitesse beaucoup plus élevée qu'auparavant. Joindre des tables de données de téraoctets a toujours été une tâche difficile pour les analystes, car jusqu'à présent, cela nécessitait des compétences de développement sophistiquées de MapReduce, matériel puissant et beaucoup de temps.

Son utilisation n'a aucun rapport avec le cadre éléphant jaune, envisager de s'en passer comme un avantage supplémentaire du produit. Depuis Google Ils commentent qu'au lieu d'installer Hadoop, l'utilisation de BigQuery vous fera économiser de l'argent en payant uniquement pour chaque requête plutôt que le coût informatique de l'infrastructure requise pour la mettre en œuvre. Avec ça et avec tout, également, Hadoop a été créé en son temps à partir de technologies telles que MapReduce et Google File pour traiter de grandes quantités de données à très faible coût.

Technologie Microsoft SQL et Hadoop

Pour sa part, Microsoft a récemment présenté ses solutions Big Data issues du cloud en faveur de l'Internet des objets. À partir d'une plate-forme unique pour la gestion et l'analyse des données, son utilisation d'Hadoop fait partie de l'une de ses innovations majeures: un serveur SQL 2014 plus rapide et son Intelligent Systems Service (IIS) y Système de plate-forme analytique (APS).

La dernière version d'APS est un produit à faible coût grâce à la combinaison de la technologie de Hadoop et Microsoft SQL proposer un Data Warehouse qui stocke et gère les données traditionnelles ainsi que la dernière génération.

En tant que nouveau service Azure, se presentó Microsoft Azure Intelligent System Service (ISS), un outil conçu pour fonctionner à partir de n'importe quel système d'exploitation afin de profiter très tôt des informations générées. différentes sources, comme des machines, capteurs ou appareils. en outre, CCC est rendu disponible grâce à des outils comme Power BI pour Office 365 qui permettent de combiner données locales et données cloud de manière complémentaire, résultant en une gestion rapide de l'information.

Article similaire:

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.