BigQuery, für Hadoop-Benutzer immer attraktiver

Inhalt

Cloud Computing

Google kündigt Verbesserungen an BigQuery, das Big-Data-Management-Tool des Internetriesen in 2010 als Service zur Analyse von Big Data innerhalb und außerhalb des Ökosystems von Apache Hadoop. Trotz dieses, mit diesen tiefen Updates, Cloud-Service stärkt seinen unabhängigen Betrieb und versucht, Hadoop-Benutzer anzuziehen, der derzeit führende Anbieter von Big-Data-Analysen.

Während die zweite Generation von Hadoop versucht, ihre Schwächen wie mangelnde Geschwindigkeit und Komplexität zu überwinden, während es seine offensichtlichen Vorteile verstärkt, Google konzentriert die Entwicklung von BigQuery auf die Kommerzialisierung des Dienstes als Alternative dazu.

Obwohl BigQuery mit Hadoop kompatibel ist und beide Produkte direkt oder indirekt von Google erstellt wurden, Ihre Wege scheinen nicht dazu bestimmt zu sein, sich weiter zu kreuzen. Wenn sie es bis jetzt getan haben, Trotzdem zeigt Google, dass es sie immer mehr trennen möchte, um seine Wettbewerbsvorteil an allen Fronten, einschließlich seiner Rivalität mit AWS Kinesis.

In Wirklichkeit, BigQuery möchte eine praktikable Alternative zur Open-Source-Option von MapReduce und dem Hadoop Distributed File System sein (HDFS). Mit dem tiefen Update, das, unter anderen Verbesserungen, ermöglicht das Kombinieren von Abfrageergebnissen aus mehreren Datentabellen, Google beabsichtigt, die . auszunutzen Geschwindigkeit und das Echtzeitanalyse zur Verfügung gestellt von Dremel, das Produkt, auf dem das BigQuery-Design basiert.

Cloud-Datenanalyse

Konzipiert als Service, der erleichtert schnelle Abfrage in der Cloud nachdem der Nutzer Daten über die BigQuery API an Google übermittelt hat, Ihr Update konzentriert sich weiterhin auf Abfragen des Typs SQL. In dieser neuen Version, Neue Funktionen werden zusammen mit der oben genannten Funktion hinzugefügt, Daten aus mehreren Tabellen in einer einzigen Abfrage mithilfe einer neuen JOIN-Klausel zusammenzuführen, keine Begrenzung der Datengröße.

Bis jetzt, BigQuery konnte nur Datengruppen von maximal . verarbeiten 8 MB und, Außerdem, Funktionalitäten hinzufügen um Zeitstempel aus anderen Systemen zu importieren, fragen Datetime-Daten ab oder fügen Spalten zu bestehenden Tabellen hinzu und erhalten automatische E-Mails, wenn sie Zugriff auf weitere Datensätze erhalten.

In den Worten von Ju-kay Kwek, Produktmanager, Änderungen führen zu mehr Geschwindigkeit, Einfachheit und Benutzerfreundlichkeit:

Heutzutage, mit BigQuery, Geschäftsideen können direkt über SQL-ähnliche Abfragen abgerufen werden, mit weniger Kraftaufwand und mit einer viel höheren Geschwindigkeit als bisher machbar. Das Zusammenfügen von Tabellen mit Terabyte-Daten war für Analysten traditionell eine schwierige Aufgabe, da es bisher ausgefeilte Entwicklungskompetenzen von MapReduce erforderte, leistungsstarke Hardware und viel Zeit.

Seine Verwendung hat nichts mit dem gelben Elefantenrahmen zu tun, den Verzicht darauf als weiteren Vorteil des Produkts in Erwägung ziehen. Aus Google Sie kommentieren, dass anstatt Hadoop zu installieren, Die Verwendung von BigQuery spart Geld, da nur für jede Abfrage bezahlt wird und nicht die IT-Kosten der Infrastruktur, die für die Implementierung erforderlich ist. Damit und mit allem, gleichermaßen, Hadoop wurde seinerzeit aus Technologien wie MapReduce und Google File große Datenmengen zu sehr geringen Kosten verarbeiten.

Microsoft SQL- und Hadoop-Technologie

Für seinen Teil, Microsoft hat kürzlich seine Big-Data-Lösungen aus der Cloud zugunsten des Internets der Dinge vorgestellt. Ausgehend von einer einzigen Plattform für Datenmanagement und -analyse, seine Verwendung von Hadoop ist Teil einer seiner wichtigsten Innovationen: un SQL Server 2014 schneller und sein Intelligent Systems Service (IIS) y Analytics-Plattformsystem (APS).

Die neueste Version von APS ist dank der Kombination der Technologie von Hadoop und Microsoft SQL ein Data Warehouse anzubieten, das traditionelle Daten zusammen mit der neuesten Generation speichert und verwaltet.

Als neuer Azure-Dienst, se presentó Microsoft Azure Intelligent System Service (ISS), ein Tool, das für den Betrieb von jedem Betriebssystem entwickelt wurde, um die frühzeitig generierten Informationen zu nutzen. verschiedene Quellen, wie Maschinen, Sensoren oder Geräte. in Ergänzung, CCC wird dank Tools wie Power BI for Office zur Verfügung gestellt 365 die es ermöglichen, lokale Daten und Cloud-Daten komplementär zu kombinieren, was zu einem schnellen Informationsmanagement führt.

Verwandter Beitrag:

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.