Wesentliche Schlüssel zum Verständnis der Hadoop-Architektur

Inhalt

arquitectura hadoop

Hadoop, wie ist es bekannt, Es ist ein Open-Source-System, das auf einer Architektur basiert, die mit dem Master-Knoten und den Slave-Knoten zusammenarbeitet, um einen Cluster zu bilden, immer seit ein einzelner Master-Knoten und mehrere Slaves. Dank dieser Struktur, Hadoop ist in der Lage, große Datenmengen zu speichern und zu analysieren, Hunderte von Pentabytes und noch mehr.

Sein Kern wurde als eine Reihe von Lösungen in der Apache-Umgebung geboren, getauft Hadoop, und sein Meisterarchitektur / Sklave verwendet den Master-Knoten, um die Metadaten zu speichern, die mit seinen Slave-Knoten in dem Rack verbunden sind, zu dem er gehört. Außerdem, der Master behält den Zustand seiner slawischen Knoten bei, während sie die zu einem bestimmten Zeitpunkt verarbeiteten Informationen speichern.

Einfach, ist eine Technologie, die riesige Mengen an Informationen speichert und deren Umsetzung ermöglicht prädiktive Analytik aus strukturierten und unstrukturierten Daten, Ausführung in einem Hadoop-Cluster mit einer bestimmten Anzahl von Knoten.

Ein reiches und wachsendes Ökosystem

Die internationale Open-Source-Community verfeinert den Kern von Hadoop und erweitert gleichzeitig ihr Ökosystem mit Beiträge Konstante. Da das Original nicht den Anforderungen entspricht, Funktionen beginnen zu erscheinen, wie es mit passiert Funke – Funke, die Echtzeitanforderungen erfüllt, die ein herkömmlicher Hadoop-Cluster ohne Ihre Hilfe nicht erfüllen kann. Daher, dass die Open-Source-Community für die Pflege verantwortlich ist, Fehler beheben und neue Pakete gewähren, um neue Funktionen zu erreichen.

Für seinen Teil, kommerzielle Distributionen Sie nehmen die Opensource von Apache und fügen neue Funktionalitäten hinzu, die den Anforderungen der Geschäftswelt gerecht werden, um es anzupassen, da Open-Source-Software den Vorteil hat, kostenlos zu sein, aber in einer Unternehmensumgebung werden andere Funktionalitäten benötigt.

Passt sich der Hadoop-Architektur an

Im Moment von einen Cluster entwerfen Wir müssen eine Reihe von Schlüsselfragen beantworten, die es uns ermöglichen, die Hadoop-Architektur an die unterschiedlichen Bedürfnisse des jeweiligen Einzelfalls anzupassen.. Wir werden mit wählen müssen wie viele knoten Wir beginnen anhand von Aspekten wie der Datenmenge, mit der wir arbeiten werden, Wo sind sie, seine, ihre Natur …

Es wird auch wichtig sein zu bestimmen, was ich analysieren möchte, wo geschnitten werden muss, um das Verfahren durchführbar zu machen, ohne die Zielerreichung zu behindern, was nichts anderes ist, als Trends zu entdecken und, abschließend, Muster verstehen, die die Extraktion von strategischem Wert ermöglichen. .

Das Wahl der Verteilung Hadoop hängt davon ab, was Sie uns anbieten und wie es sich an das anpasst, wonach Sie suchen. Die kostenlose Hadoop-Distribution wird oft verwendet, um das zu testen, wenn sie erfolg haben, führen oft zu einem kostengünstigen Business Case, der kommerziellen Vertrieb erfordert.

Auch so, das Open-Source-Version ist eine Alternative zu kommerziell. Es stimmt, dass sie nicht so viele Unternehmensanwendungen haben werden und die Installation und Konfiguration schwieriger sein wird, da wir keinen Installations- oder Konfigurationsassistenten haben werden. Die Implementierung eines Hadoop-Clusters wird komplexer und es fehlt an Unterstützung bei der Implementierung und der Behebung möglicher Fehler.

Die Verwendung von Wolke es kann auch als dienen ergänzen haben Werkzeuge, die Analysen effizienter gestalten, obwohl dies innerhalb des Clusters erfolgen muss. Ein Beispiel könnte die Verwendung von Visualisierungstools sein, die auf dem Cluster laufen würden, keine Notwendigkeit, Daten zu verschieben in die Wolke. Allgemein, diese Art von Hilfsmitteln kann verwendet werden, um zu analysieren, Ergebnisse validieren, Vergleiche anstellen oder ein System implementieren, Sagen wir.

Bildquelle: jscreationzs / FreeDigitalPhotos.net

Verwandter Beitrag:

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.