Solutions Hadoop et Big Data

Contenu

Big Data

Solutions Hadoop et Big Data ouvre un large éventail d'alternatives pour le traitement des mégadonnées. Bien que Cloudera ait publié une fois le premier package commercial basé sur Hadoop, existe aujourd'hui un très grand chiffre de distributions commerciales qui cherchent à faciliter leur configuration et leur installation.

Comme un guide, dans un récent rapport d'Analyse Future intitulé “Hadoop: Tendances et prévisions de croissance de l'industrie jusqu'en 2020”, Les dix sociétés suivantes sont sélectionnées comme les meilleures sociétés opérant sur le marché Hadoop:

  • Services Web Amazon
  • Systèmes Cisco
  • Cloudera Inc
  • Datameer, Inc
  • Hortonworks, Inc
  • Karmasphère, Inc.
  • MapR Technologies
  • Société Pentaho
  • Société Teradata
  • Marquer la logique

Malgré cela, le paysage change constamment. Selon le même rapport, le nombre de distributeurs Hadoop devrait augmenter et, pour cela, l'offre de logiciels groupés. En réalité, c'est une tendance actuelle, car en même temps ces entreprises, De plus petits fournisseurs émergent constamment qui vont prendre de la force pour son agilité, obliger les grandes entreprises à innover.

Spécifiquement, le marché des progiciels Hadoop enregistrerait un taux annuel composé de 62,9% dans la période analysée, Entrez 2013 Oui 2020.

Les revendeurs aident leurs clients à gérer les données via Hadoop, un logiciel open source qui peut catégoriser et analyser de grandes quantités d'informations Big Data. Il est, en résumé, simplifier l'analyse données ajoutant de la valeur au framework Apache Hadoop d'origine, le cadre commun.

L'écosystème Hadoop

Même si ton nom est unique, en fait Hadoop est une famille de technologies open source supervisée par Apache Software Foundation, et donc certains de ses produits permettent diverses combinaisons et on peut les trouver dans des emballages commerciaux.

D'après Philip Russom, directeur de la recherche en gestion des données au Data Warehousing Institute, la bibliothèque Hadoop comprend, “Par ordre de priorité BI: Système de fichiers de distribution Hadoop (HDFS), CarteRéduire, Porc, Ruche, HBase, HCatalogue, Ambari, Mohout, Fumées, entre autres ".

En même temps, la communauté Hadoop crée constamment de nouveaux projets. Même s'il peut être combiné de plusieurs manières, de l'avis de l'expert, une pile technologique pratique serait HDFS et MapReduce (peut-être avec Cochon, Ruche et HBase) pour les applications de business intelligence (AVEC UN), stockage de données (DW), intégration de données (DE) et analyse avancée.

Hadoop Apache ou distribution commerciale?

Les avantages comparatifs entre distributeurs se concentrent sur leurs différentes formules en termes de mise en œuvre et de facilité d'administration, même si les solutions de BI open source peuvent répondre à merveille aux besoins des entreprises, selon un rapport de Forrestar Research.

Pourtant, chaque distribution est différente et, en même temps, ils partagent tous leur cœur, même si certains fabricants proposent leurs propres applications MapReduce. A) Oui, à la fois des nouvelles générations d'outils et des différentes options commerciales disponibles, Apache Hadoop est ouvert à toute personne souhaitant l'utiliser pour le stockage et le traitement de grandes quantités de données disparates.

Le fait qu'Apache Hadoop soit open source disponible auprès des fournisseurs soulève le dilemme inévitable de se demander quelle option est la plus pratique. En même temps étant la clé comparer Les alternatives technologiques avant de choisir, il faut faire attention au coût économique, l'inclusion et le besoin d'outils administratifs, ainsi que des aspects tout aussi décisifs tels que la maintenance et l'assistance technique.

Article similaire:

Source de l'image: Deux abeilles / FreeDigitalPhotos.net

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.