Soluciones Hadoop y Big data abre un amplio abanico de alternativas para el tratamiento de big data. Aunque Cloudera lanzó una vez el primer paquete comercial basado en Hadoop, hoy existe una cifra muy grande de distribuciones comerciales que buscan facilitar su configuración e instalación.
Como guía, en un reporte reciente de Analyze Future titulado “Hadoop: Tendencias y previsiones de crecimiento de la industria hasta 2020”, las siguientes diez compañías son seleccionadas como las principales compañías que operan en el mercado Hadoop:
- Serviços da web da Amazon
- Cisco Systems
- Cloudera Inc
- Datameer, Inc
- Hortonworks, Inc
- Karmasphere, Inc.
- Tecnologías MapR
- Corporción Pentaho
- Corporación Teradata
- Marcar lógica
Apesar disto, el paisaje cambia constantemente. Según el mismo reporte, se espera que aumente el número de distribuidores de Hadoop y, por isso, la oferta de software empaquetado. Na realidade, esta es una tendencia actual, debido a que al mismo tiempo de estas compañías, constantemente están surgiendo proveedores más pequeños que van ganando fuerza por su agilidad, obligando a las grandes compañías a innovar.
Especificamente, el mercado de software empaquetado Hadoop registraría una tasa anual compuesta del 62,9% en el período analizado, Entre 2013 e 2020.
Los revendedores ayudan a sus clientes a administrar los datos por medio de Hadoop, un software open source que puede categorizar y analizar grandes cantidades de información de Big Data. Isto é, em resumo, simplificar el análisis datos que agregan valor al marco original de Apache Hadoop, el marco común.
El ecosistema de Hadoop
Aún cuando su nombre es único, en realidad Hadoop es una familia de tecnologías open source supervisadas por la Apache Software Foundation, y por ello algunos de sus productos posibilitan diversas combinaciones y podemos encontrarlos en paquetes comerciales.
Según Philip Russom, director de investigación de administración de datos en The Data Warehousing Institute, la biblioteca de Hadoop incluye, “En orden de prioridad de BI: Hadoop Distribute File System (HDFSHDFS, o Sistema de Arquivos Distribuído Hadoop, É uma infraestrutura essencial para armazenar grandes volumes de dados. Projetado para ser executado em hardware comum, O HDFS permite a distribuição de dados em vários nós, garantindo alta disponibilidade e tolerância a falhas. Sua arquitetura é baseada em um modelo mestre-escravo, onde um nó mestre gerencia o sistema e os nós escravos armazenam os dados, facilitando o processamento eficiente de informações..), MapReduceMapReduce es un modelo de programación diseñado para procesar y generar grandes conjuntos de datos de manera eficiente. Desarrollado por Google, este enfoque Divide el trabajo en tareas más pequeñas, las cuales se distribuyen entre múltiples nodos en un clúster. Cada nodo procesa su parte y luego se combinan los resultados. Este método permite escalar aplicaciones y manejar volúmenes masivos de información, siendo fundamental en el mundo del Big Data...., PorcoEl cerdo, un mamífero domesticado de la familia Suidae, es conocido por su versatilidad en la agricultura y la producción de alimentos. Originario de Asia, su cría se ha extendido por todo el mundo. Los cerdos son omnívoros y poseen una alta capacidad de adaptación a diversos hábitats. O que mais, juegan un papel importante en la economía, proporcionando carne, cuero y otros productos derivados. Su inteligencia y comportamiento social también son..., ColmeiaHive é uma plataforma de mídia social descentralizada que permite que seus usuários compartilhem conteúdo e se conectem com outras pessoas sem a intervenção de uma autoridade central. Usa a tecnologia blockchain para garantir a segurança e a propriedade dos dados. Ao contrário de outras redes sociais, O Hive permite que os usuários monetizem seu conteúdo por meio de recompensas criptográficas, que incentiva a criação e a troca ativa de informações ...., HBaseHBase es una base de datos NoSQL diseñada para manejar grandes volúmenes de datos distribuidos en clústeres. Basada en el modelo de columnas, permite un acceso rápido y escalable a la información. HBase se integra fácilmente con Hadoop, lo que la convierte en una opción popular para aplicaciones que requieren almacenamiento y procesamiento de datos masivos. Su flexibilidad y capacidad de crecimiento la hacen ideal para proyectos de big data...., HCatalog, Ambari, Mohout, Humos, entre otros ”.
Ao mesmo tempo, la comunidad de Hadoop está constantemente creando nuevos proyectos. Aún cuando se puede combinar de varias formas, en opinión del experto, una pila de tecnología práctica sería HDFS y MapReduce (tal vez con Pig, Hive y HBase) para aplicaciones de inteligencia empresarial (COM UM), armazenamento de dados (DW), integração de dados (DI) y análisis avanzado.
¿Hadoop Apache o distribución comercial?
Las ventajas comparativas entre distribuidores se enfocan en sus diferentes fórmulas con respecto a implementación y facilidad de administración, aún cuando las soluciones de BI open source pueden responder estupendamente a las necesidades del negocio, según un reporte de Forrestar Research.
Por tanto, cada distribución es distinto y, ao mesmo tempo, todas comparten su núcleo, aún cuando algunos fabricantes ofrecen sus propias aplicaciones MapReduce. A) Sim, al mismo tiempo de las nuevas generaciones de herramientas y las diferentes opciones comerciales disponibles, Apache Hadoop está abierto a cualquiera que quiera utilizarlo para el almacenamiento y procesamiento de grandes cantidades de datos dispares.
El hecho de que Apache Hadoop sea open source disponible por medio de los proveedores plantea el inevitable dilema de preguntarse qué opción es más conveniente. Al mismo tiempo de ser clave comparar Las alternativas tecnológicas antes de elegir, es necesario prestar atención el costo económico, la inclusión y necesidad de herramientas administrativas, así como aspectos igualmente decisivos como el mantenimiento y la asistencia técnica.
Postagem Relacionada:
Fonte da imagem: Twobee / FreeDigitalPhotos.net