Mapa pequeno es un modelo de programación para procesar grandes conjuntos de datos con un paralelo, Distribuído algoritmo en un clúster (fonte: Wikipedia). Map Reduce cuando se combina con HDFS se puede usar para manejar big data. Los principios fundamentales de este sistema HDFS-MapReduce, que comúnmente se conoce como Hadoop, se discutieron en nuestro post anterior.
La unidad básica de información que se utiliza en MapReduceO MapReduce é um modelo de programação projetado para processar e gerar grandes conjuntos de dados com eficiência. Desenvolvido pelo Google, Essa abordagem divide o trabalho em tarefas menores, que são distribuídos entre vários nós em um cluster. Cada nó processa sua parte e, em seguida, os resultados são combinados. Esse método permite dimensionar aplicativos e lidar com grandes volumes de informações, sendo fundamental no mundo do Big Data.... es un par (chave, valor). Todos los tipos de datos estructurados y no estructurados deben traducirse a esta unidad básica, antes de alimentar los datos al modelo MapReduce. Como o nome sugere, el modelo MapReduce consta de dos rutinas separadas, a saber, función de mapa y función de disminución. Este post lo ayudará a comprender la funcionalidad paso a paso del modelo Map-Reduce. El cálculo de una entrada (Em outras palavras, en un conjunto de pares) en el modelo MapReduce ocurre en tres etapas:
Paso 1: la etapa del mapa
Paso 2: la etapa de reproducción aleatoria
Paso 3: la etapa de disminución.
Semánticamente, las fases de mapa y barajado distribuyen los datos, y la etapa de disminución realiza el cálculo. En este post analizaremos en detalle cada una de estas etapas.
[stextbox id=”section”] La etapa del mapa [/stextbox]
La lógica de MapReduce, a diferencia de otros marcos de datos, no se limita a conjuntos de datos estructurados. Además cuenta con una amplia capacidad para manejar datos no estructurados. La etapa del mapa es el paso crítico que lo hace factible. MapperMapper es una herramienta que facilita la visualización y el análisis de datos geoespaciales. Permite a los usuarios crear mapas interactivos y personalizables, integrando información diversa como demografía, infraestructuras y recursos naturales. Su uso se extiende en sectores como la planificación urbana, la investigación ambiental y la gestión de recursos, contribuyendo a la toma de decisiones informadas y al desarrollo sostenible. Mapper se ha convertido en una solución esencial en... aporta una estructura a los datos no estructurados. Como um exemplo, si quiero contar la cantidad de fotografías en mi computadora portátil por la ubicación (Cidade), donde se tomó la foto, necesito analizar datos no estructurados. El asignador crea pares (chave, valor) a partir de este conjunto de datos. Para este caso, la clave será la ubicación y el valor será la fotografía. Una vez que el asignador termina con su tarea, tenemos una estructura para todo el conjunto de datos.
En la etapa de mapa, el asignador toma un solo par (chave, valor) como entrada y produce cualquier número de pares (chave, valor) como uma saída. Es esencial pensar en la operación del mapa como sin estado, Em outras palavras, su lógica opera en un solo par al mismo tiempo (inclusive si en la práctica se envían varios pares de entrada al mismo asignador). Para resumir, para la etapa de mapa, el usuario simplemente diseña una función de mapa que asigna un par de entrada (chave, valor) a cualquier número (inclusive ninguno) de pares de salida. A maioria das vezes, la etapa de mapa se utiliza simplemente para especificar la ubicación deseada del valor de entrada cambiando su clave.
[stextbox id=”section”] La etapa de barajar [/stextbox]
La etapa de reproducción aleatoria es manejada automáticamente por el marco MapReduce, Em outras palavras, el ingeniero no tiene nada que hacer en esta etapa. El sistema subyacente que implementa MapReduce enruta todos los valores asociados con una clave individual al mismo reductor.
[stextbox id=”section”] La etapa Reducir [/stextbox]
En la etapa de disminución, el reductor toma todos los valores asociados con una sola clave k y genera cualquier número de pares (chave, valor). Esto resalta uno de los aspectos secuenciales del cálculo de MapReduce: todos los mapas deben finalizar antes de que pueda comenzar la etapa de disminución. Dado que el reductor tiene acceso a todos los valores con la misma clave, puede realizar cálculos secuenciales sobre estos valores. En el paso de disminución, el paralelismo se explota al observar que los reductores que operan en diferentes teclas pueden ejecutarse simultáneamente. Para resumir, para la etapa de disminución, el usuario diseña una función que toma como entrada una lista de valores asociados con una sola tecla y genera cualquier número de pares. Frequentemente, las teclas de salida de un reductor son iguales a la tecla de entrada (na realidade, en el papel MapReduce original, la tecla de salida tem que igual a la clave de entrada, pero Hadoop relajó esta restricción).
Em geral, un programa en el paradigma MapReduce puede constar de muchas rondas (de forma general llamadas trabalho) de diferentes funciones de mapa y disminución, hechas secuencialmente una tras otra.
[stextbox id=”section”] Um exemplo [/stextbox]
Consideremos un ejemplo para comprender Map-Reduce en profundidad. Tenemos las siguientes 3 frases:
1. El zorro marrón veloz
2. El zorro se comió al ratón
3. ¿Cómo ahora vaca marrón
Nuestro objetivo es contar la frecuencia de cada palabra en todas las frases. Imagine que cada una de estas oraciones adquiere una gran cantidad de memoria y, por isso, se asignan a diferentes nodos de datos. Mapper se hace cargo de estos datos no estructurados y crea pares clave-valor. Para este caso, la clave es la palabra y el valor es el recuento de esta palabra en el texto disponible en este nóO Nodo é uma plataforma digital que facilita a conexão entre profissionais e empresas em busca de talentos. Através de um sistema intuitivo, permite que os usuários criem perfis, Compartilhar experiências e acessar oportunidades de trabalho. Seu foco em colaboração e networking torna o Nodo uma ferramenta valiosa para quem deseja expandir sua rede profissional e encontrar projetos que se alinhem com suas habilidades e objetivos.... De dados. Como um exemplo, el nodo 1st Map genera 4 pares clave-valor: (a, 1), (brown, 1), (fox, 1), (quick, 1). Os primeiros 3 pares clave-valor van al primer reductor y el último valor clave al segundo reductor.
de forma similar, las funciones de mapa 2 e 3 hacen el mapa de las otras dos oraciones. Al mezclar, todas las palabras similares llegan al mismo final. Una vez que se ordenan los pares clave-valor, la función reductora opera sobre estos datos estructurados para generar un resumen.
[stextbox id=”section”] Notas finais: [/stextbox]
Tomemos un ejemplo del uso de la función Map-Reduce en la industria:
• En el buscador de Google:
– Construcción de índices para la búsqueda de Google
– Agrupación de posts para Google News
– Traducción automática estadística
• ¡En Yahoo !:
– Creación de índices para Yahoo! Olhe para
– Detección de spam para Yahoo! Correspondência
• En Facebook:
– Processamento de dados
– Optimización de anuncios
– Ejemplo de detección de spam
• En Amazon:
– Agrupación de productos
– Traducción automática estadística
La restricción de utilizar la función Map-reduce es que el usuario tiene que seguir un formato lógico. Esta lógica es generar pares clave-valor usando la función Mapa y después resumir usando la función Reducir. Mas, por sorte, la mayoría de las operaciones de manipulación de datos se pueden engañar en este formato. En el próximo post tomaremos algunos ejemplos como cómo hacer una fusión de conjuntos de datos, multiplicación de matrices, transposición de matrices, etc. usando Map-Reduce.
A postagem foi útil para você? Comparta con nosotros otros ejemplos prácticos de la función Map-Reduce. Deixe-nos saber sua opinião sobre esta postagem na caixa abaixo..