Palabra
Descripción
Características de Mahout:
- Mahout ofrece un marco para realizar tareas de minería de datos en grandes volúmenes de datos
- Mahout posibilita que las aplicaciones analicen grandes conjuntos de datos de forma eficaz y rápida
- Además ofrece capacidades de función de fitness distribuidas para programación evolutiva.
- Incluye varias implementaciones de clústeres habilitadas para MapReduce, como k-means, fuzzy k-means, Dirichlet y Mean-Shift
Un marco MapReduce de forma general se compone de tres operaciones:
- Mapa: cada nodo trabajador aplica la función de mapa a los datos locales y escribe la salida en un almacenamiento temporal. Un nodo maestro garantiza que solo se procese una copia de los datos de entrada redundantes.
- Barajar: Los nodos de trabajo redistribuyen los datos en función de las claves de salida (producidas por la función de mapa), de modo que todos los datos que pertenecen a una clave se encuentran en el mismo nodo de trabajo.
- Reducir: Los nodos de trabajo ahora procesan cada grupo de datos de salida, por clave, en paralelo.
Para obtener más información sobre MapReduce, visite aquí.
Cuando se compran dos o más productos, el análisis de la cesta de la compra se realiza para chequear si la compra de un producto aumenta la probabilidad de compra de otros productos. Este conocimiento es una herramienta para que los especialistas en marketing agrupen los productos o diseñen una estrategia de venta cruzada de productos a un cliente.
Suponga que la venta total es 100 $, este total se puede dividir en subcomponentes, dicho de otra forma, 60 $ venta base, 20 $ precio, 18 $ pueden ser distribución y 2 $ pueden deberse a actividades promocionales. Estos números se pueden lograr usando varios métodos lógicos. Cada método puede dar lugar a una ruptura distinto. Por eso, es muy importante estandarizar el procedimiento de desglose de las ventas totales en estos componentes. Esta técnica formal se conoce formalmente como MMM o Market Mix Modeling.
A modo de ejemplo, si tiene las calificaciones de los estudiantes de una clase y preguntó qué tan bien se está desempeñando la clase. Sería irrelevante decir las calificaciones de cada estudiante, en cambio, puede hallar la media de la clase, que será un representante del desempeño de la clase.
Para hallar la media, sume todos los números y posteriormente divida por el número de ítems del conjunto.
A modo de ejemplo, si los números son 1, 2, 3, 4, 5, 6, 7, 8, 8, entonces la media sería 44/9 = 4,89.
Para calcular la mediana de un conjunto de números, siga los pasos a continuación:
- Organizar los números en orden ascendente o descendente
- Encuentre el valor medio, que será n / 2 (donde n son los números del conjunto)
Objetivos de MIS:
- Para impulsar la toma de decisiones, proporcionando datos precisos y actualizados sobre una gama de activos organizacionales.
- Correlacionar múltiples puntos de datos para diseñar estrategias para impulsar las operaciones.
- Estudio de aprendizaje automático de Microsoft Azure
- Aprendizaje automático de AWS
- Aprendizaje automático de IBM Watson
- Motor de aprendizaje automático de Google Cloud
- BigML
El modo se puede calcular a través de los siguientes pasos:
- Cuente el número de veces que aparece cada valor
- Toma el valor que aparece más
Entendamos con un ejemplo:
Supongamos que tenemos un conjunto de datos que tiene 10 puntos de datos, que se enumeran a continuación:
4,5,2,8,4,7,6,4,6,3
Entonces ahora calcularemos el número de veces que ha aparecido cada valor.
Valor | Contar |
2 | 1 |
3 | 1 |
4 | 3 |
5 | 1 |
6 | 2 |
7 | 1 |
8 | 1 |
Entonces vemos que el valor 4 es el que más se repite, dicho de otra forma, 3 veces. Entonces, el modo de este conjunto de datos será 4.
- Análisis exploratorio de datos
- Metodos cientificos
Algunos de los criterios para elegir el modelo pueden ser:
- Criterio de información de Akaike (AIC)
- R ajustado2
- Criterio de información bayesiano (BIC)
- Prueba de razón de verosimilitud
A modo de ejemplo, si el objetivo es predecir la calidad de un producto, que puede ser Excelente, bueno, promedio, regular, malo. Para este caso, la variable tiene 5 clases, por lo que es un obstáculo de clasificación de 5 clases.
A modo de ejemplo, podemos hacer un análisis bivariado de la combinación de dos características continuas y hallar una vinculación entre ellas.
Considere el ejemplo: para un conjunto dado de detalles sobre los intereses de un estudiante, puntaje previo por materia, etc., desea predecir el GPA para todos los semestres (GPA1, GPA2,….). Este enunciado del problema se puede abordar a través de regresión multivariante, dado que tenemos más de una variable dependiente.