Visión general
- Microsoft Excel es una excelente herramienta para aprender y ejecutar funciones estadísticas
- Aquí hay 12 funciones estadísticas en Excel que debe dominar para una carrera de análisis exitosa
¡Vamos a sobresalir en estadísticas!
«La estadística es la gramática de la ciencia». – Karl Pearson
Hagámoslo un poco más relevante para nosotros: la estadística es la gramática de la ciencia de los datos. Notará que casi todos los profesionales de la ciencia de datos o de la analíticaLa analítica se refiere al proceso de recopilar, medir y analizar datos para obtener información valiosa que facilite la toma de decisiones. En diversos campos, como los negocios, la salud y el deporte, la analítica permite identificar patrones y tendencias, optimizar procesos y mejorar resultados. El uso de herramientas avanzadas y técnicas estadísticas es fundamental para transformar datos en conocimiento aplicable y estratégico.... exitosos tienen un conocimiento sólido de las estadísticas, pero ¿eso significa que necesita una maestría en la materia?
¡Absolutamente no!
Abordaremos este artículo utilizando el famoso Principio de Pareto: el 80% de las consecuencias provienen del 20% de las causas. Por lo tanto, nos centraremos principalmente en el 20% de los conceptos y funciones que son útiles el 80% del tiempo. Ahora, la pregunta como analista es, ¿cómo empezar a implementar estadísticas?
Claro, puede implementar y practicar estos conceptos en lenguajes de programación como Python y R. Pero espere un segundo y piense: ¿cuál es la herramienta más utilizada en la mayoría de las organizaciones?
¡Es Microsoft Excel! Honestamente, Excel es la navaja suiza para profesionales de la analítica que lo ayuda a concentrarse en lo que es importante (estadísticas en nuestro caso) y maneja el resto de los cálculos y personalizaciones por sí mismo.
Este artículo es para todos los que están comenzando su viaje hacia las estadísticas usando Excel. Usaremos 10 funciones estadísticas clave en Excel para responder preguntas para una empresa de deportes ficticia, Khelo, mientras examinamos sus datos.
Si es un principiante en el mundo de la analítica y Excel, le recomiendo encarecidamente que siga estos cursos gratuitos:
Cómo abordaremos estas funciones estadísticas 1o en Excel
He dividido estas funciones estadísticas en Excel en dos categorías:
- Funciones estadísticas básicas
- Funciones estadísticas intermedias
¡Vamos a empezar!
Comprensión de los datos y el planteamiento del problema
Resolveremos algunas preguntas clave sobre nuestra empresa de indumentaria y equipamiento deportivo ficticio: Khelo. Estas son las columnas que tenemos:
- Equipo
- Número de artículos vendidos
- Costo de cada artículo
- % De descuento
- Ingresos
En el transcurso de este artículo, responderemos estas preguntas:
- ¿Cuántos artículos tienen descuento?
- ¿Cuántos artículos / equipos vende la tienda?
- ¿Cuál es la cantidad de productos vendidos sin descuento?
- ¿Hay productos vendidos que hayan costado más de 2000 junto con una tasa de descuento superior al 50%?
- ¿Cuál es el número medio de productos vendidos?
- ¿Cuál es la medianaLa mediana es una medida estadística que representa el valor central de un conjunto de datos ordenados. Para calcularla, se organizan los datos de menor a mayor y se identifica el número que se encuentra en el medio. Si hay un número par de observaciones, se promedia los dos valores centrales. Este indicador es especialmente útil en distribuciones asimétricas, ya que no se ve afectado por valores extremos.... del número de productos vendidos?
- ¿Cuál es el porcentaje de descuento más frecuente?
- ¿Cuál es la desviación estándar del número de productos vendidos?
- ¿Existe alguna relación entre la cantidad de productos vendidos y el porcentaje de descuento?
Funciones estadísticas básicas en Excel
MS Excel proporciona una variedad de funciones estadísticas útiles. Comencemos con algunas de las funciones básicas pero extremadamente poderosas. Honestamente, encontrará que está utilizando las funciones estadísticas básicas el 90% del tiempo y el 10% restante de su tiempo lo toman las funciones intermedias y avanzadas.
Hablaremos principalmente sobre los diferentes tipos de funciones de conteo aquí. Son muy similares a otras funciones como suma, máximo, mínimo, promedio.
1. Función de conteo
Usamos la función de conteo cuando necesitamos contar el número de celdas que contienen un número. Recordar SÓLO NÚMEROS! Veamos la función:
- COUNT (valor1, [value2],…)
Entonces, intentemos encontrar la respuesta a nuestra primera pregunta: ¿Cuántos artículos tenían descuento?
Hay 11 productos con descuento.
2. Función Counta
Mientras que la función de conteo solo cuenta los valores numéricos, la función CONTAR cuenta todas las celdas de un rango que no están vacías. La función es útil para contar celdas que contienen cualquier tipo de información, incluidos valores de error y texto vacío.
- CONTAR (valor1, [value2],…)
3. Countblank
los COUNTBLANK La función cuenta el número de celdas vacías en un rango de celdas. Las celdas con fórmulas que devuelven texto vacío también se cuentan aquí, pero las celdas con valores cero no se cuentan. Esta es una gran función para resumir celdas vacías mientras se analizan los datos.
Solo hay 2 artículos sin descuento.
4. Función Countifs
Countifs es una de las funciones estadísticas más utilizadas en Excel. La función CONTAR.SI aplica una o más condiciones a las celdas en el rango dado y devuelve solo aquellas celdas que cumplen con todas las condiciones.
- COUNTIFS (rango_criterios1, criterios1, [criteria_range2, criteria2]…)
Funciones estadísticas intermedias en Excel
Aquí discutiremos algunas de las funciones estadísticas intermedias en MS Excel relacionadas con la tendencia central y la dispersión. Estas funciones son muy útiles en nuestro día a día como analista.
5. Función promedio
La función más común que usamos habitualmente en nuestra vida diaria es la media (o media). La función PROMEDIO simplemente devuelve la media aritmética de todas las celdas en un rango dado:
- PROMEDIO (número1, [number2],…)
6. Función mediana
El problema de los valores atípicos se puede resolver utilizando otra función para la tendencia central: la mediana. La función mediana devuelve el valor medio del rango de celdas dado. La sintaxis es bastante simple:
- MEDIANA (número1, [number2],…)
7. Función de modo
Para valores numéricos, la media y la mediana suelen ser suficientes, pero ¿qué pasa con los valores categóricos? Aquí, el modo entra en escena. El modo devuelve el valor más frecuente y repetido en el rango de valores dado:
- MODE.SNGL (número1,[number2],…)
Bueno, este es uno simple. Encontremos el valor de descuento más frecuente otorgado por la tienda de deportes:
8. Función de desviación estándar
La desviación estándar es una de las formas de cuantificar la dispersión. Es una medidaLa "medida" es un concepto fundamental en diversas disciplinas, que se refiere al proceso de cuantificar características o magnitudes de objetos, fenómenos o situaciones. En matemáticas, se utiliza para determinar longitudes, áreas y volúmenes, mientras que en ciencias sociales puede referirse a la evaluación de variables cualitativas y cuantitativas. La precisión en la medición es crucial para obtener resultados confiables y válidos en cualquier investigación o aplicación práctica.... de la dispersión de los valores del valor medio.
Aquí, usaremos la función STDEV.P que se usa para calcular la desviación estándar basada en la población completa dada como argumentos:
- STDEV.P (número1,[number2],…)
Como se esperaba, la desviación estándar de la cantidad vendida es menor, lo que significa que la dispersión es menor mientras que la desviación estándar del costo de los productos es alta.
9. Funciones de cuartiles
Esta es otra función con abundantes aplicaciones en la industria. Nos ayuda a dividir la población en grupos. QUARTILES.INC devuelve el cuartil de un conjunto de datos, basado en valores de percentiles de 0 a 1, inclusive.
Por ejemplo, puede utilizar esta función para conocer el 25% superior de su base de clientes.
- CUARTIL.INC (matriz, cuarto)
10. Función de correlación
La función CORREL () es mi favorita personal. Proporciona información realmente poderosa que no es obvia a simple vista. los CORREL La función devuelve el coeficiente de correlación de dos rangos de celdas. ¿Pero que es eso? Básicamente, nos dice qué tan fuerte es la relación entre las dos variables.
Nota: No muestra ninguna relación de causa y efecto.
El rango de valor de correlación está entre -1 y 1.
Vayamos a nuestra última y más interesante pregunta: ¿existe alguna relación entre la cantidad de bienes vendidos y el porcentaje de descuento?
Bueno, la correlación resulta ser ~ 0.8, que es bastante alta. Parece que estos están relacionados positivamente, lo que significa más descuento, más cantidad vendida.
Notas finales
En este artículo, analizamos más de 10 funciones estadísticas para principiantes e intermedios en MS Excel, que van desde recuento simple () hasta correl avanzado (). La estadística es una de las herramientas más importantes en el kit de un analista y puede lograr muchos de sus objetivos estadísticos simplemente usando Excel.
Le recomiendo que consulte los siguientes recursos adicionales en Excel:
Cubriré funciones estadísticas avanzadas en el futuro. Déjeme saber algunas de sus funciones estadísticas favoritas e intentaré incorporarlas en mis próximos artículos.
Relacionado
Posts Relacionados:
- Estadísticas para la ciencia de datos | Comprensión de las estadísticas
- Estadísticas para la ciencia de datos | Guía para principiantes de estadísticas para ciencia de datos
- Estadísticas de pedidos | ¿Qué son las estadísticas de pedidos?
- Pruebas estadísticas | Selección de características mediante pruebas estadísticas