Estadísticas en Excel | 10 funciones estadísticas en Microsoft Excel

12-statistical-functions-in-excel-every-analyst-must-know-2196559-2900492-jpg

Visión general

  • Microsoft Excel es una excelente herramienta para aprender y ejecutar funciones estadísticas
  • Aquí hay 12 funciones estadísticas en Excel que debe dominar para una carrera de análisis exitosa

¡Vamos a sobresalir en estadísticas!

«La estadística es la gramática de la ciencia». – Karl Pearson

Hagámoslo un poco más relevante para nosotros: la estadística es la gramática de la ciencia de los datos. Notará que casi todos los profesionales de la ciencia de datos o de la analítica exitosos tienen un conocimiento sólido de las estadísticas, pero ¿eso significa que necesita una maestría en la materia?

¡Absolutamente no!

giphy-9522744

Abordaremos este artículo utilizando el famoso Principio de Pareto: el 80% de las consecuencias provienen del 20% de las causas. Por lo tanto, nos centraremos principalmente en el 20% de los conceptos y funciones que son útiles el 80% del tiempo. Ahora, la pregunta como analista es, ¿cómo empezar a implementar estadísticas?

Claro, puede implementar y practicar estos conceptos en lenguajes de programación como Python y R. Pero espere un segundo y piense: ¿cuál es la herramienta más utilizada en la mayoría de las organizaciones?

¡Es Microsoft Excel! Honestamente, Excel es la navaja suiza para profesionales de la analítica que lo ayuda a concentrarse en lo que es importante (estadísticas en nuestro caso) y maneja el resto de los cálculos y personalizaciones por sí mismo.

Este artículo es para todos los que están comenzando su viaje hacia las estadísticas usando Excel. Usaremos 10 funciones estadísticas clave en Excel para responder preguntas para una empresa de deportes ficticia, Khelo, mientras examinamos sus datos.

Si es un principiante en el mundo de la analítica y Excel, le recomiendo encarecidamente que siga estos cursos gratuitos:

Cómo abordaremos estas funciones estadísticas 1o en Excel

He dividido estas funciones estadísticas en Excel en dos categorías:

  • Funciones estadísticas básicas
  • Funciones estadísticas intermedias

¡Vamos a empezar!

Comprensión de los datos y el planteamiento del problema

Resolveremos algunas preguntas clave sobre nuestra empresa de indumentaria y equipamiento deportivo ficticio: Khelo. Estas son las columnas que tenemos:

  • Equipo
  • Número de artículos vendidos
  • Costo de cada artículo
  • % De descuento
  • Ingresos

pexels-jopwell-1325735-300x200-9491425

En el transcurso de este artículo, responderemos estas preguntas:

  1. ¿Cuántos artículos tienen descuento?
  2. ¿Cuántos artículos / equipos vende la tienda?
  3. ¿Cuál es la cantidad de productos vendidos sin descuento?
  4. ¿Hay productos vendidos que hayan costado más de 2000 junto con una tasa de descuento superior al 50%?
  5. ¿Cuál es el número medio de productos vendidos?
  6. ¿Cuál es la mediana del número de productos vendidos?
  7. ¿Cuál es el porcentaje de descuento más frecuente?
  8. ¿Cuál es la desviación estándar del número de productos vendidos?
  9. ¿Existe alguna relación entre la cantidad de productos vendidos y el porcentaje de descuento?

Funciones estadísticas básicas en Excel

MS Excel proporciona una variedad de funciones estadísticas útiles. Comencemos con algunas de las funciones básicas pero extremadamente poderosas. Honestamente, encontrará que está utilizando las funciones estadísticas básicas el 90% del tiempo y el 10% restante de su tiempo lo toman las funciones intermedias y avanzadas.

Hablaremos principalmente sobre los diferentes tipos de funciones de conteo aquí. Son muy similares a otras funciones como suma, máximo, mínimo, promedio.

1. Función de conteo

Usamos la función de conteo cuando necesitamos contar el número de celdas que contienen un número. Recordar SÓLO NÚMEROS! Veamos la función:

  • COUNT (valor1, [value2],…)

Entonces, intentemos encontrar la respuesta a nuestra primera pregunta: ¿Cuántos artículos tenían descuento?

excel-count-8779758

Hay 11 productos con descuento.

2. Función Counta

Mientras que la función de conteo solo cuenta los valores numéricos, la función CONTAR cuenta todas las celdas de un rango que no están vacías. La función es útil para contar celdas que contienen cualquier tipo de información, incluidos valores de error y texto vacío.

  • CONTAR (valor1, [value2],…)
Responderemos la segunda pregunta utilizando la función countta, ya que puede contar todos los valores que no están vacíos: ¿cuántos artículos / equipos vende la tienda?
excel-counta-3754656
El número total de artículos vendidos por la tienda es 13.

3. Countblank

los COUNTBLANK La función cuenta el número de celdas vacías en un rango de celdas. Las celdas con fórmulas que devuelven texto vacío también se cuentan aquí, pero las celdas con valores cero no se cuentan. Esta es una gran función para resumir celdas vacías mientras se analizan los datos.

Resumir las celdas vacías es el requisito para nuestra tercera pregunta: ¿Qué productos no están en la sección de descuento? ¡Apliquemos la función!
excel-countblamk-6550682

Solo hay 2 artículos sin descuento.

4. Función Countifs

Countifs es una de las funciones estadísticas más utilizadas en Excel. La función CONTAR.SI aplica una o más condiciones a las celdas en el rango dado y devuelve solo aquellas celdas que cumplen con todas las condiciones.

  • COUNTIFS (rango_criterios1, criterios1, [criteria_range2, criteria2]…)
Nota: Cada nuevo rango debe tener el mismo número de filas y columnas que el rango_criterios1 argumento. Los rangos no tienen que ser adyacentes entre sí.
Esta función parece perfecta para responder a la cuarta pregunta: ¿Hay productos vendidos que hayan costado más de 2000 junto con una tasa de descuento superior al 50%?
excel-countifs-8271563
Las preguntas parecían complejas, pero fue muy fácil encontrar la respuesta en Excel. Solo 1 producto, es decir, zapatillas, cuesta más de 2000 y se vende a una tasa de descuento superior al 20%.
Maravilloso, ¿no? Hemos analizado algunas funciones estadísticas básicas en MS Excel hasta ahora. A continuación, echemos un vistazo a las funciones estadísticas intermedias.

Funciones estadísticas intermedias en Excel

Aquí discutiremos algunas de las funciones estadísticas intermedias en MS Excel relacionadas con la tendencia central y la dispersión. Estas funciones son muy útiles en nuestro día a día como analista.

5. Función promedio

La función más común que usamos habitualmente en nuestra vida diaria es la media (o media). La función PROMEDIO simplemente devuelve la media aritmética de todas las celdas en un rango dado:

  • PROMEDIO (número1, [number2],…)
Pero hay un simple inconveniente de usar promedios: son propensos a valores atípicos. Por lo tanto, pueden pintar una imagen muy poco realista en nuestro análisis. Averigüemos la cantidad promedio de bienes vendidos: dispersos
excel-avg-6923148
El promedio resulta ser ~ 365,2. También haremos cálculos similares para el costo.
average-7471306

6. Función mediana

El problema de los valores atípicos se puede resolver utilizando otra función para la tendencia central: la mediana. La función mediana devuelve el valor medio del rango de celdas dado. La sintaxis es bastante simple:

  • MEDIANA (número1, [number2],…)
Encontremos la mediana de la cantidad de productos vendidos en nuestra tienda de deportes y veamos qué tan cerca está de nuestro valor promedio:
excel-median-7966583
Vemos que la mediana resulta ser ~ 320, que está bastante cerca del valor promedio. Significa que no hay mucha fluctuación en nuestros datos. Veamos si este es el caso del costo de los bienes:
median-3867810
La mediana y el valor promedio del costo de cada artículo varían mucho. Por ejemplo, el costo de una pelota es 50 pero el costo de un bate es 2000, lo que resulta en una alta dispersión.

7. Función de modo

Para valores numéricos, la media y la mediana suelen ser suficientes, pero ¿qué pasa con los valores categóricos? Aquí, el modo entra en escena. El modo devuelve el valor más frecuente y repetido en el rango de valores dado:

  • MODE.SNGL (número1,[number2],…)
Nota: MODE.SNGL devuelve solo un valor, mientras que MODE.MULT devuelve una matriz de los valores más comunes.

Bueno, este es uno simple. Encontremos el valor de descuento más frecuente otorgado por la tienda de deportes:

excel-mode-5221583
Este valor de descuento es del 10%.

8. Función de desviación estándar

La desviación estándar es una de las formas de cuantificar la dispersión. Es una medida de la dispersión de los valores del valor medio.

Aquí, usaremos la función STDEV.P que se usa para calcular la desviación estándar basada en la población completa dada como argumentos:

  • STDEV.P (número1,[number2],…)
Nota: La función DESVEST.P asume que sus argumentos son la población completa. Si ese no es el caso, puede usar la función STDEV.S ().
Para un tamaño de muestra grande, la desviación estándar de la población y las muestras devolverá valores aproximadamente similares. Previamente, hemos calculado la media y la mediana para tener una idea de la tendencia central. Averigüemos la desviación estándar para ver el nivel de dispersión:
excel-stdev-5719843stdev-5699933
Como se esperaba, la desviación estándar de la cantidad vendida es menor, lo que significa que la dispersión es menor mientras que la desviación estándar del costo de los productos es alta.

9. Funciones de cuartiles

Esta es otra función con abundantes aplicaciones en la industria. Nos ayuda a dividir la población en grupos. QUARTILES.INC devuelve el cuartil de un conjunto de datos, basado en valores de percentiles de 0 a 1, inclusive.

Por ejemplo, puede utilizar esta función para conocer el 25% superior de su base de clientes.

  • CUARTIL.INC (matriz, cuarto)

10. Función de correlación

La función CORREL () es mi favorita personal. Proporciona información realmente poderosa que no es obvia a simple vista. los CORREL La función devuelve el coeficiente de correlación de dos rangos de celdas. ¿Pero que es eso? Básicamente, nos dice qué tan fuerte es la relación entre las dos variables.

Nota: No muestra ninguna relación de causa y efecto.

El rango de valor de correlación está entre -1 y 1.

Vayamos a nuestra última y más interesante pregunta: ¿existe alguna relación entre la cantidad de bienes vendidos y el porcentaje de descuento?

excel-correl-3765448

Bueno, la correlación resulta ser ~ 0.8, que es bastante alta. Parece que estos están relacionados positivamente, lo que significa más descuento, más cantidad vendida.

Notas finales

En este artículo, analizamos más de 10 funciones estadísticas para principiantes e intermedios en MS Excel, que van desde recuento simple () hasta correl avanzado (). La estadística es una de las herramientas más importantes en el kit de un analista y puede lograr muchos de sus objetivos estadísticos simplemente usando Excel.

Le recomiendo que consulte los siguientes recursos adicionales en Excel:

Cubriré funciones estadísticas avanzadas en el futuro. Déjeme saber algunas de sus funciones estadísticas favoritas e intentaré incorporarlas en mis próximos artículos.