Prueba de hipótesis | Prueba de hipótesis para principiantes en ciencia de datos

Contenidos

Este artículo fue publicado como parte del Blogatón de ciencia de datos.

Introducción

untitled-design-4-8851911

Antes de ir a eso, sepamos qué significa exactamente Hipótesis:

“La hipótesis se describe como una solución recomendada para un incidente indefinible que no entra en la teoría actual”.

La definición real de prueba de hipótesis es mediante la cual un analista prueba una suposición con respecto a un parámetro de población. La metodología retenida por el analista depende de la naturaleza de los datos utilizados y el motivo del análisis.

problem-5283606

Prueba de hipótesis

Pasos para realizar la prueba de hipótesis:

  1. Definir hipótesis nula y alternativa

  2. Examinar datos, verificar suposiciones

  3. Calcular estadística de prueba

  4. Determine el valor p correspondiente

  5. Toma una decisión sobre la hipótesis nula.

Para realizar todos estos pasos, tomemos un ejemplo para entenderlo fácilmente.

Problema: Teniendo en cuenta a los adultos italianos del grupo de edad de 18 a 30 años que viven en Italia, ¿los hombres tienen un índice de masa corporal (IMC) medio significativamente más alto que las mujeres?

Aquí la población son adultos italianos (18-30) en Italia y el parámetro de interés es el índice de masa corporal (IMC)

Paso 1: definir hipótesis

  • Nulo: No hay diferencia en el IMC medio
    H (0): U1= U2 [U1 represents the population mean BMI for Males and U2 represents the population mean BMI for females]
    Aquí H (0) dice que son iguales entre sí
  • Alternativa: hay una diferencia significativa en el IMC medio
    H (A): U1=U2 [U1 represents the population mean BMI for Males and U2 represents the population mean BMI for females]

    Aquí H (A) dice que no son iguales entre sí

  • Nivel de significancia = 5%

Paso 2: examinar los datos y verificar los supuestos

En este paso, los datos se filtraron para incluir solo a los adultos italianos que tenían entre 18 y 30 años. Después de esto, necesitamos hacer algunos cálculos estadísticos como la media, el mínimo, el máximo, la desviación estándar y el tamaño de la muestra tanto para hombres como para hembras.

Algunas de las suposiciones que debemos verificar son las siguientes:

  • Las muestras se consideran muestras aleatorias simples
  • Las muestras son independientes entre sí
  • Ambas poblaciones de respuestas son aproximadamente normales o los tamaños de muestra son lo suficientemente grandes.

Paso 3: Calcular la estadística de prueba:

La estadística de prueba es una medida de qué tan lejos está nuestra estadística de muestra de nuestro parámetro de población hipotetizado, en términos de errores estándar estimados.

  • Z = Mejor estimación – valor nulo / error estándar estimado
  • La mejor estimación es la diferencia entre la media de la muestra estadística masculina y femenina
  • El valor nulo es el valor nulo hipotético
  • El error estándar estimado para dos medias puede cambiar según el enfoque que vayamos a utilizar.
  • Los dos enfoques que puede utilizar son el enfoque agrupado y el enfoque no agrupado.
  • El enfoque combinado consiste en que se supone que la varianza de dos poblaciones son iguales.
  • El enfoque no agrupado consiste en eliminar el supuesto de varianzas iguales.

Paso 4: Determinación del valor P:

El valor p se determina asumiendo que la hipótesis nula es verdadera, es la probabilidad de observar una estadística de prueba de un valor (Z) o más extremo.

Entonces vamos a calcular esta probabilidad usando la distribución Z donde dF = n1+ n2-2

necesitamos verificar ambos lados ya que es una hipótesis alternativa de dos lados porque nuestra alternativa no es igual también. por lo tanto, tenemos que verificar tanto la cola superior como la inferior de nuestra distribución.

El gráfico de distribución se ve como se muestra a continuación con su tamaño de muestra correspondiente y los grados de libertad:

28679p-value-8901206

Curva de distribucion

En el gráfico anterior, podemos ver tanto nuestro valor estadístico de prueba positivo como por debajo del valor estadístico de prueba negativo. Esto significa que si la diferencia en el IMC medio de la población entre hombres y mujeres fue realmente cero, entonces si esa hipótesis nula fuera cierta, entonces es bastante probable observar una diferencia en las medias muestrales del valor estadístico de la prueba o algo más extremo. Hay casi un 20 por ciento de posibilidades de ver que debido a que este valor es tan grande, vamos a seguir adelante y no rechazaremos el valor nulo.

Paso 5: tome una decisión

Si el valor P es mayor que el nivel de significancia, lo que significa que hay evidencia débil contra el valor nulo. Por tanto, no rechazamos la hipótesis nula.

Entonces, en resumen, las pruebas de hipótesis se utilizan para poner a prueba teorías sobre un parámetro de interés. Aquí, ese parámetro es la diferencia en las medias poblacionales. Los pasos básicos para realizar esta prueba de hipótesis. Primero, vamos a definir nuestras hipótesis. Luego, examinaremos nuestros datos mientras verificamos nuestras suposiciones y calculamos nuestra estadística de prueba. Con esta estadística de prueba, determinaremos nuestro valor p correspondiente y, finalmente, tomaremos una decisión basada en este valor.

Los supuestos para la prueba t de dos muestras para las medias poblacionales son que necesitamos que ambos conjuntos de datos sean dos muestras aleatorias simples y que sean independientes entre sí. Necesitamos asegurarnos de que ambas poblaciones de respuestas estén distribuidas normalmente. De lo contrario, debemos asegurarnos de tener al menos un tamaño de muestra grande para que podamos aplicar el teorema del límite central. Si nuestras variaciones de población son iguales o no, también es crucial para determinar si usamos un enfoque agrupado o no agrupado. Finalmente, necesitamos saber cómo interpretar el valor p, la decisión y nuestra conclusión final. Todos estos son muy importantes al realizar una prueba de hipótesis.

Para obtener más artículos, consulte este perfil:

https://likhithakakanuru.medium.com/

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.