Tipos de datos en estadísticas | Datos cualitativos vs cuantitativos

Contenidos

Este artículo fue publicado como parte del Blogatón de ciencia de datos

Introducción

En Ciencia de los datos, nuestro objetivo es realizar diferentes experimentos con datos sin procesar y encontrar algunos buenos conocimientos a partir de los datos. Para impulsar cualquier negocio por el camino correcto, los datos son muy importantes o podemos decir que «Los datos son el combustible». Al menos puede proporcionar información útil que puede ayudar a:

  • Estrategias de campañas actuales,
  • Organice fácilmente el lanzamiento de nuevos productos o
  • Prueba diferentes experimentos.

En todas las cosas mencionadas anteriormente, el único componente de conducción común son los datos. Estamos entrando en la era digital en la que producimos una gran cantidad de datos todos los días.

Por ejemplo, Diariamente, una empresa como Flipkart produce más de 2 TB de datos.

Debido a la gran importancia de los datos en nuestra vida, se vuelve muy importante almacenar y procesar correctamente estos datos sin ningún error. Al tratar con conjuntos de datos, el tipo de datos o la categoría de los datos juega un papel importante para encontrar la respuesta a las siguientes preguntas:

  • Qué estrategia de preprocesamiento funcionaría para un conjunto en particular para obtener los resultados correctos, o
  • Qué tipo de análisis estadístico se debe aplicar para obtener los mejores resultados.

Entonces, en este artículo, discutiremos los diferentes tipos de datos en estadísticas que necesita saber para hacer Análisis de datos exploratorios (EDA), que es uno de los componentes más importantes en la tubería de un proyecto de aprendizaje automático.

37_1-4323362

Fuente de la imagen: imágenes de Google

Tabla de contenido

1. Introducción a los tipos de datos en estadística y su importancia

2. Datos cualitativos vs cuantitativos

3. Datos cualitativos

  • Datos nominales
  • Datos ordinales

4. Datos cuantitativos

  • Datos discretos
  • Datos continuos
  • Datos de intervalo
  • Datos de relación

Introducción a los tipos de datos en estadística

En estadística, los tipos de datos juegan un papel muy crucial e importante, que debe entenderse, para aplicar las mediciones estadísticas correctamente a sus datos para que podamos concluir correctamente ciertas suposiciones sobre los datos.

De manera similar, necesitamos saber en qué análisis de datos y su tipo está trabajando para seleccionar la técnica de percepción correcta, ya que los diferentes tipos de datos se consideran como un enfoque para organizar varios tipos de variables.

Mientras se hace Análisis de datos exploratorios (EDA) En un proyecto de ciencia de datos general, es crucial tener una buena comprensión de los diferentes tipos de datos, ya que podemos usar ciertas medidas estadísticas solo para tipos de datos específicos.

También se conoce como el Escala de medición.

Al tratar con cualquiera de los tipos de datos, también necesitamos saber qué método de visualización se ajusta al tipo de datos en particular.

Podemos pensar en los tipos de datos como una forma de categorizar diferentes tipos de variables.

Datos cuantitativos vs cualitativos

Datos cuantitativos

1. Estos tipos de datos parecen ser los más fáciles de explicar. Intenta encontrar las respuestas a preguntas como

  • «Cuantos,
  • «Cuánto» y
  • «Con qué frecuencia»

2. Puede expresarse como un número, por lo que puede cuantificarse. En palabras simples, se puede medir mediante variables numéricas.

3. Estos se abren fácilmente para la manipulación estadística y se pueden representar mediante una amplia variedad de tipos estadísticos de gráficos y tablas como gráficos de líneas, gráficos de barras, gráfico de dispersiónetc.

Ejemplos de datos cuantitativos:

  • Puntuaciones de pruebas y exámenes, p. Ej. 74, 67, 98, etc.
  • El peso de una persona.
  • La temperatura en una habitación.

Hay 2 tipos generales de datos cuantitativos:

  • Datos discretos
  • Datos continuos

Datos cualitativos

1. Los datos cualitativos no se pueden expresar como un número, por lo que no se pueden medir. Se compone principalmente de palabras, imágenes y símbolos, pero no números.

2. También se conoce como Datos categóricos ya que la información se puede ordenar por categoría, no por número.

3. Estos pueden responder preguntas como:

  • «Cómo ha sucedido esto», o
  • “Por qué ha sucedido esto”.

Ejemplos de datos cualitativos:

  • Colores, por ejemplo, el color del mar.
  • Destinos de vacaciones populares como Suiza, Nueva Zelanda, Sudáfrica, etc.
  • Origen étnico como indio americano, asiático, etc.

En general, existen 2 tipos de datos cualitativos:

  • Datos nominales
  • Datos ordinales.


Datos cualitativos

Datos nominales

1. Este tipo de datos se utiliza solo para etiquetar variables, sin tener ningún valor cuantitativo. Aquí, el término ‘nominal’ proviene de la palabra latina «no hombre» lo que significa ‘nombre’.

2. Simplemente nombra una cosa sin solicitar ningún pedido en particular. Los datos nominales a veces denominados «etiquetas».

Ejemplos de datos nominales:

  • Género (mujeres, hombres)
  • Color de cabello (rubio, castaño, moreno, rojo, etc.)
  • Estado civil (casado, soltero, viudo)

Como puede observar en los ejemplos, no existe un orden intrínseco para las variables.

El color de los ojos es una variable nominal que tiene unos pocos niveles o categorías como Azul, Verde, Marrón, etc. y no hay forma posible de ordenar estas categorías de manera jerárquica, es decir, de mayor a menor o viceversa.

slide_16-8593825

Fuente de la imagen: imágenes de Google

Datos ordinales

1. La diferencia crucial con los tipos nominales de datos es que Ordinal Data muestra dónde está presente un número en un orden particular.

2. Este tipo de datos se coloca en algún tipo de orden según su posición en una escala. Los datos ordinales pueden indicar superioridad.

3. No podemos hacer operaciones aritméticas con datos ordinales porque solo muestran la secuencia.

4. Las variables ordinales se consideran variables cualitativas y cuantitativas “intermedias”.

5. En palabras simples, podemos entender los datos ordinales como datos cualitativos para los que se ordenan los valores.

6. En comparación con los datos nominales, el segundo son datos cualitativos cuyos valores no se pueden colocar en un pedido.

7. Según la posición relativa, también podemos asignar números a los datos ordinales. Pero no podemos hacer matemáticas con esos números. Por ejemplo, «Primero, segundo, tercero … etc.»

Ejemplos de datos ordinales:

  • Ranking de usuarios en una competición: El primero, segundo y tercero, etc.
  • Calificación de un producto tomada por la empresa en una escala del 1 al 10.
  • Situación económica: baja, media y alta.

Encuestas de satisfacción de empleados y datos ordinales |  Ajustar tipos de datos de encuestas en estadísticas

Fuente de la imagen: imágenes de Google

Datos cuantitativos

Datos discretos

1. Muestra el recuento que involucra solo números enteros y no podemos subdividir los valores discretos en partes.

Por ejemplo, el número de estudiantes en una clase es un ejemplo de datos discretos, ya que podemos contar individuos completos pero no podemos contar como 2.5, 3.75, niños.

2. En palabras simples, los datos discretos pueden tomar solo ciertos valores y las variables de datos no se pueden dividir en partes más pequeñas.

3. Tiene un número limitado de valores posibles por ejemplo, días del mes.

Ejemplos de datos discretos:

  • El número de estudiantes en una clase.
  • El número de trabajadores de una empresa.
  • La cantidad de preguntas de la prueba que respondió correctamente.

barchartsfordiscretedata-5402025

Fuente de la imagen: imágenes de Google

Datos continuos

1. Representa la información que podría dividirse de manera significativa en sus niveles más finos. Se puede medir en una escala o continuo y puede tener casi cualquier valor numérico.

Por ejemplo, Podemos medir nuestra altura a escalas muy precisas en diferentes unidades como metros, centímetros, milímetros, etc.

2. La diferencia clave entre los tipos de datos continuos y discretos es que en el primero, podemos registrar datos continuos en tantas medidas diferentes como ancho, temperatura, tiempo, etc.

3. Las variables continuas pueden tomar cualquier valor entre dos números. Por ejemplo, entre el rango de 60 y 82 pulgadas, hay millones de alturas posibles como 62.04762 pulgadas, 79.948376 pulgadas, etc.

4. Una buena regla para definir si los datos son continuos o discretos es que si el punto de medición se puede reducir a la mitad y aún así tiene sentido, los datos son continuos.

Ejemplos de datos continuos:

  • La cantidad de tiempo necesaria para completar un proyecto.
  • La altura de los niños.
  • La velocidad de los coches.

continuousdatabarchart-example-3808905 Fuente de la imagen: imágenes de Google

Datos de intervalo

1. Estos tipos de datos se pueden medir y se ordenan con los elementos más cercanos, pero no tienen un cero significativo.

Entendamos el significado de «Escala de intervalo»:

En la escala de intervalo, el término ‘intervalo’ significa espacio en el medio, lo cual es algo significativo para recordar, ya que las escalas de intervalo no solo nos educan sobre el orden, sino que además brindan información sobre el valor entre cada elemento.

2. Básicamente, podemos mostrar los datos de intervalo de la misma manera que los datos de razón, pero lo que debemos tener en cuenta es sus puntos cero caracterizados.

3. Por lo tanto, con la ayuda de los datos de intervalo, podemos correlacionar fácilmente los grados de los datos y también sumar o restar los valores.

4. Hay algunas estadísticas descriptivas que podemos calcular para datos de intervalo como:

  • Medidas centrales de tendencia (media, mediana, moda)
  • Rango (mínimo, máximo)
  • Propagación (percentiles, rango intercuartílico y desviación estándar).

Estas no son las únicas cosas estadísticas que se deben calcular, pero también podemos calcular más cosas.

Ejemplos de datos de intervalo:

  • Temperatura (° C o F, pero no Kelvin)
  • Fechas (1055, 1297, 1976, etc.)
  • Intervalo de tiempo en un reloj de 12 horas (6 a. M., 6 p. M.)

Datos de relación

1. Estos datos también están en las unidades ordenadas que tienen la misma diferencia.

2. Los valores de razón son los mismos que los valores de intervalo, pero la única diferencia es que los datos de razón tienen un cero absoluto. Por ejemplo, altura, peso, longitud, etc.

3. Estos se miden y ordenan con elementos equidistantes con un cero significativo y nunca serán negativos como los datos de intervalo.

Entendamos esto con un ejemplo sobresaliente: Medida de alturas.

La altura se puede medir en unidades como centímetros, pulgadas, metros o pies y no es posible tener un valor negativo de altura.

4. Nos ilumina en cuanto al orden de las variables, los contrastes entre ellas, y tienen absolutamente cero.

5. Los datos de razón son fundamentalmente los mismos que los datos de intervalo, aparte de cero significa ninguno.

6. Los estadísticos descriptivos que podemos calcular para los datos de razón son los mismos que los datos de intervalo como:

  • Medidas centrales de tendencia (media, mediana, moda)
  • Rango (mínimo, máximo)
  • Propagación (percentiles, rango intercuartílico y desviación estándar).

Ejemplo de datos de relación:

  • Edad (de 0 años a 100+)
  • Temperatura (en Kelvin, pero no en ° C o F)
  • Intervalo de tiempo (medido con cronómetro o similar)

Para los ejemplos anteriores de datos de razón, vemos que hay un punto cero real y significativo como la edad de una persona, el cero absoluto, la distancia calculada desde un punto o tiempo específico, todos tienen ceros reales.

NOTA:

Si elegimos el punto cero de la escala subjetivamente, entonces en ese punto los datos no pueden ser datos de razón y deberían ser datos de intervalo.

Notas finales

¡Gracias por leer!

Espero que haya disfrutado del artículo y haya aumentado sus conocimientos sobre los tipos de datos en estadística.

Por favor no dude en ponerse en contacto conmigo sobre Correo electrónico

¿Algo no mencionado o quieres compartir tus pensamientos? No dude en comentar a continuación y me pondré en contacto con usted.

Para los artículos restantes, consulte el Enlace.

Sobre el Autor

Aashi Goyal

Actualmente, estoy cursando mi Licenciatura en Tecnología (B.Tech) en Ingeniería Electrónica y de Comunicación de Universidad Guru Jambheshwar (GJU), Hisar. Estoy muy entusiasmado con la estadística y la ciencia de datos.

Los medios que se muestran en este artículo sobre tipos de datos en estadísticas no son propiedad de Analytics Vidhya y se utilizan a discreción del autor.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.