Análisis de datos exploratorios (EDA) desde cero

Contenidos

Introducción

exponential-data-analysis-7832438

Análisis de datos exploratorios (EDA)

– Manejar valor faltante
– Eliminar duplicados
– Tratamiento de valores atípicos
Normalización y escalado (variables numéricas)
– Codificación de variables categóricas (variables ficticias)
– Análisis bivariado

19w3vwi8mxoq-o-e2sqy8sa-6575184
1r2am-y3spq5zr0uqv_jn8w-1927261

Diagrama de caja después de eliminar valores atípicos

  1. 1szh0jvldjuy4giw6eqpmnw-9714154

  2. 19ro75ahgifhchuucmdr-gq-5802884

    1wenfumtud7-uuwumoyfgag-6208749

  3. 1tt9gcgywxds5on-jkyvbfg-4278093

1trqxavmlxmx6wotiyyrfua-3816054

1fl-t0jz44ut4pue_lcvsmg-2567669

1fywb0gmnhcanrz88si1zfa-7796749

1adetm64zyfcgcs9vr62qow-9271201

Manejo de registros duplicados

1bevbr5aefkcpvnyvmn7oaq-4345751

1ssw-f5x7dv5vs4ptgethrg-4771750

1sc8rigixtehv2k-k3_dcxg-6185536

Manejo de valores atípicos

13dahuoteomzyrlel2e_gba-6106036

Diagrama de caja antes de eliminar valores atípicos

121yw90ga0dfxlzdzs6f_ca-1429381

1r2am-y3spq5zr0uqv_jn8w-1927261

Análisis bivariado

  1. Dos variables categóricas

    1. Gráfico de barras
    2. Gráfico de barras agrupadas
    3. Gráfico de puntos

1aqfnkea591trjfpom6sc_g-3290719

Correlación entre todas las variables

Normalizar y escalar

1l_md5imwoiipm7eu3feopg-8826867

11biyzv2s6rzpemep6jcmog-3273117

CODIFICACIÓN

17pezd8ftpk_t7kzsnjozya-9632233

1rn-cyrzynhh6gqhxs48njg-1878424

1lzl75byxk6k-jjx4ltbzww-4704033

Sobre el Autor

ritika_photo-4510066

Ritika Singh – Científica de datos

Soy un científico de datos de profesión y un blogger por pasión. He trabajado en proyectos de aprendizaje automático durante más de 2 años. Aquí encontrará artículos sobre “Machine Learning, Estadísticas, Deep Learning, PNL e Inteligencia Artificial”.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.