Análise exploratória de dados (EDA) Desde cedo

Conteúdo

Introdução

exponential-data-analysis-7832438

Análise exploratória de dados (EDA)

Manejar valor faltante
– Remover duplicatas
Tratamiento de valores atípicos
Normalização y escalado (variables numéricas)
– Codificação de variáveis ​​categóricas (variáveis falsas)
– Análise bivariada

19w3vwi8mxoq-o-e2sqy8sa-6575184
1r2am-y3spq5zr0uqv_jn8w-1927261

Diagrama de caja después de eliminar valores atípicos

  1. 1szh0jvldjuy4giw6eqpmnw-9714154

  2. 19ro75ahgifhchuucmdr-gq-5802884

    1wenfumtud7-uuwumoyfgag-6208749

  3. 1tt9gcgywxds5on-jkyvbfg-4278093

1trqxavmlxmx6wotiyyrfua-3816054

1fl-t0jz44ut4pue_lcvsmg-2567669

1fywb0gmnhcanrz88si1zfa-7796749

1adetm64zyfcgcs9vr62qow-9271201

Manejo de registros duplicados

1bevbr5aefkcpvnyvmn7oaq-4345751

1ssw-f5x7dv5vs4ptgethrg-4771750

1sc8rigixtehv2k-k3_dcxg-6185536

Tratamento de outliers

13dahuoteomzyrlel2e_gba-6106036

Diagrama de caja antes de eliminar valores atípicos

121yw90ga0dfxlzdzs6f_ca-1429381

1r2am-y3spq5zr0uqv_jn8w-1927261

Análise bivariada

  1. Dos variables categóricas

    1. Gráfico de barras
    2. Gráfico de barras agrupadas
    3. Gráfico de puntos

1aqfnkea591trjfpom6sc_g-3290719

Correlación entre todas las variables

Normalizar y escalar

1l_md5imwoiipm7eu3feopg-8826867

11biyzv2s6rzpemep6jcmog-3273117

CODIFICACIÓN

17pezd8ftpk_t7kzsnjozya-9632233

1rn-cyrzynhh6gqhxs48njg-1878424

1lzl75byxk6k-jjx4ltbzww-4704033

Sobre o autor

ritika_photo-4510066

Ritika SinghCientífica de datos

Soy un científico de datos de profesión y un blogger por pasión. He trabajado en proyectos de aprendizaje automático durante más de 2 anos. Aquí encontrará artículos sobre “Machine Learning, Estatisticas, Aprendizado Profundo, PNL e Inteligencia Artificial”.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.