Analisi esplorativa dei dati (EDA) sin dall'inizio

Contenuti

introduzione

esponenziale-data-analysis-7832438

Analisi esplorativa dei dati (EDA)

– Gestire il valore mancante
– puoi personalizzarlo in base alle tue particolari esigenze per comunicare il messaggio desiderato
– Trattamento dei valori anomali
Normalizzazione y escalado (variabili numeriche)
– Codifica di variabili categoriali (Variabili fittizie)
– Analisi bivariata

19W3vwi8MXOQ-O-E2Sqy8SA-6575184
1R2AM-y3spq5zr0uqv_jn8w-1927261

Diagramma box dopo la rimozione dei valori anomali

  1. 1szh0jvldjuy4giw6eqpmnw-9714154

  2. 19RO75AHGIFHCHUUCMDR-GQ-5802884

    1wenfumtud7-uuwumoyfgag-6208749

  3. 1TT9GCGYWXds5on-jkyvbfg-4278093

1trqxavmlxmx6wotiyyrfua-3816054

1FL-t0jz44ut4pue_lcvsmg-2567669

1fywb0gmnhcanrz88si1zfa-7796749

1adetm64zyfcgcs9vr62qow-9271201

Gestione di record duplicati

1bevbr5aefkcpvnyvmn7oaq-4345751

1SSW-F5x7DV5VS4PTGETHRG-4771750

1SC8rigixtehv2K-k3_dcxg-6185536

Gestione degli outlier

13dahuoteomzyrlel2e_gba-6106036

Diagramma della casella prima di rimuovere i valori anomali

121yw90ga0dfxlzdzs6f_ca-1429381

1R2AM-y3spq5zr0uqv_jn8w-1927261

Analisi bivariata

  1. Due variabili categoriali

    1. Grafico a barre
    2. Grafico a barre raggruppato
    3. Grafico a punti

1aqfnkea591trjfpom6sc_g-3290719

Correlazione tra tutte le variabili

Normalizzazione e scalabilità

1l_md5imwoiipm7eu3feopg-8826867

11BiYZV2S6RZPEMEP6JCMoG-3273117

CODIFICAZIONE

17pezd8ftpk_t7kzsnjozya-9632233

1RN-CYRZYNHH6GQHXS48NJG-1878424

1LZL75BYXK6K-JJX4LTBZWW-4704033

Circa l'autore

ritika_photo-4510066

Ritika Singh – Scienziato dei dati

Sono un data scientist di professione e un blogger per passione. Ho lavorato su progetti di machine learning per più di 2 anni. Qui troverai articoli su "Machine Learning", Statistiche, Apprendimento profondo, PNL e Intelligenza Artificiale".

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.