L'analyse exploratoire des données (AED) à partir de zéro

Contenu

introduction

analyse-données-exponentielles-7832438

L'analyse exploratoire des données (AED)

– Gérer la valeur manquante
– Supprimer les doublons
– Traitement des valeurs aberrantes
– Normalisation et mise à l'échelle (variables numériques)
– Codage des variables catégorielles (variables muettes)
– Analyse bivariée

19w3vwi8mxoq-o-e2sqy8sa-6575184
1r2am-y3spq5zr0uqv_jn8w-1927261

Box plot après suppression des valeurs aberrantes

  1. 1szh0jvldjuy4giw6eqpmnw-9714154

  2. 19ro75ahgifhchuucmdr-gq-5802884

    1wenfumtud7-uuwumoyfgag-6208749

  3. 1tt9gcgywxds5on-jkyvbfg-4278093

1trqxavmlxmx6wotiyyrfua-3816054

1à t0jz44ut4pue_lcvsmg-2567669

1fywb0gmnhcanrz88si1zfa-7796749

1adetm64zyfcgcs9vr62qow-9271201

Gestion des enregistrements en double

1bevbr5aefkcpvnyvmn7oaq-4345751

1ssw-f5x7dv5vs4ptgethrg-4771750

1sc8rigixtehv2k-k3_dcxg-6185536

Traitement des valeurs aberrantes

13dahuoteomzyrlel2e_gba-6106036

Box plot avant suppression des valeurs aberrantes

121yw90ga0dfxlzdzs6f_ca-1429381

1r2am-y3spq5zr0uqv_jn8w-1927261

Analyse bivariée

  1. Deux variables catégorielles

    1. Graphique à barres
    2. Graphique à barres groupées
    3. Graphique à points

1aqfnkea591trjfpom6sc_g-3290719

Corrélation entre toutes les variables

Normaliser et mettre à l'échelle

1l_md5imwoiipm7eu3feopg-8826867

11biyzv2s6rzpemep6jcmog-3273117

CODAGE

17pezd8ftpk_t7kzsnjozya-9632233

1rn-cyrzynhh6gqhxs48njg-1878424

1lzl75byxk6k-jjx4ltbzww-4704033

A propos de l'auteur

ritika_photo-4510066

Ritika Singh | – Data scientist

Je suis data scientist de profession et blogueur par passion. J'ai travaillé sur des projets d'apprentissage automatique pendant plus de 2 ans. Vous trouverez ici des articles sur « L'apprentissage automatique, Statistiques, L'apprentissage en profondeur, PNL et Intelligence Artificielle".

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.