Explorative Datenanalyse (EDA) von Anfang an

Inhalt

Einführung

exponentielle-datenanalyse-7832438

Explorative Datenanalyse (EDA)

– Fehlenden Wert behandeln
– Duplikate entfernen
– Behandlung von Ausreißern
– Normalisierung und Skalierung (numerische Variablen)
– Codierung kategorialer Variablen (Dummy-Variablen)
– Bivariate Analyse

19w3vwi8mxoq-o-e2sqy8sa-6575184
1r2am-y3spq5zr0uqv_jn8w-1927261

Boxplot nach Entfernen von Ausreißern

  1. 1szh0jvldjuy4giw6eqpmnw-9714154

  2. 19ro75ahgifhchuucmdr-gq-5802884

    1wenfumtud7-uuwumoyfgag-6208749

  3. 1tt9gcgywxds5on-jkyvbfg-4278093

1trqxavmlxmx6wotiyyrfua-3816054

1bei t0jz44ut4pue_lcvsmg-2567669

1fywb0gmnhcanrz88si1zfa-7796749

1adetm64zyfcgcs9vr62qow-9271201

Umgang mit doppelten Datensätzen

1bevbr5aefkcpvnyvmn7oaq-4345751

1ssw-f5x7dv5vs4ptgethrg-4771750

1sc8rigixtehv2k-k3_dcxg-6185536

Umgang mit Ausreißern

13dahuoteomzyrrel2e_gba-6106036

Boxplot vor dem Entfernen von Ausreißern

121yw90ga0dfxlzdzs6f_ca-1429381

1r2am-y3spq5zr0uqv_jn8w-1927261

Bivariate Analyse

  1. Zwei kategoriale Variablen

    1. Balkengrafik
    2. Gruppiertes Balkendiagramm
    3. Punktdiagramm

1aqfnkea591trjfpom6sc_g-3290719

Korrelation zwischen allen Variablen

Normalisieren und skalieren

1l_md5imwoiipm7eu3feopg-8826867

11biyzv2s6rzpemep6jcmog-3273117

CODIERUNG

17pezd8ftpk_t7kzsnjozya-9632233

1rn-cyrzynhh6gqhxs48njg-1878424

1lzl75byxk6k-jjx4ltbzww-4704033

Über den Autor

ritika_photo-4510066

Ritika Singh | – Datenwissenschaftler

Ich bin von Beruf Data Scientist und Blogger aus Leidenschaft. Ich arbeite seit mehr als an Machine-Learning-Projekten 2 Jahre. Hier finden Sie Artikel zum Thema „Maschinelles Lernen“, Statistiken, Tiefes Lernen, NLP und Künstliche Intelligenz".

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.