Beginnend mit Kaggle | Der erste Blick auf Kaggle

Teilen auf Facebook
Teilen auf twittern
Teilen auf verlinktin
Teilen auf Telegramm
Teilen auf WhatsApp

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon

Einführung

Jede aktuelle Karriere braucht eine Gemeinschaft, eine Gruppe von Menschen, mit denen wir über die Arbeit sprechen können, die Fehler, Ideen und lernen. Kaggle ist die weltweit größte und beliebteste Data-Science-Community. Eine solche Gemeinschaft zu haben, hilft uns zu fühlen, dass wir "dazu gehören", was eines der entscheidenden Gefühle für unser soziales Miteinander und unsere Gesundheit ist.

In diesem Artikel, wir werden Kaggle als komplette Community und Kaggle als Plattform sehen: all seine verschiedenen Werkzeuge, Dienstleistungen und Ressourcen zur Verfügung, damit wir lernen mögen Datenwissenschaft praktizieren.

Sehen wir uns die Benutzeroberfläche an, die wir erhalten, wenn wir Kaggle zum ersten Mal besuchen.

56769Screenshot20357-4251898

Bevor Sie Kaggle verwenden, Wir müssen ein Konto erstellen und uns dann anmelden, Sie können beide Optionen in der oberen rechten Ecke sehen. Sobald ich damit fertig bin, so könnte es aussehen.

90248Screenshot20358-2029611

Einige der hier sichtbaren Dinge können für Sie anders sein, da die Benutzeroberfläche so angepasst ist, wie ich Kaggle bisher verwendet habe, seit ich mich angemeldet habe.

Navbar und alles, was wir in Kaggle zur Verfügung haben:

62386Screenshot20360-3091979

Sobald ich auf "mehr" klicke, Das sind alles Dinge, auf die ich von meinem Kaggle-Konto aus zugreifen kann.

75241Screenshot20361-3319797

Meiner Meinung nach, Es gibt 4 wichtige Dinge, die Kaggle ausmachen “DAS BESTE”.

1. Kostenlose Kurse und Zertifikate verfügbar

Es gibt viele Kurse in verschiedenen Bereichen des maschinellen Lernens und der Datenwissenschaft. Nicht nur Kurse sind verfügbar, nach jeder stunde, aber es gibt auch Übungshefte (Ausbildung) verfügbar, um sich mit dem Thema vertraut zu machen. Um Ihr kostenloses Kaggle-Zertifikat zu erhalten, es ist notwendig, alle Aufgaben und Übungen zu erledigen.

53223Screenshot20362-7878913
20483Screenshot20363-9160728
44530Screenshot20364-3094428

Es gibt noch ein paar Kurse, aber dadurch, Ich wollte dir zeigen, dass es in diesen Kursen eine so große Themenvielfalt gibt, dass du nirgendwo hingehen musst, sich jederzeit in einem Problem oder Problem verloren zu fühlen, Hol dir hier Hilfe.

Lassen Sie mich Ihnen anhand eines Beispiels zeigen, wie diese Kurse aussehen:

59463Screenshot20367-8543587
48640Screenshot20368-7917057

Am Ende jedes Kurses, es gibt eine zusätzliche lektion, die sich inhaltlich unterscheidet, aber dem Anwendungsfall und dem Verständnis des Kurses ähnlich ist. Sie enthalten meistens einige berühmte Themen und / oder mächtig. Hier haben wir AutoML (de Google) um maschinelles Lernen zu automatisieren.

2. Eine riesige Sammlung öffentlich zugänglicher Datensätze / zur Praxis beigetragen / arbeiten

Für alle Data Science- oder Machine Learning- oder Deep-Learning-Aufgaben, wir brauchen meistens daten und viele davon. Anstatt verschiedene Websites nach verschiedenen Typen zu durchsuchen / Datensatzgrößen, Kaggle bietet einen gemeinsamen Platz für eine große Sammlung all dieser Datensätze. Sie können sie mit einem Klick verwenden. Sie sind extrem einfach zu bedienen.

29028Screenshot20369-8522682
32956Screenshot20370-9281940

Sobald du klickst “Datensätze” in der Navigationsleiste, das wirst du sehen. Sie können nach einem bestimmten Datensatz suchen, importieren / tragen Sie Ihren eigenen Datensatz zur Community bei oder studieren Sie oder beginnen Sie mit der Arbeit an einem Datensatz, auf dieser Seite gezeigt. (Trenddatensätze, Beliebte Datensätze, Zuletzt angesehene Datensätze)

Zur Demonstration, Ich suche nach einem bestimmten Datensatz (“Sonnenflecken-Datensatz”). Mal sehen wie es aussieht.

29789Screenshot20371-7931344

Die Zahl in der roten Auswahl ist die Anzahl der positiven Stimmen, die die Leute abgegeben haben, für die relevanteste Option / ich mag das. Lassen Sie uns diesen Datensatz im Detail untersuchen und sehen.

Es gibt viele Dinge, mit denen wir mehr über diese Daten erfahren und sofort mit der Arbeit beginnen können.

  • Sie können den Datensatz herunterladen,
  • Erstellen Sie ein neues Kaggle-Notizbuch mit diesem bereits geladenen Datensatz.
  • Einige Details zu den Spalten in den Daten.
  • Aktivitäten mit diesen Daten.
  • Schließlich, aber nicht weniger wichtig, alle Notizbücher, die bisher mit diesen Daten erstellt und öffentlich geteilt wurden.

3. Data Science-Kompetenzen / maschinelles Lernen / tiefes Lernen

Obwohl ich an keinem von ihnen teilgenommen habe, Ich finde es toll, wie wir zusammen mit der Kaggle-Community eine Ausgabe in Echtzeit bearbeitet und tolle Geldpreise gewonnen haben (wenn wir an diesem bestimmten Wettbewerb teilnehmen). Ich möchte auf jeden Fall bald mitmachen, Ich hoffe die Bilder motivieren dich. Es ist nicht notwendig, dass nur große Unternehmen oder reiche Unternehmen das können. Das kannst du auch machen. Es gibt bestimmte Protokolle, die befolgt werden müssen und voila, Sie haben Ihren eigenen Wettbewerb veranstaltet.

79134Screenshot20376-1388455
50413Screenshot20377-9405335

Ich habe die bisher abgeschlossenen Wettbewerbe nach ihrem Prämienwert bewertet. Schau genau.

4. Kaggle-Notizbücher (Code)

Für alle Aufgaben rund um Data Science oder Informatik, wir müssen zumindest etwas Code schreiben. Kaggle stellt uns eine eigene Notebook-Umgebung zur Verfügung, mit einer bestimmten Grenze, wie viel wir darin speichern können (kollektiv auf Rechnung), wie viele Stunden GPU verfügbar und wie viele Stunden TPU verfügbar. Sie sind vollständig in alle Kaggle-Dienste integriert und können unabhängig wie jede andere Notebook-Umgebung verwendet werden (Datalore, Google Colab, Jupyter, etc.), was bedeutet, dass Sie sie für Ihre Praxis verwenden können, Kaggle-Wettbewerbe, Kaggle-Kurse, Analyse einiger Kaggle / oder Nicht-Kaggle-Datensätze und vieles mehr. Sie müssen sie überprüfen.

92661Screenshot20378-7517554

Klicke auf den schwarzen Knopf, Erstellen Sie Ihr Notizbuch oder öffnen Sie das Notizbuch einer anderen Person, das Sie lesen und lernen möchten / vergleichen. Alle diese sichtbaren Notizbücher werden explizit öffentlich geteilt, Das bedeutet, dass Ihre Notizbücher für niemanden sichtbar sind, es sei denn, Sie möchten dies tun.

So wechseln Sie von CPU zu GPU oder TPU, Folge dies:

72424Screenshot20380-4251022

Dies sind die meisten Funktionsoptionen, die Ihnen bei diesem Laptop zur Verfügung stehen:

89069Screenshot20381-3102904
62421Screenshot20382-8573959

Mal sehen, wie man sie mit Daten verwendet (importiert / direkt aus Kaggle . entnommen / von URL heruntergeladen, etc.) und beginnen Sie mit Ihren Data Science-Aufgaben.

90089Screenshot20383-7931089
93972Screenshot20384-7494173

Hier zeige ich Ihnen, wie Sie diesen Datensatz von . verwenden “Sonnenflecken” was wir vorher gesehen haben. Beginnen Sie mit der Suche.

48408Screenshot20385-1494437
98343Screenshot20386-1007680

Jetzt werden die Daten korrekt geladen. Die Auswahl im Bild oben ist das Verzeichnis, in dem es gespeichert ist. Lass uns ein wenig sehen Pandas Code zum Importieren des Datensatzes.

44616Screenshot20387-4312854

Das Letzte, was Sie nach Abschluss Ihres Projekts tun können / Aufgabe ist es, es mit der Community auf Kaggle zu teilen. Dies ist ein wichtiger Schritt, denn indem wir unsere Ideen teilen, unsere Arbeit, Wir erweitern die der Community zur Verfügung stehenden Utilities und unterstützen uns gegenseitig. Wir wachsen dank anderer.

Links neben dem großen blauen Button oben rechts, du wirst sehen “Teilen” Taste. Klicken Sie darauf und wählen Sie Öffentlich aus dem Dropdown-Menü.

31300Screenshot20388-7976762

Ich hoffe, Ihnen hat das, was Sie in diesem Handbuch gesehen haben, gefallen und Sie sind gespannt, Kaggle zu verwenden.

Gargeya Sharma

B.Tech Informatik 3er año
Spezialisiert auf Data Science und Deep Learning
Data Scientist Praktikant bei Upswing Cognitive Hospitality Solutions
Für mehr Informationen, Überprüfen Sie meine Github-Homepage

LinkedIn GitHub

Die in diesem Artikel gezeigten Medien sind nicht Eigentum von DataPeaker und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.