Kaggle-Wettbewerb | Liste der Kaggle-Probleme

Inhalt

Einführung

Habe ich die notwendigen Fähigkeiten, um an Kaggle-Wettbewerben teilzunehmen??

Haben Sie sich schon einmal dieser Frage gestellt? Zumindest habe ich es getan, als ich im zweiten Jahr war, als ich Kaggle fürchtete, nur weil ich mir den Schwierigkeitsgrad vorstellte, den er bietet. Diese Angst war meiner Angst vor Wasser ähnlich. Meine Angst vor Wasser erlaubte mir keinen Schwimmunterricht zu nehmen. Aber trotzdem, später habe ich gelernt: “Bis du nicht aufs Wasser trittst, kannst du nicht sehen wie tief es ist”. Eine ähnliche Philosophie gilt für Kaggle. Beenden Sie nicht, bis Sie es versucht haben!!

kaggle-logo-transparent-300-1024x465-5658914

Kaggle, die Heimat der Datenwissenschaft, bietet eine globale Plattform für Kompetenzen, Lösungen für Kunden und Jobbank. Hier ist der Kaggle-Screenshot, diese Wettbewerbe lassen dich nicht nur über den Tellerrand hinausdenken, sie bieten auch einen attraktiven Geldpreis.

Aber trotzdem, Leute zögern, an diesen Wettbewerben teilzunehmen. Einige der Hauptgründe sind unten aufgeführt:

  1. Sie schauen auf dein Können herab, erworbene Kenntnisse und Techniken.
  2. Unabhängig von Ihrem Kenntnisstand, wähle das Problem mit dem höchsten Preisgeld.
  3. Sie verwechseln ihr Können nicht mit dem Schwierigkeitsgrad des Problems.

Ich denke, dieses Problem kommt von Kaggle selbst. Kaggle.com stellt keine Informationen zur Verfügung, die den Menschen helfen können, das am besten geeignete Problem auszuwählen, das ihren Fähigkeiten entspricht. Infolge, ist eine lästige Pflicht für Anfänger geworden / Intermediates entscheiden, welches Problem für den Anfang richtig ist.

Was erfährst du in diesem Artikel?

In diesem Artikel, Wir haben den Deadlock geöffnet, um das geeignete Kaggle-Problem entsprechend Ihren Fähigkeiten auszuwählen, Werkzeuge und Techniken. Hier, Wir haben jedes Kaggle-Problem mit dem Schwierigkeitsgrad und den Fähigkeiten, die zu seiner Lösung erforderlich sind, illustriert.

Im letzten Teil, Wir haben den richtigen Ansatz zur Lösung eines Kaggle-Problems für die folgenden Fälle definiert:

Fall 1: Ich habe Programmiererfahrung, Aber ich bin neu im maschinellen Lernen.

Fall 2: Ich bin seit über in der Analytikbranche tätig 2 Jahre, aber ich fühle mich nicht wohl mit R / Python

Fall 3: Ich bin gut mit Programmieren und maschinellem Lernen, Ich brauche etwas Herausforderndes, an dem ich arbeiten kann

Fall 4: Ich bin ein Neuling sowohl im maschinellen Lernen als auch in der Programmiersprache, aber ich möchte lernen

Liste der Kaggle-Probleme

1. Titanic: Maschinelles Lernen aus Katastrophen

Ziel: Ein klassisches, beliebtes Problem, um Ihre Reise mit maschinellem Lernen zu beginnen. Sie erhalten eine Reihe von Attributen der Passagiere an Bord und Sie müssen vorhersagen, wer nach dem Untergang des Schiffes überlebt hätte.

Titanic-4547234

Schwierigkeitsgrad

ein) Fähigkeiten zum maschinellen Lernen: einfach

B) Programmierkenntnisse: einfach

C) Erwerben Sie Beherrschungsfähigkeiten: einfach

D) Tutorials verfügbar – Sehr vollständig

2. Erster Schritt mit Julia

Ziel: Dies ist ein Problem beim Identifizieren von Zeichen im Google Street View-Bild mit einem kommenden Tool, Julia.

julia-5605648

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen: einfach

B) Programmierkenntnisse – Halb

C) Erwerben Sie Beherrschungsfähigkeiten: einfach

D) Tutorial verfügbar – Voll

3. Ziffernerkenner

Ziel: Sie erhalten Daten mit Pixeln in handschriftlichen Ziffern und Sie müssen schlüssig angeben, um welche Ziffer es sich handelt. Dies ist ein klassisches Problem für das Latent-Markov-Modell.

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen: halb

B) Programmierkenntnisse – Halb

C) Erwerben Sie Beherrschungsfähigkeiten: einfach

D) Tutorial verfügbar: vorhanden aber ohne Handgriff

4. Wortbeutel mit Popcornbeutel

Ziel: Sie erhalten eine Reihe von Filmkritiken und Sie müssen das versteckte Gefühl in dieser Aussage finden. Der Zweck dieser Problembeschreibung besteht darin, Ihnen das Google-Paket vorzustellen – Word2Vec.

Es ist ein fantastisches Paket, das Ihnen hilft, Wörter in einem endlich dimensionalen Raum umzuwandeln. Auf diese Weise können wir Analogien aufbauen, indem wir uns einfach den Vektor ansehen. Ein sehr einfaches Beispiel ist, dass Ihr Algorithmus Analogien erzeugen kann wie: Rey – Mann + Frau wird dir Königin geben.

Popcorn-3400048

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen – Schwer

B) Programmierkenntnisse – Halb

C) Erwerben Sie Beherrschungsfähigkeiten: einfach

D) Tutorial verfügbar – Erhältlich aber ohne Handgriff

5. Rauschunterdrückung bei verschmutzten Dokumenten

Ziel: Vielleicht kennen Sie eine Technologie namens OCR. Konvertieren Sie handschriftliche Dokumente einfach in digitale Dokumente. Aber trotzdem, Ist nicht perfekt. Ihre Aufgabe hier ist es, maschinelles Lernen zu nutzen, um es perfekt zu machen..

Dokumente-3979703

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen – Schwer

B) Programmierkenntnisse – Schwer

C) Erwerben Sie Beherrschungsfähigkeiten: schwer

D) Tutorial verfügbar – Nein

6. Kriminalitätsklassifikation in San Francisco

Ziel: Sagen Sie die Kategorie der Verbrechen voraus, die in der Stadt an der Bucht aufgetreten sind.

san-francisco-4992579

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen: sehr schwierig

B) Programmierkenntnisse: sehr schwierig

C) Erwerben Sie Beherrschungsfähigkeiten: schwer

D) Tutorial verfügbar – Nein

7. Wetter / Taxi-Trajektorie-Vorhersageort

Ziel: Es gibt zwei Probleme, die auf denselben Datensätzen basieren. Ihnen wird ein Taxifahrer zur Verfügung gestellt und Sie sollen vorhersagen, wohin das Taxi fährt oder wie lange die Fahrt dauert.

Taxi-1-6609405

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen: einfach

B) Programmierkenntnisse – Schwer

C) Erwerben Sie Beherrschungsfähigkeiten: halb

D) Tutorial verfügbar: einige Referenzcodes verfügbar

8. Facebook-Rekrutierung: Mensch der Bot

Ziel: Wenn Sie Probleme haben, eine neue Domain zu verstehen, muss das lösen. Sie erhalten die Details der Ausschreibung und es wird erwartet, dass Sie den Bieter als Bot oder Mensch einstufen. Dies hat die umfangreichste verfügbare Datenquelle aller Probleme in Kaggle.

fb-7912754

Schwierigkeitsgrad in jedem der Attribute:

ein) Fähigkeiten zum maschinellen Lernen: halb

B) Programmierkenntnisse – Halb

C) Erwerben Sie Beherrschungsfähigkeiten: halb

D) Tutorial verfügbar: kein Support verfügbar, da es sich um einen Rekrutierungswettbewerb handelt

Notiz: Ich habe Kaggle-Wettbewerbe, die Preisgelder anbieten, in diesem Artikel nicht behandelt., da sie sich alle auf eine bestimmte Domäne beziehen. Teilen Sie mir Ihre Meinung dazu im Kommentarbereich unten mit..

Jetzt werden wir nach dem richtigen Ansatz für Menschen mit unterschiedlichen Fähigkeiten in verschiedenen Lebensphasen suchen, um ihre Kaggle-Reise zu beginnen!!

Fall 1: Ich habe Programmiererfahrung, Aber ich bin neu im maschinellen Lernen.

Paso 1: Das erste Kaggle-Problem, das Sie angehen müssen, ist: Vorhersage der Taxi-Trajektorie. Der Grund dafür ist, dass das Problem einen komplexen Datensatz enthält, der ein JSON-Format in einer der Spalten enthält, die die Koordinaten angibt, die das Taxi besucht hat. Wenn du das aufschlüsseln kannst, Um eine erste Schätzung des Ziels oder der Zielzeit zu erhalten, ist kein maschinelles Lernen erforderlich. Deswegen, Sie können Ihre Codierungsstärke nutzen, um Ihren Wert in dieser Branche zu finden.

Paso 2: Dein nächster Schritt sollte sein, zu gehen: Titanic. Der Grund dafür ist, dass Sie jetzt den Umgang mit komplexen Datensätzen verstehen. Deswegen, Jetzt ist der perfekte Zeitpunkt, um zu versuchen, reine Machine-Learning-Probleme zu lösen. Mit vielen Lösungen / Skripte verfügbar, wird in der Lage sein, eine gute Lösung zu bauen.

Paso 3: Jetzt bist du bereit für etwas Großes. Versuchen Sie es mit Facebook-Recruiting. Dies wird Ihnen helfen zu verstehen, wie Sie durch das Verständnis der Domäne das Beste aus dem maschinellen Lernen herausholen können..

Sobald Sie alle diese Teile an Ort und Stelle haben, Sie können jedes Problem auf Kaggle testen.

Fall 2: Ich bin seit über in der Analytikbranche tätig 2 Jahre, aber ich fühle mich nicht wohl mit R / Python

Paso 1: Sie sollten damit beginnen, ein Foto auf Titanic zu machen. Der Grund dafür ist, dass Sie bereits wissen, wie man einen Vorhersagealgorithmus erstellt. Sie sollten sich jetzt bemühen, Sprachen wie R und Python zu lernen. Mit vielen Lösungen / Skripte verfügbar, Sie können verschiedene Arten von Modellen sowohl in R als auch in Python erstellen. Dieses Problem wird Ihnen auch helfen, einige fortschrittliche Algorithmen für maschinelles Lernen zu verstehen..

Paso 2: Der nächste Schritt sollte das Facebook-Recruiting sein. Der Grund ist, dass, angesichts der Einfachheit der Datenstruktur und der Fülle des Inhalts, Sie werden in der Lage sein, korrekte Tabellen zu verknüpfen und einen Vorhersagealgorithmus dafür zu erstellen. Dies wird Ihnen auch dabei helfen zu verstehen, wie Sie durch das Verständnis der Domäne das Beste aus maschinellem Lernen herausholen können..

Vorschläge: Sie sind jetzt bereit für etwas ganz anderes als Ihre Komfortzone.. Lesen Sie Probleme wie das Screening auf diabetische Retinopathie, Klicks auf Avinto Context Ads, Klassifizierung von Straftaten und finden Sie die Domain, die Sie interessiert. Versuchen Sie nun, das bisher Gelernte anzuwenden.

Jetzt ist es an der Zeit, etwas komplexeres zu codieren. Versuchen Sie es mit der Vorhersage der Taxi-Trajektorie oder der Rauschunterdrückung schmutziger Dokumente. Sobald Sie alle diese Teile an Ort und Stelle haben, Jetzt können Sie jedes Problem in Kaggle ausprobieren.

Fall 3: Ich bin gut mit Programmieren und maschinellem Lernen, Ich brauche etwas Herausforderndes, an dem ich arbeiten kann

Paso 1: Sie haben viele Möglichkeiten in Kaggle. Die erste Möglichkeit besteht darin, eine neue Sprache wie Julia zu beherrschen. Du kannst mit dem ersten Schritt mit Julia beginnen. Der Grund dafür ist, dass Sie dadurch zusätzlich erfahren, was Julia neben Python oder R tun kann.

Paso 2: Die zweite Option besteht darin, Fähigkeiten mit zusätzlicher Beherrschung zu entwickeln. Sie können Avito Context ausprobieren, Suchrelevanz von Facebook – Mensch vs. Bot.

Fall 4: Ich bin ein Neuling sowohl im maschinellen Lernen als auch in der Programmiersprache, aber ich möchte lernen

Paso 1: Sie sollten Ihre Kaggle-Reise mit Titanic beginnen. Der Grund dafür ist, dass der erste Schritt für Sie darin besteht, Sprachen wie R und Python zu lernen. Mit vielen Lösungen / Skripte verfügbar, Sie können verschiedene Arten von Modellen sowohl in R als auch in Python erstellen. Dieses Problem wird Ihnen auch helfen, einige Algorithmen des maschinellen Lernens zu verstehen.

Paso 2: Dann sollte ich nehmen: Facebook-Recruiting. Der Grund ist, dass, angesichts der Einfachheit der Datenstruktur und der Fülle des Inhalts, Sie werden in der Lage sein, korrekte Tabellen zu verknüpfen und einen Vorhersagealgorithmus dafür zu erstellen. Dies wird Ihnen auch dabei helfen zu verstehen, wie Sie durch das Verständnis der Domäne das Beste aus maschinellem Lernen herausholen können..

Sobald Sie damit fertig sind, kann die Probleme basierend auf Ihrem Interesse ansprechen.

Ein paar Tricks für einen fairen Wettbewerb in Kaggle

Dies ist keine vollständige Liste der Hacks, Aber es soll dir einen guten Start ermöglichen. Die vollständige Liste verdient einen eigenen neuen Beitrag:

  1. Stellen Sie sicher, dass Sie eine Lösung einreichen (sogar die Einreichung von Proben wird diesen Job erledigen) vor dem letzten Anmeldedatum, wenn du in Zukunft am Wettbewerb teilnehmen möchtest.
  2. Verstehen Sie die Domäne, bevor Sie mit den Daten fortfahren. Zum Beispiel, in Bot gegen Mensch, Sie müssen verstehen, wie die Online-Gebotsplattform funktioniert, bevor Sie die Reise mit Daten beginnen.
  3. Erstellen Sie Ihren eigenen Bewertungsalgorithmus, der das Kaggle-Testergebnis nachahmen kann. Eine einfache Kreuzvalidierung von 10 mal klappt im Allgemeinen gut.
  4. Versuchen Sie möglichst viele Merkmale aus den Zugdaten zu extrahieren; Feature-Engineering ist normalerweise der Teil, der Sie vom Perzentil verdrängt 40 über Perzentil 10 Vorgesetzter.
  5. Wie gewöhnlich, ein einzelnes Modell platziert es nicht an der Spitze 10. Sie müssen viele Modelle herstellen und zusammenbauen. Es können mehrere Modelle mit unterschiedlichen Algorithmen oder unterschiedlichen Variablensätzen sein.

Abschließende Anmerkungen

Es gibt mehrere Vorteile, die ich erkannt habe, nachdem ich an Kaggle-Themen gearbeitet habe. Ich habe R gelernt / Python für unterwegs. Ich denke, es ist der beste Weg, das gleiche zu lernen. Was ist mehr, Die Interaktion mit Leuten aus dem Diskussionsforum zu verschiedenen Themen wird Ihnen helfen, einen tieferen Einblick in maschinelles Lernen und Beherrschung zu erhalten.

In diesem Artikel, Wir veranschaulichen verschiedene Kaggle-Probleme und ordnen ihre wesentlichen Attribute nach dem Schwierigkeitsgrad. Wir haben auch verschiedene Fälle aus dem echten Leben in Angriff genommen und den richtigen Ansatz gefunden, um uns bei Kaggle zu engagieren.

Warst du in Kaggle-Probleme verwickelt?? Haben Sie einen signifikanten Vorteil darin gesehen, dasselbe zu tun?? Teilen Sie uns Ihre Meinung zu diesem Leitfaden im Kommentarbereich unten mit..

Wenn Ihnen das, was Sie gerade gelesen haben, gefällt und Sie weiter über Analytics lernen möchten, abonnieren Sie unsere E-Mails, Folge uns auf Twitter oder wie bei uns Seite auf Facebook.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.