Python-Training | Python für die Datenwissenschaft

Inhalt

Reise von einem Python-Neuling zu einem Kaggler in Python

Dann tust du so werde datenwissenschaftler oder es kann sein, dass Sie es bereits sind und Ihr Werkzeug-Repository erweitern möchten. Sie sind am richtigen Ort gelandet. Das Ziel dieser Seite ist es, einen umfassenden Lernpfad für Python-Neulinge für Data Science bereitzustellen.. Dieser Pfad bietet einen vollständigen Überblick über die Schritte, die Sie erlernen sollten. Python für die Datenwissenschaft. Wenn Sie bereits einen Hintergrund haben, oder du brauchst nicht alle komponenten, Passen Sie gerne Ihre eigenen Wege an und lassen Sie uns wissen, wie Sie die Änderungen auf dem Weg vorgenommen haben.

Sie können auch die Mini-Version dieses Lernpfads überprüfen -> Infografiken: Kurzanleitung zum Erlernen von Data Science in Python.

Lesen Sie dies in 2019? Wir haben a . entworfen aktualisierter Lernpfad für dich! Schauen Sie sich unser Kursportal an und starten Sie noch heute Ihre Data Science-Reise.

Paso 0: Heizung

Bevor Sie Ihre Reise antreten, Die erste zu beantwortende Frage ist:

Warum Python verwenden??

Ö

Wie wäre Python nützlich??

Schau dir den ersten an 30 Minuten davon sprich über jeremy, Gründer von DataRobot bei PyCon 2014, Ukraine, um eine Vorstellung davon zu bekommen, wie nützlich Python sein könnte.

Paso 1: Konfiguration Ihrer Maschine

Jetzt, wo du dich entschieden hast, Es ist Zeit, Ihre Maschine zu konfigurieren. Die einfachste Vorgehensweise ist einfach Anaconda herunterladen von Continuum.io. Es wird mit den meisten Dingen geliefert, die Sie benötigen. Der Hauptnachteil dieser Route besteht darin, dass Sie warten müssen, bis Continuum Ihre Pakete aktualisiert hat, auch wenn möglicherweise ein Update für die zugrunde liegenden Bibliotheken verfügbar ist. Wenn Sie ein Anfänger sind, das sollte egal sein.

Wenn Sie mit einer Installationsherausforderung konfrontiert sind, kann mehr finden detaillierte Anleitungen für verschiedene Betriebssysteme hier.

Paso 2: lerne die Grundlagen der Python-Sprache

Sie müssen damit beginnen, die Grundlagen der Sprache zu verstehen, Bibliotheken und Datenstruktur. das kostenlos DataPeaker-Kurs in Python Es ist einer der besten Orte, um Ihre Reise zu beginnen. Dieser Kurs konzentriert sich auf die ersten Schritte mit Python für die Datenwissenschaft und, schließlich, sollten mit den Grundlagen der Sprache vertraut sein.

Abtretung: Nehmen Sie die toller kostenloser Python-Kurs von DataPeaker

Alternative Ressourcen: Wenn interaktives Programmieren nicht Ihr Lernstil ist, Sie können auch überprüfen Google-Klasse für Python. Es ist eine Reihe von Arten von 2 Tage und deckt auch einige der Teile ab, die später besprochen werden.

Paso 3: Reguläre Ausdrücke in Python lernen

Sie werden sie häufig für die Datenbereinigung verwenden müssen, besonders wenn Sie mit Textdaten arbeiten. der beste Weg um Reguläre Ausdrücke lernen Geht durch den Google-Kurs und behalte das Spickzettel praktisch.

Abtretung: Mach das Übung mit Babynamen

Wenn du noch mehr Übung brauchst, Befolgen Sie dieses Tutorial zum Bereinigen von Text. Fordert Sie in verschiedenen Schritten des Datenmanagements heraus.

Paso 4: Lernen Sie wissenschaftliche Bibliotheken in Python: NumPy, SciPy, Matplotlib und Pandas

Hier beginnt der Spaß!! Hier eine kurze Einführung in verschiedene Bibliotheken. Fangen wir an, einige gängige Operationen zu üben.

  • Üben Sie die NumPy-Tutorial gründlich, insbesondere NumPy-Arrays. Dies wird eine gute Grundlage für die kommenden Dinge bilden..
  • Dann, schaue auf die Science-Fiction-Tutorials. Überprüfen Sie die Einführung und die Grundlagen und erledigen Sie den Rest nach Ihren Bedürfnissen.
  • Wenn Sie die folgenden Matplotlib-Tutorials erraten haben, du liegst falsch! Sie sind zu vollständig für unseren Bedarf hier. Stattdessen, Schau dir das an ipython-notizbuch bis zur linie 68 (Mit anderen Worten, sogar Animationen)
  • Abschließend, Schauen wir uns Pandas an. Pandas bietet DataFrame-Funktionalität (wie R) für Python. Hier sollte man auch eine gute Zeit beim Üben haben. Pandas würden das effizienteste Werkzeug für alle mittelgroßen Datenanalysen werden. Beginnen Sie mit einer kurzen Einführung, 10 Minuten für Pandas. Nach, Gehe zu einer detaillierteren Beschreibung. Tutorial zu Pandas.

Sie können auch explorative Datenanalysen mit Pandas und Datenanalysen mit Pandas anzeigen.

Zusätzliche Ressourcen:

  • Wenn Sie ein Buch über Pandas und NumPy benötigen, “Python für die Datenanalyse von Wes McKinney “
  • Es gibt viele Tutorials als Teil der Pandas-Dokumentation. Du kannst sie dir anschauen hier

Abtretung: Löse das CS109 Kursaufgabe die Harvard.

Paso 5: effektive Datenvisualisierung

Geh das durch Konferenzformular CS109. Du kannst das ignorieren 2 Anfangsminuten, Aber was folgt, ist unglaublich!! Folgen Sie dieser Konferenz mit Diese Aufgabe.

Paso 6: Aprenda Scikit-lernen und maschinelles Lernen

Jetzt, wir kommen auf den kern dieses ganzen verfahrens. Scikit-learn ist die nützlichste Bibliothek in Python für maschinelles Lernen. Hier ist eine kurze Beschreibung der Bibliothek. Beende die Lektion 10 zum Unterricht 18 von Harvard CS109-Kurs. Sie erhalten einen Überblick über maschinelles Lernen, überwachte Lernalgorithmen als Regressionen, Entscheidungsbäume, Set-Modellierung und unüberwachte Lernalgorithmen wie Clustering. Verfolgen Sie einzelne Konferenzen mit dem Zuordnungen dieser Konferenzen.

Sie sollten auch die ‘Einführung in die Datenwissenschaftsicherlich, um sich bei Ihrer Suche nach einer Stelle als Data Scientist zu stärken.

Zusätzliche Ressourcen:

Paso 7: üben, üben und üben

Herzliche Glückwünsche, du machtest!

Du hast jetzt alles, was du an technischen Fähigkeiten brauchst. Es ist eine Frage der Praxis und wo kann man besser üben, als mit anderen Data Scientists auf der Welt zu konkurrieren. Plataforma DataHack. Und, Tauchen Sie ein in einen der Live-Wettbewerbe, die gerade stattfinden unter DataHack und Kaggle und probiere alles aus, was du gelernt hast.

Paso 8: tiefes Lernen

Jetzt haben Sie die meisten Techniken des maschinellen Lernens erlernt, Zeit, Deep Learning eine Chance zu geben. Wahrscheinlich wissen Sie bereits, was Deep Learning ist, aber wenn du noch eine kurze Einführung brauchst, hier ist es.

Ich bin selbst neu im Deep Learning, Also nimm diese Vorschläge mit Vorsicht. Die umfassendste Ressource ist deeplearning.net. Hier findest du alles: Konferenzen, Datensätze, Herausforderungen, Tutorials. Sie können es auch versuchen Geoff Hinton-Kurs ein Versuch, die Grundlagen neuronaler Netze zu verstehen.

Erste Schritte mit Python: Ein komplettes Tutorial zum Erlernen von Data Science mit Python von Grund auf neu

PS Falls Sie Big Data-Bibliotheken verwenden müssen, Probiere Pydoop und PyMongo. Hier nicht enthalten, denn der Big-Data-Lernpfad ist ein komplettes Thema für sich.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.