Python versus R versus SAS

Inhalt

Überblick

  • Python hat sich der lang andauernden R vs. SAS-Debatte angeschlossen
  • Jeder von R, SAS und Python haben ihre Vor- und Nachteile und können mit Kriterien wie Kosten verglichen werden, die Arbeitsumgebung und Unterstützung für verschiedene Algorithmen des maschinellen Lernens.
  • Sie können auch eines der drei Tools auswählen, je nachdem, in welcher Phase Ihrer Data Science-Karriere Sie sich befinden.

Notiz: Dieser Artikel wurde ursprünglich veröffentlicht auf 27 Marsch 2014 und aktualisiert die 12 September 2017

Einführung

Wir lieben Vergleiche!

Samsung vs. Apple vs. HTC auf Smartphones; iOS vs. Android vs. Windows auf mobilen Betriebssystemen, um Kandidaten für bevorstehende Wahlen zu vergleichen oder den Kapitän für das WM-Team auszuwählen, Vergleiche und Diskussionen bereichern uns in unserem Leben. Wenn du Diskussionen liebst, Alles was Sie tun müssen, ist eine relevante Frage inmitten einer leidenschaftlichen Community zu stellen und dann zuzusehen, wie sie explodiert. Das Schöne an dem Prozess ist, dass jeder im Raum als informiertere Person geht..

Ich provoziere hier etwas Ähnliches. SAS vs. R war wahrscheinlich die größte Debatte Datenwissenschaft die Branche hätte miterleben können. Python ist derzeit eine der am schnellsten wachsenden Sprachen und hat seit seiner Einführung einen langen Weg zurückgelegt. Der Grund, warum ich diese Diskussion beginne, ist nicht zuzusehen, wie sie explodiert. (das würde auch spaß machen). Ich weiß, dass wir alle von der Diskussion profitieren werden.

Dies war auch eine der am häufigsten gestellten Fragen in diesem Blog. Ich dachte, ich würde es mit all meinen Lesern und Besuchern diskutieren!!

python-vs-r-vs-sas-e28093-welches-tool-sollte-ich-lernen-8282313

Zu diesem Thema wurde noch nicht viel gesagt?

Wahrscheinlich ja! Aber ich habe immer noch das Bedürfnis, es aus den folgenden Gründen zu diskutieren::

  • das Datenwissenschaft die Branche ist sehr dynamisch. Jeder Vergleich, der gemacht wurde, macht 2 Jahre sind möglicherweise nicht mehr relevant.
  • Traditionell Felshaken wurde aus dem Vergleich herausgelassen. Ich denke, jetzt ist es mehr als nur eine würdige Überlegung.
  • Während ich globale Trends zu Sprachen diskutieren werde, Ich werde spezifische Informationen zur Analytikindustrie Indiens hinzufügen (Wer ist auf einer anderen Evolutionsstufe)

Dann, ohne weitere Verzögerung, Lass den Kampf beginnen!

Unterseite

Hier ist eine kurze Beschreibung über die 3 Ökosysteme:

  • SAS: SAS ist unangefochtener Marktführer im Bereich Business Analytics. Die Software bietet vielfältige Statistikfunktionen, hat eine gute GUI (Unternehmensleitfaden & Bergmann) für schnelles Lernen und bietet erstaunliche technische Unterstützung. Aber trotzdem, am Ende die teuerste Option und nicht immer mit den neuesten Statistikfunktionen angereichert.
  • R: R ist das Open-Source-Gegenstück von SAS, traditionell in Wissenschaft und Forschung verwendet. Aufgrund seiner Open-Source-Natur, die neuesten Techniken werden schnell veröffentlicht. Es gibt viele Dokumentationen im Internet und es ist eine sehr profitable Option.
  • Felshaken: Mit origin als Open-Source-Programmiersprache, Python-Nutzung hat im Laufe der Zeit zugenommen. Heute, hat Sportbibliotheken (numpy, scipy und matplotlib) und funktioniert für fast jede statistische Operation / Gebäudemodelle, die Sie erstellen möchten. Seit der Einführung von Pandas, ist in strukturierten Datenoperationen sehr stark geworden.

Vergleichsattribute

Ich werde diese Sprachen in den folgenden Attributen vergleichen:

  1. Verfügbarkeit / Kosten
  2. Leicht zu lernen
  3. Datenverarbeitungsfunktionen
  4. Grafikfunktionen
  5. Fortschritte im Tool
  6. Arbeitsszenario
  7. Deep-Learning-Unterstützung
  8. Kundenservice und Community

Ich vergleiche sie aus der Sicht eines Analysten. Deswegen, wenn Sie ein Werkzeug für Ihr Unternehmen kaufen möchten, Sie erhalten hier möglicherweise keine vollständige Antwort. Die folgenden Informationen werden weiterhin nützlich sein. Für jedes Attribut gebe ich jedem von diesen eine Punktzahl 3 Sprachen (1 – Niedrig; 5 – Alt).

Die Gewichtung dieser Parameter hängt davon ab, wo Sie sich in Ihrer Karriere befinden und welche Ambitionen Sie haben.

1. Verfügbarkeit / Kosten

SAS ist kommerzielle Software. Es ist teuer und für die meisten Profis immer noch unerreichbar (individuell). Aber trotzdem, hat den höchsten Marktanteil bei privaten Organisationen. Deswegen, bis und es sei denn, Sie sind in einer Organisation, die in SAS investiert hat, es kann schwierig sein, auf a . zuzugreifen. Selbst wenn, SAS hat eine Universitätsausgabe herausgebracht, auf die man kostenlos zugreifen kann, aber es hat einige einschränkungen. Sie können dort auch Jupyter Notebooks verwenden!!

R & Python, Zweitens, sie sind völlig frei. Hier sind meine Ergebnisse zu diesem Parameter:

SAS – 3

R – 5

Python – 5

2. Leicht zu lernen

SAS ist leicht zu erlernen und bietet eine einfache Option (PROC-SQL) für Leute, die bereits SQL kennen. Auch sonst, hat eine schöne stabile GUI in seinem Repository. Zu Ressourcen, Tutorials sind auf den Websites verschiedener Universitäten verfügbar und SAS verfügt über eine vollständige Dokumentation. Es gibt Zertifizierungen von SAS-Ausbildungsinstituten, aber sie haben wieder ihren preis.

R hat die steilste Lernkurve unter den 3 hier aufgeführte Sprachen. Erfordert das Erlernen und Verstehen von Codierung. R ist eine Low-Level-Programmiersprache und, Daher, einfache Verfahren können längere Codes erfordern.

Python ist in der Programmierwelt für seine Einfachheit bekannt. Dies gilt auch für die Datenanalyse. Zwar gibt es derzeit keine verallgemeinerten GUI-Schnittstellen, Ich hoffe, dass Python-Laptops immer häufiger werden. Sie bieten erstaunliche Funktionen zum Dokumentieren und Teilen.

SAS – 4.5

R – 2,5

Python – 3.5

3. Datenverarbeitungsfunktionen

Das war bis vor einiger Zeit ein Vorteil für SAS. R berechnet alles im Speicher (RAM) Ja, Daher, die Berechnungen wurden durch die Menge an RAM in den Maschinen begrenzt 32 Bits. Das ist nicht der Fall. Alle drei Sprachen verfügen über gute Datenverarbeitungsfähigkeiten und Optionen für parallele Berechnungen.. Ich denke, das ist keine große Differenzierung mehr. Alle haben auch Hadoop- und Spark-Integrationen mitgebracht, und sie sind auch mit Cloudera und Apache Pig kompatibel.

SAS – 4

R – 4

Python – 4

4. Grafikfunktionen

SAS verfügt über anständige funktionale Grafikfunktionen. Aber trotzdem, es ist einfach funktional. Jede Anpassung in den Diagrammen ist schwierig und erfordert, dass Sie die Komplexität des SAS Graph-Pakets verstehen.

R verfügt zusammen mit Python über sehr fortschrittliche grafische Funktionen. Es gibt zahlreiche Pakete, die Ihnen erweiterte Grafikfunktionen bieten.

Mit der Einführung von Plotly jetzt in beiden Sprachen und mit Python, das Seaborn hat, Das Erstellen von benutzerdefinierten Grafiken war noch nie so einfach.

SAS – 3

R – 4.5

Python – 4.5

5. Fortschritte im Tool

Das 3 Ökosysteme haben alle grundlegenden und notwendigsten Funktionen zur Verfügung. Diese Funktion ist nur von Bedeutung, wenn Sie mit den neuesten Technologien und Algorithmen arbeiten.

Aufgrund seiner offenen Natur, R & Python bekommt schnell die neuesten Funktionen. SAS, Zweitens, aktualisiert seine Fähigkeiten bei Veröffentlichungen neuer Versionen. Da R in der Vergangenheit in der Wissenschaft weit verbreitet war, die Entwicklung neuer Techniken geht schnell.

Nachdem ich dies gesagt habe, SAS veröffentlicht Updates in einer kontrollierten Umgebung, sie haben sich also bestens bewährt. R & Python, Zweitens, hat einen offenen Beitrag und es besteht die Möglichkeit von Fehlern in den neuesten Entwicklungen.

SAS – 4

R – 4.5

Python – 4.5

6. Arbeitsszenario

Weltweit, SAS bleibt Marktführer bei offenen Stellen in Unternehmen. Die meisten großen Organisationen arbeiten immer noch bei SAS. R / Python, Zweitens, Sie sind bessere Optionen für Start-ups und Unternehmen, die nach Rentabilität suchen. Was ist mehr, Es wurde berichtet, dass die Zahl der Arbeitsplätze in R / Python hat in den letzten Jahren zugenommen. Hier ist ein Trend, der im Internet weit verbreitet ist, zeigt den Trend von R- und SAS-Werken. Python-Jobs für die Datenanalyse werden ähnlich oder höher tendieren als R-Jobs:

Die Grafik unten zeigt R in Blau und SAS in Orange.

fig-1c-r-v-sas-2017-02-18-300x186-6503030

Screenshot-2017-09-12-at-12-01-24-pm-3474271

Quelle: r4stats.com

es ist, Zweitens, jetzt zeigt es R in Blau und Python in Orange.

fig-1d-r-v-python-2017-2-28-300x184-3201213

Screenshot-2017-09-12-at-12-01-00-pm-8531303

Quelle: r4stats.com

Allgemein, der sprachbasierte Marktplatz kann als solcher dargestellt werden:

fig-1b-indeedjobs-2017-279x300-1124782

Quelle: r4stats.com

SAS – 4

R – 4.5

Python – 4.5

7. Kundenservice und Community

R und Python haben die größten Online-Communitys, aber sie haben keinen Kundenservice. Dann, wenn du probleme hast, Er ist allein. Aber trotzdem, du wirst viel hilfe bekommen.

SAS, Zweitens, hat einen engagierten Kundenservice zusammen mit der Community. Deswegen, wenn Sie Installationsprobleme oder andere technische Herausforderungen haben, du kannst mit ihnen kommunizieren.

SAS – 4

R – 3,5

Python – 3.5

8. Deep-Learning-Unterstützung

Deep Learning in SAS steckt noch in den Kinderschuhen und es gibt noch viel zu tun.

Zweitens, Python hat auf diesem Gebiet große Fortschritte gemacht und verfügt über zahlreiche Pakete wie Tensorflow und Keras.

R hat kürzlich Unterstützung für diese Pakete hinzugefügt, zusammen mit einigen Grundlagen auch. Die Pakete kerasR und keras in R fungieren als Schnittstelle zum ursprünglichen Python-Paket, Schwer.

SAS – 2

Python – 4.5

R – 3

Andere Faktoren:

Unten sind einige weitere bemerkenswerte Punkte:

  • Python wird häufig in der Webentwicklung verwendet. Dann, wenn Sie in einem Online-Geschäft tätig sind, Die Verwendung von Python für die Webentwicklung und -analyse kann Synergien bieten
  • SAS hatte früher einen großen Vorteil bei der End-to-End-Infrastrukturbereitstellung (visuelle Analyse, Data Warehouse, Datenqualität, Berichte und Analysen), das wurde durch die Integration gemildert / R-Unterstützung auf Plattformen wie SAP HANA und Tableau. Noch weit von einer nahtlosen Integration wie SAS . entfernt, aber die Reise hat begonnen.

Fazit

Wir sehen, dass sich der Markt im aktuellen Szenario leicht in Richtung Python neigt. Es ist verfrüht, darauf zu wetten, was sich durchsetzen wird, angesichts der Dynamik der Branche. Abhängig von Ihren Umständen (Professionelle Bühne, Finanzen, etc.), Sie können Ihre eigenen Gewichte hinzufügen und überlegen, was für Sie das Richtige sein könnte. Dann, einige spezifische Szenarien werden gezeigt:

  • Wenn Sie in die Analytikbranche einsteigen (speziell in Indien), Ich würde empfehlen, SAS als erste Sprache zu lernen. Es ist leicht zu erlernen und hat die höchste Beteiligung am Arbeitsmarkt.
  • Wenn Sie jemand sind, der bereits einige Zeit in der Branche verbracht hat, Sie sollten versuchen, Ihre Erfahrung zu diversifizieren, um ein neues Werkzeug zu erlernen.
  • Für Branchenexperten und Profis, die Leute sollten es zumindest wissen 2 von diesen. Das würde viel Flexibilität für die Zukunft bringen und neue Möglichkeiten eröffnen..
  • Wenn Sie in einem Start-up-Unternehmen sind / autonom, R / Python ist nützlicher.

Strategisch, Unternehmenskonfigurationen, die mehr praktische Unterstützung und Schulung erfordern, wählen SAS als Option.

Forscher und Statistiker wählen R als Alternative, weil es bei schweren Berechnungen hilft. Wie sie sagen, R sollte die Arbeit erledigen und Ihren Computer nicht einfacher machen.

Python ist aufgrund seiner leichten Natur und der wachsenden Community die offensichtliche Wahl für heutige Startups.. Es ist auch die beste Wahl für Deep Learning.

Hier ist die endgültige Scorecard:

Screenshot-2017-09-11-at-7-10-22-pm-300x115-9312553

Das sind meine Ansichten zu diesem Vergleich. Jetzt, Sie sind an der Reihe, Ihre Ansichten in den Kommentaren unten zu teilen.

Lernen, anheuern, in Wettbewerb stehen, und angestellt werden!

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.