Überblick
- Python hat sich der lang andauernden R vs. SAS-Debatte angeschlossen
- Jeder von R, SAS und Python haben ihre Vor- und Nachteile und können mit Kriterien wie Kosten verglichen werden, die Arbeitsumgebung und Unterstützung für verschiedene Algorithmen des maschinellen Lernens.
- Sie können auch eines der drei Tools auswählen, je nachdem, in welcher Phase Ihrer Data Science-Karriere Sie sich befinden.
Notiz: Dieser Artikel wurde ursprünglich veröffentlicht auf 27 Marsch 2014 und aktualisiert die 12 September 2017
Einführung
Wir lieben Vergleiche!
Samsung vs. Apple vs. HTC auf Smartphones; iOS vs. Android vs. Windows auf mobilen Betriebssystemen, um Kandidaten für bevorstehende Wahlen zu vergleichen oder den Kapitän für das WM-Team auszuwählen, Vergleiche und Diskussionen bereichern uns in unserem Leben. Wenn du Diskussionen liebst, Alles was Sie tun müssen, ist eine relevante Frage inmitten einer leidenschaftlichen Community zu stellen und dann zuzusehen, wie sie explodiert. Das Schöne an dem Prozess ist, dass jeder im Raum als informiertere Person geht..
Ich provoziere hier etwas Ähnliches. SAS vs. R war wahrscheinlich die größte Debatte Datenwissenschaft die Branche hätte miterleben können. Python ist derzeit eine der am schnellsten wachsenden Sprachen und hat seit seiner Einführung einen langen Weg zurückgelegt. Der Grund, warum ich diese Diskussion beginne, ist nicht zuzusehen, wie sie explodiert. (das würde auch spaß machen). Ich weiß, dass wir alle von der Diskussion profitieren werden.
Dies war auch eine der am häufigsten gestellten Fragen in diesem Blog. Ich dachte, ich würde es mit all meinen Lesern und Besuchern diskutieren!!
Zu diesem Thema wurde noch nicht viel gesagt?
Wahrscheinlich ja! Aber ich habe immer noch das Bedürfnis, es aus den folgenden Gründen zu diskutieren::
- das Datenwissenschaft die Branche ist sehr dynamisch. Jeder Vergleich, der gemacht wurde, macht 2 Jahre sind möglicherweise nicht mehr relevant.
- Traditionell Felshaken wurde aus dem Vergleich herausgelassen. Ich denke, jetzt ist es mehr als nur eine würdige Überlegung.
- Während ich globale Trends zu Sprachen diskutieren werde, agregaré información específica con respecto a la industria AnalyseAnalytics bezieht sich auf den Prozess des Sammelns, Messen und analysieren Sie Daten, um wertvolle Erkenntnisse zu gewinnen, die die Entscheidungsfindung erleichtern. In verschiedenen Bereichen, wie Business, Gesundheit und Sport, Analysen können Muster und Trends erkennen, Prozesse optimieren und Ergebnisse verbessern. Der Einsatz fortschrittlicher Werkzeuge und statistischer Techniken ist unerlässlich, um Daten in anwendbares und strategisches Wissen umzuwandeln.... de la India (Wer ist auf einer anderen Evolutionsstufe)
Dann, ohne weitere Verzögerung, Lass den Kampf beginnen!
Unterseite
Hier ist eine kurze Beschreibung über die 3 Ökosysteme:
- SAS: SAS ist unangefochtener Marktführer im Bereich Business Analytics. Die Software bietet vielfältige Statistikfunktionen, hat eine gute GUI (Unternehmensleitfaden & Bergmann) für schnelles Lernen und bietet erstaunliche technische Unterstützung. Aber trotzdem, am Ende die teuerste Option und nicht immer mit den neuesten Statistikfunktionen angereichert.
- R: R ist das Open-Source-Gegenstück von SAS, traditionell in Wissenschaft und Forschung verwendet. Aufgrund seiner Open-Source-Natur, die neuesten Techniken werden schnell veröffentlicht. Es gibt viele Dokumentationen im Internet und es ist eine sehr profitable Option.
- Felshaken: Mit origin als Open-Source-Programmiersprache, Python-Nutzung hat im Laufe der Zeit zugenommen. Heute, hat Sportbibliotheken (numpy, scipy und matplotlib) und funktioniert für fast jede statistische Operation / Gebäudemodelle, die Sie erstellen möchten. Seit der Einführung von Pandas, ist in strukturierten Datenoperationen sehr stark geworden.
Vergleichsattribute
Ich werde diese Sprachen in den folgenden Attributen vergleichen:
- Verfügbarkeit / Kosten
- Leicht zu lernen
- Datenverarbeitungsfunktionen
- Grafikfunktionen
- Fortschritte im Tool
- Arbeitsszenario
- Soporte de tiefes LernenTiefes Lernen, Eine Teildisziplin der Künstlichen Intelligenz, verlässt sich auf künstliche neuronale Netze, um große Datenmengen zu analysieren und zu verarbeiten. Diese Technik ermöglicht es Maschinen, Muster zu lernen und komplexe Aufgaben auszuführen, wie Spracherkennung und Computer Vision. Seine Fähigkeit, sich kontinuierlich zu verbessern, wenn mehr Daten zur Verfügung gestellt werden, macht es zu einem wichtigen Werkzeug in verschiedenen Branchen, von Gesundheit...
- Kundenservice und Community
Ich vergleiche sie aus der Sicht eines Analysten. Deswegen, wenn Sie ein Werkzeug für Ihr Unternehmen kaufen möchten, Sie erhalten hier möglicherweise keine vollständige Antwort. Die folgenden Informationen werden weiterhin nützlich sein. Für jedes Attribut gebe ich jedem von diesen eine Punktzahl 3 Sprachen (1 – Niedrig; 5 – Alt).
La ponderación de estos ParameterDas "Parameter" sind Variablen oder Kriterien, die zur Definition von, ein Phänomen oder System zu messen oder zu bewerten. In verschiedenen Bereichen wie z.B. Statistik, Informatik und naturwissenschaftliche Forschung, Parameter sind entscheidend für die Etablierung von Normen und Standards, die die Datenanalyse und -interpretation leiten. Ihre richtige Auswahl und Handhabung sind entscheidend, um genaue und relevante Ergebnisse in jeder Studie oder jedem Projekt zu erhalten.... variará según el punto de la carrera en el que se encuentre y sus ambiciones.
1. Verfügbarkeit / Kosten
SAS ist kommerzielle Software. Es ist teuer und für die meisten Profis immer noch unerreichbar (individuell). Aber trotzdem, hat den höchsten Marktanteil bei privaten Organisationen. Deswegen, bis und es sei denn, Sie sind in einer Organisation, die in SAS investiert hat, es kann schwierig sein, auf a . zuzugreifen. Selbst wenn, SAS hat eine Universitätsausgabe herausgebracht, auf die man kostenlos zugreifen kann, aber es hat einige einschränkungen. Sie können dort auch Jupyter Notebooks verwenden!!
R & Python, Zweitens, sie sind völlig frei. Hier sind meine Ergebnisse zu diesem Parameter:
SAS – 3
R – 5
Python – 5
2. Leicht zu lernen
SAS ist leicht zu erlernen und bietet eine einfache Option (PROC-SQL) für Leute, die bereits SQL kennen. Auch sonst, hat eine schöne stabile GUI in seinem Repository. Zu Ressourcen, Tutorials sind auf den Websites verschiedener Universitäten verfügbar und SAS verfügt über eine vollständige Dokumentation. Es gibt Zertifizierungen von SAS-Ausbildungsinstituten, aber sie haben wieder ihren preis.
R hat die steilste Lernkurve unter den 3 hier aufgeführte Sprachen. Erfordert das Erlernen und Verstehen von Codierung. R ist eine Low-Level-Programmiersprache und, Daher, einfache Verfahren können längere Codes erfordern.
Python ist in der Programmierwelt für seine Einfachheit bekannt. Dies gilt auch für die Datenanalyse. Zwar gibt es derzeit keine verallgemeinerten GUI-Schnittstellen, Ich hoffe, dass Python-Laptops immer häufiger werden. Sie bieten erstaunliche Funktionen zum Dokumentieren und Teilen.
SAS – 4.5
R – 2,5
Python – 3.5
3. Datenverarbeitungsfunktionen
Das war bis vor einiger Zeit ein Vorteil für SAS. R berechnet alles im Speicher (RAM) Ja, Daher, die Berechnungen wurden durch die Menge an RAM in den Maschinen begrenzt 32 Bits. Das ist nicht der Fall. Alle drei Sprachen verfügen über gute Datenverarbeitungsfähigkeiten und Optionen für parallele Berechnungen.. Ich denke, das ist keine große Differenzierung mehr. Alle haben auch Hadoop- und Spark-Integrationen mitgebracht, y también son compatibles con Cloudera y Apache SchweinDas Schwein, ein domestiziertes Säugetier aus der Familie der Suidae, Es ist bekannt für seine Vielseitigkeit in der Landwirtschaft und Lebensmittelproduktion. In Asien beheimatet, Seine Züchtung hat sich über die ganze Welt verbreitet. Schweine sind Allesfresser und haben eine hohe Anpassungsfähigkeit an verschiedene Lebensräume. Was ist mehr, spielen eine wichtige Rolle in der Wirtschaft, Bereitstellung von Fleisch, Leder und andere abgeleitete Produkte. Ihre Intelligenz und ihr Sozialverhalten sind auch ....
SAS – 4
R – 4
Python – 4
4. Grafikfunktionen
SAS verfügt über anständige funktionale Grafikfunktionen. Aber trotzdem, es ist einfach funktional. Jede Anpassung in den Diagrammen ist schwierig und erfordert, dass Sie die Komplexität des SAS Graph-Pakets verstehen.
R verfügt zusammen mit Python über sehr fortschrittliche grafische Funktionen. Es gibt zahlreiche Pakete, die Ihnen erweiterte Grafikfunktionen bieten.
Mit der Einführung von Plotly jetzt in beiden Sprachen und mit Python, das Seaborn hat, Das Erstellen von benutzerdefinierten Grafiken war noch nie so einfach.
SAS – 3
R – 4.5
Python – 4.5
5. Fortschritte im Tool
Das 3 Ökosysteme haben alle grundlegenden und notwendigsten Funktionen zur Verfügung. Diese Funktion ist nur von Bedeutung, wenn Sie mit den neuesten Technologien und Algorithmen arbeiten.
Aufgrund seiner offenen Natur, R & Python bekommt schnell die neuesten Funktionen. SAS, Zweitens, aktualisiert seine Fähigkeiten bei Veröffentlichungen neuer Versionen. Da R in der Vergangenheit in der Wissenschaft weit verbreitet war, die Entwicklung neuer Techniken geht schnell.
Nachdem ich dies gesagt habe, SAS veröffentlicht Updates in einer kontrollierten Umgebung, sie haben sich also bestens bewährt. R & Python, Zweitens, hat einen offenen Beitrag und es besteht die Möglichkeit von Fehlern in den neuesten Entwicklungen.
SAS – 4
R – 4.5
Python – 4.5
6. Arbeitsszenario
Weltweit, SAS bleibt Marktführer bei offenen Stellen in Unternehmen. Die meisten großen Organisationen arbeiten immer noch bei SAS. R / Python, Zweitens, Sie sind bessere Optionen für Start-ups und Unternehmen, die nach Rentabilität suchen. Was ist mehr, Es wurde berichtet, dass die Zahl der Arbeitsplätze in R / Python hat in den letzten Jahren zugenommen. Hier ist ein Trend, der im Internet weit verbreitet ist, zeigt den Trend von R- und SAS-Werken. Python-Jobs für die Datenanalyse werden ähnlich oder höher tendieren als R-Jobs:
Die Grafik unten zeigt R in Blau und SAS in Orange.
es ist, Zweitens, jetzt zeigt es R in Blau und Python in Orange.
Allgemein, der sprachbasierte Marktplatz kann als solcher dargestellt werden:
SAS – 4
R – 4.5
Python – 4.5
7. Kundenservice und Community
R und Python haben die größten Online-Communitys, aber sie haben keinen Kundenservice. Dann, wenn du probleme hast, Er ist allein. Aber trotzdem, du wirst viel hilfe bekommen.
SAS, Zweitens, hat einen engagierten Kundenservice zusammen mit der Community. Deswegen, wenn Sie Installationsprobleme oder andere technische Herausforderungen haben, du kannst mit ihnen kommunizieren.
SAS – 4
R – 3,5
Python – 3.5
8. Deep-Learning-Unterstützung
Deep Learning in SAS steckt noch in den Kinderschuhen und es gibt noch viel zu tun.
Zweitens, Python hat auf diesem Gebiet große Fortschritte gemacht und verfügt über zahlreiche Pakete wie Tensorflow und Keras.
R hat kürzlich Unterstützung für diese Pakete hinzugefügt, zusammen mit einigen Grundlagen auch. Die Pakete kerasR und keras in R fungieren als Schnittstelle zum ursprünglichen Python-Paket, Schwer.
SAS – 2
Python – 4.5
R – 3
Andere Faktoren:
Unten sind einige weitere bemerkenswerte Punkte:
- Python wird häufig in der Webentwicklung verwendet. Dann, wenn Sie in einem Online-Geschäft tätig sind, Die Verwendung von Python für die Webentwicklung und -analyse kann Synergien bieten
- SAS hatte früher einen großen Vorteil bei der End-to-End-Infrastrukturbereitstellung (visuelle Analyse, Data Warehouse, Datenqualität, Berichte und Analysen), das wurde durch die Integration gemildert / R-Unterstützung auf Plattformen wie SAP HANA und Tableau. Noch weit von einer nahtlosen Integration wie SAS . entfernt, aber die Reise hat begonnen.
Fazit
Wir sehen, dass sich der Markt im aktuellen Szenario leicht in Richtung Python neigt. Es ist verfrüht, darauf zu wetten, was sich durchsetzen wird, angesichts der Dynamik der Branche. Abhängig von Ihren Umständen (Professionelle Bühne, Finanzen, etc.), Sie können Ihre eigenen Gewichte hinzufügen und überlegen, was für Sie das Richtige sein könnte. Dann, einige spezifische Szenarien werden gezeigt:
- Wenn Sie in die Analytikbranche einsteigen (speziell in Indien), Ich würde empfehlen, SAS als erste Sprache zu lernen. Es ist leicht zu erlernen und hat die höchste Beteiligung am Arbeitsmarkt.
- Wenn Sie jemand sind, der bereits einige Zeit in der Branche verbracht hat, Sie sollten versuchen, Ihre Erfahrung zu diversifizieren, um ein neues Werkzeug zu erlernen.
- Für Branchenexperten und Profis, die Leute sollten es zumindest wissen 2 von diesen. Das würde viel Flexibilität für die Zukunft bringen und neue Möglichkeiten eröffnen..
- Wenn Sie in einem Start-up-Unternehmen sind / autonom, R / Python ist nützlicher.
Strategisch, Unternehmenskonfigurationen, die mehr praktische Unterstützung und Schulung erfordern, wählen SAS als Option.
Forscher und Statistiker wählen R als Alternative, weil es bei schweren Berechnungen hilft. Wie sie sagen, R sollte die Arbeit erledigen und Ihren Computer nicht einfacher machen.
Python ist aufgrund seiner leichten Natur und der wachsenden Community die offensichtliche Wahl für heutige Startups.. Es ist auch die beste Wahl für Deep Learning.
Hier ist die endgültige Scorecard:
Das sind meine Ansichten zu diesem Vergleich. Jetzt, Sie sind an der Reihe, Ihre Ansichten in den Kommentaren unten zu teilen.