Panoramica
- Python se ha sumado al debate de larga duración de R vs SAS
- Cada uno de R, SAS y Python tiene sus pros y sus contras y se puede comparar con criterios como el costo, el escenario del trabajo y el soporte para los diferentes algoritmos de aprendizaje automático.
- También puede elegir cualquiera de las tres herramientas según la etapa de su carrera de ciencia de datos en la que se encuentre
Nota: este artículo se publicó originalmente en 27 marzo 2014 e aggiornato il 12 settembre 2017
introduzione
¡Nos encantan las comparaciones!
De Samsung vs. Apple vs. HTC en teléfonos inteligentes; iOS vs. Android vs. Windows en sistemas operativos móviles para comparar candidatos para las próximas elecciones o seleccionar capitán para el equipo de la copa del mundo, las comparaciones y las discusiones nos enriquecen en nuestra vida. Si te encantan las discusiones, todo lo que necesitas hacer es hacer una pregunta relevante en medio de una comunidad apasionada y luego verla explotar. La belleza del proceso es que todos en la sala se marchan como personas más informadas.
Estoy provocando algo similar aquí. SAS vs.R ha sido probablemente el debate más grande Scienza dei dati la industria podría haber sido testigo. Python es uno de los lenguajes de más rápido crecimiento ahora y ha recorrido un largo camino desde su inicio. La razón por la que comienzo esta discusión no es para verla explotar (eso también sería divertido). Sé que todos nos beneficiaremos de la discusión.
Esta también ha sido una de las preguntas más frecuentes en este blog. ¡Pensé que lo discutiría con todos mis lectores y visitantes!
¿No se ha dicho ya mucho sobre este tema?
¡Probablemente si! Pero todavía siento la necesidad de discutirlo por las siguientes razones:
- il Scienza dei dati la industria es muy dinámica. Cualquier comparación que se haya hecho hace 2 años podría dejar de ser relevante.
- Tradizionalmente Chiodo se ha dejado fuera de la comparación. Creo que ahora es algo más que una consideración digna.
- Si bien discutiré las tendencias globales sobre los idiomas, agregaré información específica con respecto a la industria analiticoL'analisi si riferisce al processo di raccolta, Misura e analizza i dati per ottenere informazioni preziose che facilitano il processo decisionale. In vari campi, come business, Salute e sport, L'analisi può identificare modelli e tendenze, Ottimizza i processi e migliora i risultati. L'utilizzo di strumenti avanzati e tecniche statistiche è fondamentale per trasformare i dati in conoscenze applicabili e strategiche.... de la India (que se encuentra en un nivel diferente de evolución)
Quindi, senza ulteriori indugi, ¡que comience el combate!
Parte inferiore
Aquí hay una breve descripción sobre los 3 ecosistemas:
- SAS: SAS ha sido el líder indiscutible del mercado en el espacio de análisis comercial. El software ofrece una gran variedad de funciones estadísticas, tiene una buena GUI (Enterprise Guide & Miner) para que las personas aprendan rápidamente y proporciona un soporte técnico increíble. tuttavia, acaba siendo la opción más cara y no siempre se enriquece con las últimas funciones estadísticas.
- R: R es la contraparte de código abierto de SAS, que tradicionalmente se ha utilizado en el ámbito académico y la investigación. Debido a su naturaleza de código abierto, las últimas técnicas se lanzan rápidamente. Hay mucha documentación disponible en Internet y es una opción muy rentable.
- Chiodo: Con el origen como un lenguaje de programación de código abierto, el uso de Python ha crecido con el tiempo. Oggi, tiene bibliotecas deportivas (insensibile, scipy y matplotlib) y funciona para casi cualquier operación estadística / construcción de modelos que desee realizar. Desde la introducción de los pandas, se ha vuelto muy fuerte en las operaciones con datos estructurados.
Atributos de comparación
Compararé estos idiomas en los siguientes atributos:
- Disponibilità / Costo
- Facilità di apprendimento
- Capacità di gestione dei dati
- Funzionalità grafiche
- Avances en la herramienta
- Scenario di lavoro
- Soporte de apprendimento profondoApprendimento profondo, Una sottodisciplina dell'intelligenza artificiale, si affida a reti neurali artificiali per analizzare ed elaborare grandi volumi di dati. Questa tecnica consente alle macchine di apprendere modelli ed eseguire compiti complessi, come il riconoscimento vocale e la visione artificiale. La sua capacità di migliorare continuamente man mano che vengono forniti più dati lo rende uno strumento chiave in vari settori, dalla salute...
- Servicio de atención al cliente y comunidad
Los estoy comparando desde el punto de vista de un analista. Perciò, si está buscando comprar una herramienta para su empresa, es posible que no obtenga una respuesta completa aquí. La siguiente información seguirá siendo útil. Por cada atributo le doy una puntuación a cada uno de estos 3 Le lingue (1 – Basso; 5 – Alto).
La ponderación de estos parametriIl "parametri" sono variabili o criteri che vengono utilizzati per definire, misurare o valutare un fenomeno o un sistema. In vari campi come la statistica, Informatica e Ricerca Scientifica, I parametri sono fondamentali per stabilire norme e standard che guidano l'analisi e l'interpretazione dei dati. La loro corretta selezione e gestione sono fondamentali per ottenere risultati accurati e pertinenti in qualsiasi studio o progetto.... variará según el punto de la carrera en el que se encuentre y sus ambiciones.
1. Disponibilità / Costo
SAS es un software comercial. Es caro y aún está fuera del alcance de la mayoría de los profesionales (a título individual). tuttavia, tiene la participación de mercado más alta en Organizaciones Privadas. Perciò, hasta y a menos que esté en una organización que haya invertido en SAS, puede ser difícil acceder a una. Sebbene, SAS ha traído una edición universitaria que es de acceso gratuito, pero tiene algunas limitaciones. ¡También puede usar Jupyter Notebooks allí!
R & Pitone, In secondo luogo, son completamente gratuitos. Aquí están mis puntuaciones en este parámetro:
SAS – 3
R – 5
Pitone – 5
2. Facilità di apprendimento
SAS es fácil de aprender y ofrece una opción sencilla (PROC SQL) para las personas que ya conocen SQL. Incluso de lo contrario, tiene una buena interfaz gráfica de usuario estable en su repositorio. En cuanto a recursos, existen tutoriales disponibles en sitios web de diversas universidades y SAS cuenta con una documentación completa. Existen certificaciones de los institutos de formación SAS, pero nuevamente tienen un costo.
R tiene la curva de aprendizaje más pronunciada entre los 3 idiomas enumerados aquí. Richiede l'apprendimento e la comprensione della codifica. R es un lenguaje de programación de bajo nivel y, così, procedure semplici possono richiedere codici più lunghi.
Python es conocido por su simplicidad en el mundo de la programación. Esto también sigue siendo válido para el análisis de datos. Si bien no hay interfaces GUI generalizadas a partir de ahora, espero que los portátiles Python se vuelvan cada vez más comunes. Proporcionan funciones increíbles para documentar y compartir.
SAS – 4.5
R – 2,5
Pitone – 3.5
3. Capacità di gestione dei dati
Esto solía ser una ventaja para SAS hasta hace algún tiempo. R calcula todo lo que hay en la memoria (RAM) e, così, i calcoli erano limitati dalla quantità di RAM nelle macchine 32 bit. Questo non è il caso. Los tres lenguajes tienen buenas capacidades de manejo de datos y opciones para cálculos en paralelo. Penso che questa non sia più una grande differenziazione. Todos ellos también han traído integraciones de Hadoop y Spark, y también son compatibles con Cloudera y Apache MaialeEl cerdo, un mamífero domesticado de la familia Suidae, es conocido por su versatilidad en la agricultura y la producción de alimentos. Originario de Asia, su cría se ha extendido por todo el mundo. Los cerdos son omnívoros y poseen una alta capacidad de adaptación a diversos hábitats. Cosa c'è di più, juegan un papel importante en la economía, proporcionando carne, cuero y otros productos derivados. Su inteligencia y comportamiento social también son....
SAS – 4
R – 4
Pitone – 4
4. Funzionalità grafiche
SAS tiene capacidades gráficas funcionales decentes. tuttavia, es solo funcional. Cualquier personalización en los gráficos es difícil y requiere que comprenda las complejidades del paquete SAS Graph.
R tiene capacidades gráficas muy avanzadas junto con Python. Existen numerosos paquetes que le brindan capacidades gráficas avanzadas.
Con la introducción de Plotly en ambos lenguajes ahora y con Python que tiene Seaborn, hacer gráficos personalizados nunca ha sido tan fácil.
SAS – 3
R – 4.5
Pitone – 4.5
5. Avances en la herramienta
Il 3 ecosistemas tienen disponibles todas las funciones básicas y más necesarias. Esta función solo importa si está trabajando en las últimas tecnologías y algoritmos.
Debido a su naturaleza abierta, R & Python obtiene las últimas funciones rápidamente. SAS, In secondo luogo, actualiza sus capacidades en los lanzamientos de nuevas versiones. Dado que R se ha utilizado ampliamente en el mundo académico en el pasado, el desarrollo de nuevas técnicas es rápido.
Habiendo dicho esto, SAS lanza actualizaciones en un entorno controlado, por lo que están bien probadas. R & Pitone, In secondo luogo, tiene una contribución abierta y hay posibilidades de errores en los últimos desarrollos.
SAS – 4
R – 4.5
Pitone – 4.5
6. Escenario laboral
A nivel mundial, SAS sigue siendo el líder del mercado en puestos de trabajo corporativos disponibles. La mayoría de las grandes organizaciones todavía trabajan en SAS. R / Pitone, In secondo luogo, son mejores opciones para nuevas empresas y empresas que buscan rentabilidad. Cosa c'è di più, se ha informado que el número de trabajos en R / Python ha aumentado en los últimos años. Aquí hay una tendencia ampliamente publicada en Internet, que muestra la tendencia de los trabajos de R y SAS. Los trabajos de Python para el análisis de datos tendrán una tendencia similar o superior a los trabajos de R:
El siguiente gráfico muestra R en azul y SAS en naranja.
Generalmente, el mercado basado en idiomas se puede representar como tal:
SAS – 4
R – 4.5
Pitone – 4.5
7. Servicio de atención al cliente y comunidad
R y Python tienen las comunidades en línea más grandes, pero no tienen soporte de servicio al cliente. Quindi, si tiene problemas, está solo. tuttavia, recibirás mucha ayuda.
SAS, In secondo luogo, tiene un servicio al cliente dedicado junto con la comunidad. Perciò, si tiene problemas de instalación o cualquier otro desafío técnico, puede comunicarse con ellos.
SAS – 4
R – 3,5
Pitone – 3.5
8. Soporte de aprendizaje profundo
El aprendizaje profundo en SAS todavía se encuentra en su fase inicial y hay mucho que trabajar en ello.
In secondo luogo, Python ha tenido grandes avances en el campo y tiene numerosos paquetes como Tensorflow y Keras.
R ha agregado recientemente soporte para esos paquetes, junto con algunos básicos también. Los paquetes kerasR y keras en R actúan como una interfaz para el paquete Python original, Duro.
SAS – 2
Pitone – 4.5
R – 3
Otros factores:
A continuación se presentan algunos puntos más dignos de mención:
- Python se usa ampliamente en el desarrollo web. Quindi, si está en un negocio en línea, el uso de Python para el desarrollo y análisis web puede brindar sinergias
- SAS solía tener una gran ventaja en la implementación de infraestructura de extremo a extremo (analisi visiva, data warehouse, qualità dei dati, informes y análisis), que se ha mitigado con la integración / soporte de R en plataformas como SAP HANA y Tableau. Todavía está lejos de una integración perfecta como SAS, pero el viaje ha comenzado.
conclusione
Vemos que el mercado se inclina ligeramente hacia Python en el escenario actual. Será prematuro apostar sobre lo que prevalecerá, dada la naturaleza dinámica de la industria. Dependiendo de sus circunstancias (etapa profesional, finanza, eccetera.), puede agregar sus propios pesos y pensar en lo que podría ser adecuado para usted. Prossimo, se muestran algunos escenarios específicos:
- Si está entrando en la industria analítica (específicamente en India), le recomendaría aprender SAS como su primer idioma. Es fácil de aprender y tiene la mayor participación en el mercado laboral.
- Si usted es alguien que ya ha pasado un tiempo en la industria, debe intentar diversificar su experiencia para aprender una nueva herramienta.
- Para los expertos y profesionales de la industria, las personas deben conocer al menos 2 de estos. Eso agregaría mucha flexibilidad para el futuro y abriría nuevas oportunidades.
- Si está en una empresa de nueva creación / autonomo, R / Python es más útil.
Estratégicamente, las configuraciones corporativas que requieren más asistencia práctica y capacitación eligen SAS como una opción.
Los investigadores y estadísticos eligen R como una alternativa porque ayuda en cálculos pesados. Come dicono, R estaba destinado a hacer el trabajo y no a facilitar su computadora.
Python ha sido la opción obvia para las nuevas empresas de hoy debido a su naturaleza liviana y su comunidad en crecimiento. También es la mejor opción para el aprendizaje profundo.
Aquí está el cuadro de mando final:
Estos son mis puntos de vista sobre esta comparación. Ora, es su turno de compartir sus puntos de vista a través de los comentarios a continuación.