Visión general
- La ciencia de datos está en constante evolución con nuevas herramientas, marcos y tecnologías.
- Cada herramienta / técnica tiene su propio caso de uso único junto con características y funciones
- Consulte esta lista exhaustiva de hojas de trucos sobre conceptos populares de ciencia de datos.
Introducción
La ciencia de datos es un campo en constante crecimiento, existen numerosas herramientas y técnicas para recordar. No es posible que nadie recuerde todas las funciones, operaciones y fórmulas de cada concepto. Por eso tenemos hojas de trucos. Pero hay una gran cantidad de hojas de trucos disponibles, elegir la hoja de trucos correcta es una tarea difícil. Entonces, decidí escribir este artículo.
Aquí he seleccionado las hojas de trucos con los siguientes criterios: exhaustividad, claridad y contenido.
Después de aplicar estos filtros, he recopilado unas 28 hojas de trucos sobre aprendizaje automático, ciencia de datos, probabilidad, SQL y Big Data. Para su conveniencia, he separado las hojas de trucos por separado para cada uno de los temas anteriores. Hay hojas de trucos sobre herramientas y técnicas, varias bibliotecas e idiomas.
Siga leyendo para saber qué hoja de trucos usar para un tema en particular.
Python for Data Science Cheat Sheets
1.Guía rápida para aprender Python para la ciencia de datos
Si está empezando a aprender Python, esta hoja de trucos es el mejor recurso para usted. En esta hoja de trucos, encontrará una guía paso a paso para aprender Python. Ofrece recursos a seguir, bibliotecas de Python que debe conocer y algunos consejos útiles.
2. Python for Data Science Cheat sheet
Esta hoja de trucos de Datacamp cubre todos los conceptos básicos de Python necesarios para la ciencia de datos. Si acaba de comenzar a trabajar en Python, conserve esto como referencia rápida. Guarde estos códigos de trampas para variables y funciones de tipos de datos, operación de cadenas, conversión de tipos, listas y operaciones de NumPy de uso común. El aspecto único de esta hoja de trucos es que enumera las bibliotecas de Python importantes y proporciona códigos de trucos para seleccionar e importar estas bibliotecas.
3. Python For Data Science Cheat Sheet NumPy
NumPy es una biblioteca central para computación científica en Python. En esta hoja de trucos de DataCamp, encontrará códigos de trucos para crear matrices NumPy, realizar operaciones matemáticas en matrices, subconjuntos, segmentaciones, indexación y manipulación de matrices. El aspecto único de esta hoja de trucos es que cada función ha sido categorizada y explicada en un inglés simple.
4. Análisis de datos exploratorios en Python
Su mejor recurso para realizar la exploración de datos en Python usando NumPy, Pandas y Matplotlib. Con esta hoja de trucos, aprenderá cómo cargar archivos en Python, convertir variables, ordenar datos, crear gráficos, crear conjuntos de datos de muestra, tratar valores perdidos y mucho más. Es una de las hojas de trucos simplificadas sobre exploración de datos.
5. Exploración de datos usando Pandas en Python
Pandas es una de las bibliotecas importantes de Python. Esta hoja de trucos sobre la operación de exploración de datos en Python usando Pandas es su recurso de referencia para conocer cada paso involucrado en la exploración de datos. Encontrará códigos de trucos para leer y escribir datos, obtener una vista previa de los marcos de datos, cambiar el nombre de las columnas del marco de datos, agregar los datos, etc.
6. Visualización de datos en Python
Ya sea un científico de datos o un no técnico, ambos interpretan fácilmente la visualización. En gráficos y diagramas visuales, los datos cobran vida y hablan por sí mismos. En esta hoja de trucos, aprenda a realizar la visualización de datos en Python. Explore las diferentes formas en las que puede trazar sus datos. Encuentre un enfoque paso a paso para trazar histogramas, gráficos de barras, gráficos de líneas, gráficos de dispersión, etc.
7. Python para ciencia de datos Cheat Sheet Bokeh
Esta hoja de trucos sobre Bokeh, una biblioteca de visualización interactiva en Python, es especialmente útil con grandes conjuntos de datos. En esta hoja de trucos de DataCamp, obtendrá los pasos básicos para trazar, renderizar y personalizar visualmente, guardar trazados y crear gráficos estadísticos.
8. Hoja de trucos: Scikit Learn
Aquí hay una hoja de trucos sobre scikit-learn para cada técnica en Python. Proporciona diferentes funciones utilizadas para preprocesamiento, regresión, clasificación, agrupamiento, reducción de dimensionalidad, selección de modelo y métrica junto con su descripción. El aspecto único de esta hoja de trucos es que describe las etapas completas del aprendizaje automático.
9. Pasos para realizar la limpieza de datos de texto en Python
La limpieza de texto puede ser un proceso engorroso. Y conocer los procedimientos correctos es la clave para obtener el resultado deseado. Consulte esta hoja de trucos para realizar la limpieza de datos de texto en Python paso a paso. Siga esta hoja de trucos para saber cuándo elimina las palabras vacías, la puntuación, las expresiones, etc. El aspecto único de esta hoja de trucos es que cada paso se ha explicado con códigos y ejemplos.
R para hojas de referencia de ciencia de datos
1.Tarjeta de referencia R
Use esta hoja de referencia para códigos de trucos para todas las funciones y operadores bajo R. Comprenda qué significan los diferentes términos bajo R. Explica todas las funciones bajo creación de datos, procesamiento de datos, manipulación de datos, función de modelo, selección y muchas más.
2. Importación de datos en R
Aprenda a importar datos con readr, tibble y tidyr. Encuentra funciones para escribir y leer funciones en tibble. También le proporciona argumentos útiles, remodelar datos, combinar celdas con tidyr.
3. Transformación de datos con dplyr
Esta hoja de trucos de RStudio es un material de referencia para la transformación de datos con dplyr. Obtenga códigos cortos y operadores para todas las operaciones bajo transformación de datos. Luego, sea resumir casos, agrupar casos, manipular, vectorizar y combinar variables.
4. Hoja de trucos: 11 pasos para la exploración de datos en R (con códigos)
Esta hoja de trucos ofrece una guía paso a paso para la exploración de datos en R. Aprenda a cargar archivos en R, convertir variables a diferentes tipos de datos, transponer un conjunto de datos, ordenar marcos de datos, crear gráficos y mucho más.
5. Visualización de datos en R
Arriba vimos una hoja de trucos sobre visualización de datos en Python. Aquí hay una hoja de trucos de visualización de datos para proporcionar los diferentes gráficos mediante los cuales puede trazar los datos. Con unas pocas líneas de código, puede crear hermosos gráficos e historias de datos. R tiene bibliotecas increíbles para crear visualizaciones básicas y más evolucionadas como gráfico de barras, histograma, diagrama de dispersión, visualización de mapas, diagrama de mosaico y varios otros.
6. Visualización de datos con ggplot2
Esta hoja de trucos es específicamente para crear una visualización en R usando ggplot2. ggplot2 trabaja con la gramática de los gráficos y se basa en un conjunto de marcas visuales que representan puntos de datos. Obtenga códigos de trucos para crear una variable y dos componentes gráficos variables. Junto con diferentes técnicas para la creación de parcelas en R.
7. Hoja de trucos: paquete Caret
El paquete Caret proporciona un conjunto de funciones que agiliza el proceso de creación de modelos predictivos. La hoja de trucos incluye funciones para la división de datos, preprocesamiento, selección de funciones, ajuste y visualización del modelo.
8. Tarjeta de referencia R para minería de datos
Esta hoja de trucos proporciona funciones para la minería de texto, detección de valores atípicos, agrupamiento, clasificación, análisis de redes sociales, big data, computación paralela usando R. Esta hoja de trucos le brinda todas las funciones y operadores utilizados para la minería de datos en R.
9. Guía para aprender rápidamente computación en la nube en programación R
La computación en la nube nos ha facilitado el acceso a nuestros archivos y datos desde cualquier lugar. En esta hoja de trucos, aprenderá cómo usar la computación en la nube en R. Siga esta guía paso a paso para usar la programación en R en AWS.
Hojas de trucos de aprendizaje automático
1.Hoja de trucos: códigos Python y R para algoritmos comunes de aprendizaje automático
En esta hoja de trucos, obtendrá códigos en Python & R para varios algoritmos de aprendizaje automático de uso común. Los algoritmos incluidos son regresión lineal, regresión logística, árbol de decisión, SVM, Naive Bayes, KNN, K-medias, bosque aleatorio y algunos otros.
2. Hoja de trucos del algoritmo de Scikit Learn
Esta hoja de trucos es proporcionada por los creadores oficiales de scikit-learn. Muchas personas se enfrentan al problema de elegir un algoritmo de aprendizaje automático en particular para diferentes tipos de datos y problemas. Con la ayuda de esta hoja de trucos, tiene el flujo completo para resolver un problema de aprendizaje automático.
3. Aprendizaje automático de Microsoft Azure: hoja de referencia de algoritmos
Esta hoja de referencia le ayuda a elegir el mejor algoritmo de Azure Machine Learning Studio para su solución de análisis predictivo. Desarrollado por el propio equipo de Microsoft Azure, la hoja de trucos le brinda un camino claro según la naturaleza de los datos.
Hojas de trucos de probabilidad
1. Hoja de referencia de conceptos básicos de probabilidad
Esta hoja de trucos le proporciona un material de referencia completo sobre probabilidad y estadísticas. Cada concepto ha sido explicado maravillosamente con una explicación esquemática. Abarca desde las reglas básicas de probabilidad hasta conceptos estadísticos avanzados de una manera muy precisa y exacta. Desarrollado por la Universidad de Pensilvania, es una de las hojas de trucos más completas que puede tener en sus manos.
2. Hoja de trucos de probabilidad para la distribución
Consulte esta hoja de trucos para obtener una descripción general rápida de la distribución de Poisson, la distribución normal, la distribución binomial, la distribución geométrica y muchos más. Proporciona notación, fórmulas y una breve explicación en inglés simple para cada distribución.
Hojas de trucos de SQL y MySQL
1. Hoja de referencia de SQL
En esta hoja de trucos, aprenda a realizar operaciones básicas en SQL. Obtenga la función para insertar datos, actualizar datos, borrar datos, agrupar datos, ordenar datos, etc. Si ha comenzado a usar SQL, esta es la mejor guía de referencia.
2. Hoja de trucos de MySQL y SQL
En esta hoja de trucos, encontrará los comandos de MySQL y SQL de uso común. Obtenga códigos de trucos para la función matemática de MySQL, la función de cadena de MySQL, los comandos básicos de MySQL. También encontrará comandos SQL para modificar y consultar.
Hojas de trucos de Big Data
1. Hoja de trucos de Hadoop
Se dice con razón que Hadoop tiene un vasto ecosistema e incluye varias operaciones. Conozca los distintos operadores, cómo trabajan y de qué operación son responsables. La hoja de trucos se ha dividido en una función general respectiva, como sistemas distribuidos, procesamiento de datos, entrada / salida de datos y administración.
2. Hoja de trucos de Apache Spark
Aquí hay una hoja de trucos para Apache Spark para varias operaciones como transformación, acciones, métodos de persistencia, transformación y acciones adicionales, RDD extendido, transformación de transmisión, persistencia de RDD, etc.
3. Hoja de referencia de la función Hive
En esta hoja de trucos, obtenga comandos para las funciones de Hive. Proporciona códigos de trampa para funciones de datos, función matemática, función de cadena, función de recopilación, función agregada incorporada, función de generación de tabla incorporada, función condicional y funciones para análisis de texto.
Notas finales
Espero que hayas disfrutado leyendo este artículo. Si me he perdido alguna hoja de trucos que crea que debería incluirse en la lista. Luego publícalos en la sección de comentarios. El otro lector y yo nos gustaría saber sobre ellos.
Si tiene alguna sugerencia / comentario, no olvide compartirlo ingresando sus comentarios. Díganos qué más hojas de trucos le gustaría que publiquemos.