Es la marca de una persona verdaderamente inteligente que la estadística mueve.
El aspecto más importante de cualquier enfoque de ciencia de datos es cómo se procesa la información. Cuando hablamos de desarrollar conocimientos a partir de datos, básicamente se trata de explorar las posibilidades. Esas posibilidades en la ciencia de datos se conocen como Analyse statistique.
La mayoría de nosotros nos preguntamos cómo pueden los modelos de aprendizaje automático procesar fácilmente datos en forma de texto, images, videos y otros formatos altamente desestructurados. Mais, la verdad es que en realidad convertimos esos datos en una forma numérica que no es exactamente nuestros datos, sino su equivalente numérico. Ensuite, esto nos lleva al aspecto muy importante de la ciencia de datos.
Con datos en formato numérico, nos brinda infinitas posibilidades para comprender la información que sale de ellos. Las estadísticas actúan como una vía para comprender sus datos y procesarlos para obtener resultados exitosos. No solo el poder de las estadísticas se limita a comprender los datos, sino que también proporciona métodos para medir el éxito de nuestros conocimientos, obtener diferentes enfoques para el mismo problema y obtener el enfoque matemático correcto para sus datos.
Importancia de las estadísticas para la ciencia de datos
La mayoría de los científicos de datos siempre invierten más en el preprocesamiento de datos. Esto requiere una buena comprensión de las estadísticas. Hay algunos pasos generales que siempre deben realizarse para procesar cualquier dato.
- Identifique la importancia de las características mediante el uso de varias pruebas estadísticas.
- Encontrar la relación entre las funciones para eliminar la posibilidad de que se dupliquen las funciones.
- Conversión de las funciones al formato requerido.
- Normalizar y escalar los datos. Este paso también implica la identificación de la distribución de datos y la naturaleza de los datos.
- Tomando los datos para su posterior procesamiento mediante el uso de los ajustes necesarios en los datos.
- Après traitement des données, identifique el enfoque / modelo matemático correcto.
- Una vez que se obtienen los resultados, los resultados se verifican en las diferentes escalas de medición de precisión.
El procesamiento de datos desde el principio hasta el final del ciclo completo es un requisito de estadísticas en cada paso. Es por eso que un buen estadístico también puede ser un buen científico de datos.
Guía para aprender estadísticas
Siempre es necesario comprender todos los aspectos fundamentales de la estadística. Cependant, la mayoría de la gente no tiene muy claro por dónde empezar.
Estos son los pocos conceptos clave que se requieren para acelerar y comprender los fundamentos de la estadística para la ciencia de datos:
Probabilité
La probabilidad es la necesidad básica para comprender las posibilidades. Pour commencer, tomemos un ejemplo muy básico: ¿Cuáles son las posibilidades de que el equipo A gane el partido de fútbol contra el equipo B. Para obtener esta respuesta, podríamos requerir que 100 personas den sus respectivos votos? Número de muestras. Basándonos en esos votos, podemos tener la posibilidad de qué equipo puede ganar el juego.
Mais, dans cet exemple, nos encontramos con otro concepto muy importante que se conoce como muestreo: identificar el conjunto correcto de personas para votar por los resultados. Ensuite, la probabilidad es la posibilidad de que el evento ocurra o no. Dependiendo del escenario, podemos construir diferentes soluciones en torno a esto.
Échantillonnage
El muestreo, como discutimos en el ejemplo anterior, identifica al grupo correcto de personas. La pregunta es cuál es el grupo de personas adecuado. Continuemos con nuestro ejemplo anterior para el escenario anterior, necesitamos a esas 100 personas que tienen un buen conocimiento del fútbol, que conocen la historia del equipo A y B, que no deben estar sesgadas hacia un equipo debido a sus preferencias personales. Donc, la identificación de la muestra correcta se puede realizar mediante varios enfoques estadísticos. Hay varios tipos de métodos de muestreo: Muestreo aleatorio simple, Muestreo sistemático, Muestreo estratificado, Muestreo agrupado, etc.
Tendencia y distribución de datos
La distribución de datos es un aspecto muy importante. La famosa distribución como Distribución Normal es muy significativa. Par exemple, cuando hablamos de la distribución de la altura y el peso del mundo, se trata de datos distribuidos normalmente que muestran la simetría de la naturaleza. La distribución normal tiene que Media, Moda y MédianLa médiane est une mesure statistique qui représente la valeur centrale d’un ensemble de données ordonnées. Pour le calculer, Les données sont organisées de la plus basse à la plus élevée et le numéro au milieu est identifié. S’il y a un nombre pair d’observations, La moyenne des deux valeurs fondamentales est calculée. Cet indicateur est particulièrement utile dans les distributions asymétriques, puisqu’il n’est pas affecté par les valeurs extrêmes.... coinciden en el pico central. Se supone que estos datos son datos muy precisos. Donc, identificar la distribución y la asimetría de los datos es un concepto muy importante.
Tests d'hypothèses
Si sabemos si realizar alguna acción o no. Si esas acciones darán un resultado positivo o negativo, entonces podemos tener la ventaja adicional de hacer las cosas correctas. La prueba de hipótesis proporciona la identificación de la situación en la que se debe tomar o no la acción en función de los resultados que producirá. Hay otras pruebas además de las pruebas A / B, essai Z, Test T, hypothèse nulleLa hipótesis nula es un concepto fundamental en la estadística que establece una afirmación inicial sobre un parámetro poblacional. Su propósito es ser probada y, en caso de ser refutada, permite aceptar la hipótesis alternativa. Este enfoque es esencial en la investigación científica, ya que proporciona un marco para evaluar la evidencia empírica y tomar decisiones basadas en datos. Su formulación y análisis son cruciales en estudios estadísticos.... con relevancia similar.
Variaciones
Cuando hablamos de diferentes variaciones en los datos. Hablamos de distorsión, Erreur, desplazamiento de datos. Junto con las variaciones en los datos, el rango de los datos, la relación dentro de los datos. Todo esto explica la variabilidad de los datos. Algunos de los términos clave para comprender aquí son: variance, rang, écart-type, desviación de error, covariance, corrélation, causalidad, etc.
Régression
La regresión en términos simples es encontrar una relación entre las variables independientes y dependientes. La regresión puede ser de dos tipos en términos generales: régression linéaire, la régression linéaire multiple.
Régression linéaire – Y = aX + C
Regresión multilineal – Y = aX + bX1 + cX2 +…. + C
La estadística es un concepto amplio que se limita no solo a lo que existe, sino a lo que se puede derivar de las técnicas existentes para construir algo nuevo. Donc, la estadística es muy importante para la ciencia de datos, ya que ayuda a comprender las soluciones existentes y a descubrir nuevos desarrollos.
Siempre hay una manera de hacerlo mejor: encuéntrelo y conviértase en un innovador
Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.
En rapport
Articles Similaires:
- Statistiques pour la science des données | Guide du débutant en statistiques pour la science des données
- Statistiques de commande | Quelles sont les statistiques de commande?
- Statistiques dans Excel | 10 fonctions statistiques dans Microsoft Excel
- Tests statistiques | Sélection de fonctionnalités à l'aide de tests statistiques