Questo articolo è stato pubblicato nell'ambito del Blogathon sulla scienza dei dati
introduzione
Toda carrera actual necesita tener una comunidad, un grupo de personas con las que podamos hablar sobre el trabajo, los errores, las ideas y aprender. Kaggle es la comunidad de ciencia de datos más grande y popular del mundo. Tener una comunidad así nos ayuda a sentir que “pertenecemos”, que es uno de los sentimientos cruciales para nuestra interacción social y nuestra salud.
In questo articolo, veremos a Kaggle como una comunidad completa y a Kaggle como una plataforma: todas sus diferentes herramientas, servicios y recursos disponibles para que podamos imparare Come practicar la ciencia de datos.
Veamos la interfaz que obtenemos cuando visitamos Kaggle por primera vez.
Antes de comenzar a usar Kaggle, necesitamos crear una cuenta y luego iniciar sessioneIl "Sessione" È un concetto chiave nel campo della psicologia e della terapia. Si riferisce a un incontro programmato tra un terapeuta e un cliente, dove si esplorano i pensieri, Emozioni e comportamenti. Queste sessioni possono variare in durata e frequenza, e il suo scopo principale è quello di facilitare la crescita personale e la risoluzione dei problemi. L'efficacia delle sessioni dipende dalla relazione tra il terapeuta e il terapeuta.., puede ver ambas opciones en la esquina superior derecha. Una vez que haya terminado con eso, esto es lo que podría parecer.
Algunas de las cosas visibles aquí pueden ser diferentes para usted porque la interfaz está personalizada con la forma en que he usado Kaggle hasta ahora desde el momento en que me registré.
Navbar y todo lo que tenemos a nuestra disposición en Kaggle:
Una vez que hago clic en ‘más’, esas son todas las cosas a las que puedo acceder desde mi cuenta de Kaggle.
Secondo me, ci sono 4 cosas importantes que hacen que Kaggle “LO MEJOR”.
1. Cursos y certificados gratuitos disponibles
Hay muchos cursos disponibles en múltiples dominios de aprendizaje automático y ciencia de datos. No solo los cursos están disponibles, después de cada lección, sino que también hay cuadernos de práctica (ejercicios) disponibles para familiarizarse con el tema. Para obtener su certificado gratuito de Kaggle, es necesario completar todas las tareas y ejercicios.
Hay pocos cursos más, pero a través de esto, quería mostrarte que existe tal diversidad de temas en estos cursos que no tienes que ir a ningún lado, en cualquier momento para sentirte perdido en algún tema o problema, obtén ayuda desde aquí.
Déjame mostrarte cómo se ven estos cursos con un ejemplo:
Al final de cada curso, hay una lección adicional, que es diferente en términos de contenido pero similar al caso de uso y comprensión del curso. En su mayoría incluyen algún tema famoso y / o poderoso. Aquí tenemos AutoML (di Google) para automatizar el aprendizaje automático.
2. Una enorme colección de conjuntos de datos disponibles públicamente / aportados para practicar / trabajar
Para cualquier tarea de ciencia de datos o aprendizaje automático o apprendimento profondoApprendimento profondo, Una sottodisciplina dell'intelligenza artificiale, si affida a reti neurali artificiali per analizzare ed elaborare grandi volumi di dati. Questa tecnica consente alle macchine di apprendere modelli ed eseguire compiti complessi, come il riconoscimento vocale e la visione artificiale. La sua capacità di migliorare continuamente man mano che vengono forniti più dati lo rende uno strumento chiave in vari settori, dalla salute..., necesitamos datos y muchos de ellos la mayor parte del tiempo. En lugar de navegar en diferentes sitios para diferentes tipos / tamaños de conjuntos de datos, Kaggle proporciona un lugar común para una gran colección de todos estos conjuntos de datos. Puede usarlos con un clic. Son extremadamente fáciles de usar.
Una vez que haga clic en “Set di dati” en la barra de navegación, esto es lo que verá. Puede buscar un conjunto de datos específico, Vogliamo iniziare a spiegarti com'è la procedura che devi eseguire nel caso tu abbia un PC con Windows / contribuir con su propio conjunto de datos a la comunidad o estudiar o comenzar a trabajar en un conjunto de datos, que se muestra en esta página. (Conjuntos de datos de tendencias, Conjuntos de datos populares, Conjuntos de datos vistos recientemente)
Para la demostración, buscaré un conjunto de datos específico (“conjunto de datos de manchas solares”). Veamos cómo se ve.
El número en la selección roja es el número de votos positivos que le dieron las personas, para la opción más relevante / mi piace. Exploremos y veamos este conjunto de datos en detalle.
Hay muchas cosas que podemos utilizar para saber más sobre estos datos y empezar a trabajar de inmediato.
- Puoi scaricare il set di dati,
- cree un nuevo Kaggle Notebook con este conjunto de datos ya cargado.
- Algunos detalles sobre las columnas dentro de los datos.
- Actividades que involucran estos datos.
- Finalmente, ma non meno importante, todos los cuadernos creados y compartidos públicamente hasta la fecha que utilizan estos datos.
3. Competencias de ciencia de datos / apprendimento automatico / apprendimento profondo
Aunque no he participado en ninguno de ellos, me encanta cómo completamos en tiempo real un problema junto con la comunidad de Kaggle y ganamos increíbles premios en efectivo (si participamos en esa competencia en particular). Definitivamente quiero participar algún día pronto, espero que las imágenes te motiven. No es necesario que solo las grandes empresas o las empresas ricas puedan hacer eso. Tú también puedes hacer eso. Hay ciertos protocolos que deben seguirse y listo, tienes tu propia competencia alojada.
He clasificado la competencia completada hasta hoy según su valor de recompensa. Mirar de cerca.
4. Cuadernos Kaggle (codice)
Para cualquier tarea relacionada con la ciencia de datos o informática, tenemos que escribir al menos algún código. Kaggle nos proporciona su propio entorno de Notebook con un cierto límite de cuánto podemos almacenar en ellos (colectivamente por cuenta), cuántas horas de GPU disponibles y cuántas horas de TPU disponibles. Están completamente integrados con todos los servicios de Kaggle y se pueden usar de forma independiente como cualquier otro entorno de notebook (Datalore, Google Colab, Jupyter, eccetera.), lo que significa que puede usarlos para su práctica, competencias de Kaggle, cursos de Kaggle, analizando algunos Kaggle / o conjuntos de datos que no son de Kaggle y muchos más. Debes comprobarlos.
Al hacer clic en ese botón negro, crea su cuaderno o abre el cuaderno de otra persona que desea leer y aprender / confrontare. Todos estos cuadernos visibles se comparten públicamente de forma explícita, lo que significa que sus cuadernos no serán visibles para nadie a menos que usted elija hacerlo.
Para cambiar de CPU a GPU o TPU, siga esto:
Estas son la mayoría de las opciones funcionales que tiene a su disposición con respecto a este portátil:
Veamos cómo usarlos con datos (importados / tomados directamente de Kaggle / descargados de URL, eccetera.) y comience a trabajar en sus tareas de ciencia de datos.
Aquí le mostraré cómo usar ese conjunto de datos de “manchas solares” que vimos anteriormente. Empiece por buscar.
Ahora los datos se cargan correctamente. La selección de la imagen de arriba es el directorio en el que se almacena. Veamos un pequeño panda código sobre cómo importar el conjunto de datos.
Lo último que puede hacer después de completar su proyecto / trabajo es compartirlo con la comunidad en Kaggle. Este es un paso importante porque al compartir nuestras ideas, nuestro trabajo, ampliamos las utilidades disponibles para la comunidad y nos apoyamos mutuamente. Crecemos gracias a los demás.
A la izquierda del botón azul grande en la parte superior derecha, vedrai un “Condividere” pulsante. Haga clic en eso y seleccione Público en el menú desplegable.
Espero que le haya gustado lo que vio en esta guía y esté ansioso por comenzar a usar Kaggle.
Gargeya Sharma
B.Tech Computer Science 3er año
Specializzato in data science e deep learning
Data Scientist Intern presso Upswing Cognitive Hospitality Solutions
Per maggiori informazioni, controlla la mia home page di github
Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.