introduzione
Google “trabajos de PNL” y aparece un número notable de búsquedas relevantes. ¡Hay empresas que están surgiendo en todo el mundo que se ocupan exclusivamente de los roles de procesamiento del lenguaje natural (PNL)! La demanda de la industria de expertos en PNL nunca ha sido tan alta, y se espera que aumente exponencialmente en los próximos años.
Pero el lado de la oferta se está quedando corto. Los novatos e incluso las personas con experiencia que quieren conseguir un puesto basado en la PNL están luchando por entrar en la industria. Podemos señalar una de las áreas de mayor dolor: la falta de aprendizaje estructurado.
Hay demasiados recursos en estos días que cubren los conceptos de PNL, pero la mayoría de ellos lo hacen de manera dispersa. Los recién llegados tienden a leer artículos y libros, analizar varios blogs y videos, y terminan luchando por reconstruir una comprensión de un extremo a otro.
¡Aquí es donde entra en juego nuestro camino de aprendizaje de PNL! ¡Estamos encantados de presentar una ruta de aprendizaje integral y estructurada para ayudarlo a aprender y dominar la PNL desde cero en 2020!
Esta ruta de aprendizaje ha sido seleccionada por expertos de DataPeaker que han pasado por cientos de recursos para seleccionarlo para nuestra comunidad. ¡Sigue este camino en 2020 y pronto estarás a punto de conseguir un puesto en el dominio de la PNL!
Nuestro marco para la ruta de aprendizaje de PNL
Struttura: es el núcleo de todo lo que hacemos. Nuestras rutas de aprendizaje son populares tanto por su estructura como por su naturaleza integral. Así es como hemos desglosado cada mes de la ruta de aprendizaje de PNL para ayudarlo a planificar su viaje de aprendizaje:
- obbiettivo: Cosa imparerai in quel mese? Quali sono i risultati chiave? ¿Cómo progresará su viaje a la PNL? Lo menzioniamo all'inizio di ogni mese per assicurarci che tu sappia dove sei e dove sarai alla fine di quel particolare mese..
- Orario suggerito: Cuánto tiempo en promedio debe dedicar a esa sección por semana
- Risorse per imparare: Una colección de los principales recursos para los temas de PNL que aprenderá en ese mes. Questo include articoli, tutorial, video, documenti di ricerca e altre risorse simili.
Alla ricerca di altri percorsi di apprendimento nella scienza dei dati? Tu espera ha terminado:
¡Vamos a sumergirnos en ello!
Mio 0: requisitos previos (opzionale)
obbiettivo: Esto es para todos los que aún no están familiarizados con Python y Data Science. A finales de este mes, debería tener una idea clara sobre los componentes básicos del aprendizaje automático y cómo programar en Python.
Orario suggerito: 6 ore / settimana
Python per la scienza dei dati:
Impara le statistiche:
Preparazione dei dati:
Regressione lineare:
Regressione logistica:
Algoritmo dell'albero decisionale:
Validación cruzada de K-fold:
Descomposición de valores singulares (SVD ·):
Mio 1: sentirse cómodo con los datos de texto
obbiettivo: ¡Y nos vamos! Este mes se trata de que se familiarice y se sienta cómodo con las técnicas básicas de preprocesamiento de texto. Debería poder crear un modelo de clasificación de texto al final de esta sección.
Orario suggerito: 5 ore / settimana
Cargar datos de texto de varias fuentes:
Aprenda a usar expresiones regulares:
Procesamiento previo de texto:
Análisis exploratorio de datos de texto:
Extraer metacaracterísticas del texto:
Progetto:
- Construya un modelo de clasificación de texto usando meta características. Puede utilizar el conjunto de datos del problema de práctica Identificar los sentimientos
Mio 2 – Lingüística computacional y vectores de palabras
obbiettivo: Este mes empezarás a ver la magia de la PNL. Aprenderá cómo se puede utilizar la gramática inglesa para extraer información clave del texto. También trabajará con vectores de palabras, una técnica avanzada para crear características a partir de texto.
Orario suggerito: 5 ore / settimana
Extraer características lingüísticas:
- Etiquetado de parte del discurso usando spaCy:
- Reconocimiento de entidad nombrada usando spaCy:
- Análisis de dependencia de Stanford:
Representación de texto en el espacio vectorial:
Modellazione a tema:
Extracción de información:
Progetti:
- Cree un modelo de detección de sentimientos utilizando incrustaciones de Word. Puede utilizar el conjunto de datos del problema de práctica Identificar los sentimientos
- Categorizar artículos de noticias mediante el modelado de temas
Mio 3 – Actualización de aprendizaje profundo para PNL
obbiettivo: Il apprendimento profondoApprendimento profondo, Una sottodisciplina dell'intelligenza artificiale, si affida a reti neurali artificiali per analizzare ed elaborare grandi volumi di dati. Questa tecnica consente alle macchine di apprendere modelli ed eseguire compiti complessi, come il riconoscimento vocale e la visione artificiale. La sua capacità di migliorare continuamente man mano che vengono forniti più dati lo rende uno strumento chiave in vari settori, dalla salute... está en el corazón de los desarrollos y avances recientes en la PNL. Desde BERT de Google hasta GPT-2 de OpenAI, todos los entusiastas de la PNL deben tener al menos una comprensión básica de cómo funciona el aprendizaje profundo para impulsar estos marcos de PNL de vanguardia. Así que este mes, se centrará en los conceptos, algoritmos y herramientas relacionados con el aprendizaje profundo.
Orario suggerito: 5 ore / settimana
Reti neurali:
Algoritmos de optimización:
Reti neurali ricorrenti (RNN) y LSTM:
- Una introducción amistosa a los RNN:
Introducción a PyTorch:
Mio 4 – Modelos de aprendizaje profundo para PNL
obbiettivo: Ahora que tiene una idea del aprendizaje profundo y cómo se aplica en el contexto de la PNL, es hora de llevar las cosas a un nivel superior. Sumérjase en conceptos avanzados de aprendizaje profundo como redes neuronales recurrentes (RNN), memoria a breve termine a lungo termine (LSTM), tra gli altri. Estos le ayudarán a dominar los casos de uso de PNL de nivel industrial.
Orario suggerito: 5 ore / settimana
Reti neurali ricorrenti (RNN) para clasificación de texto:
Modelos de CNN para PNL:
Progetti:
- Construya un modelo para encontrar entidades nombradas en el texto usando LSTM. Puede obtener el conjunto de datos de qui
Mio 5 – Modelado secuencial
obbiettivo: En este mes, aprenderá a utilizar modelos secuenciales que tratan con secuencias como entradas y / o salidas. ¡Un concepto muy útil en PNL como pronto descubrirás!
Orario suggerito: 5 ore / settimana
Modelado de idiomas:
- Modelos de lenguaje y RNN de Stanford:
Modelado secuencia a secuencia:
Progetti:
- Entrenar un modelo de lenguaje en Conjunto de datos de correo electrónico de Enron para construir un sistema de autocompletado
- Cree un modelo de traducción automática neuronal (del inglés a cualquier idioma que elija)
Mio 6 – Transferir el aprendizaje en PNL
obbiettivo: El aprendizaje por transferencia está de moda en la PNL en este momento. Infatti, esto ha ayudado a democratizar los marcos de PNL de última generación con los que se habría encontrado antes. Este mes presenta BERT, GPT-2, ULMFiT y Transformers.
Orario suggerito: 5 ore / settimana
ULMFiT:
trasformatori:
Modelos de idiomas grandes previamente entrenados (BERT y GPT-2):
Ajuste de modelos pre-entrenados:
Mio 7: chatbots y procesamiento de audio
obbiettivo: Aprenderá a crear un chatbot o un agente conversacional este mes. Una vez que haya dominado la PNL, la próxima frontera que puede abordar es el procesamiento de audio.
Orario suggerito: 5 ore / settimana
Chatbot:
Procesamiento de audio:
Progetto:
- Construye un chatbot con interfaz de voz usando Rasa
Infografica – Ruta de aprendizaje de PNL para 2020
A nuestra comunidad le encantan las infografías que diseñamos para cada ruta de aprendizaje. Estas infografías tienen dos propósitos principales:
- Nos ayudan a visualizar la estructura de cómo aprenderemos diferentes temas.
- Se pueden utilizar como listas de verificación para marcar conceptos a misuraIl "misura" È un concetto fondamentale in diverse discipline, che si riferisce al processo di quantificazione delle caratteristiche o delle grandezze degli oggetti, fenomeni o situazioni. In matematica, Utilizzato per determinare le lunghezze, Aree e volumi, mentre nelle scienze sociali può riferirsi alla valutazione di variabili qualitative e quantitative. L'accuratezza della misurazione è fondamentale per ottenere risultati affidabili e validi in qualsiasi ricerca o applicazione pratica.... que avanza en su camino hacia la PNL.
Perciò, ¡estamos encantados de presentar a continuación la infografía de la ruta de aprendizaje de PNL para 2020! Puede descargar una versión de alta risoluzioneIl "risoluzione" si riferisce alla capacità di prendere decisioni ferme e raggiungere gli obiettivi prefissati. In contesti personali e professionali, Implica la definizione di obiettivi chiari e lo sviluppo di un piano d'azione per raggiungerli. La risoluzione è fondamentale per la crescita personale e il successo in vari ambiti della vita, In quanto ti permette di superare gli ostacoli e mantenere la concentrazione su ciò che conta davvero.... a partire dal qui.