Big Data

Por que as GPUs são mais adequadas para aprendizado profundo?

Desde la última década, hemos visto a la GPU entrar en escena con más frecuencia en campos como HPC (Computación de alto rendimiento) y el campo más popular, quer dizer, os jogos. Las GPU han mejorado año tras año y ahora son capaces de hacer cosas increíblemente geniales, pero en los últimos años han captado aún más atención debido al aprendizaje profundo.

Como los modelos de aprendizaje profundo pasan una gran cantidad de tiempo en el entrenamiento, incluso las CPU potentes no eran lo suficientemente eficientes para manejar tantos cálculos en un momento dado y esta es el área donde las GPU simplemente superaron a las CPU debido a su paralelismo. Pero antes de sumergirnos en la profundidad, primero comprendamos algunas cosas sobre la GPU.

¿Qué es la GPU?

Una GPU o ‘Unidad de procesamiento de gráficos’ es una versión mini de una computadora completa, pero solo dedicada a una tarea específica. Es diferente a una CPU que realiza múltiples tareas al mismo tiempo. La GPU viene con su propio procesador que está integrado en su propia placa base junto con v-ram o video ram, y también un diseño térmico adecuado para ventilación y enfriamiento.

1kcdeydxjbyjfubkqbnkq_w-6466913 — fonte (Gamers Nexus)

En el término ‘Unidad de procesamiento de gráficos’, ‘Gráficos’ se refiere a renderizar una imagen en coordenadas específicas en un espacio 2d o 3D. Una ventana o punto de vista es la perspectiva de un espectador de mirar un objeto según el tipo de proyección utilizada. La rasterización y el trazado de rayos son algunas de las formas de renderizar escenas en 3D, ambos conceptos se basan en un tipo de proyección llamada proyección en perspectiva. ¿Qué es la proyección en perspectiva?

Em resumo, es la forma en que se forma una imagen en un plano de vista o lienzo donde las líneas paralelas convergen a un punto convergente llamado ‘centro de proyección’ también a medida que el objeto se aleja del punto de vista parece ser más pequeño , exactamente cómo se retratan nuestros ojos en el mundo real y esto también ayuda a comprender la profundidad de una imagen, esa es la razón por la que produce imágenes realistas.

O que mais, las GPU también procesan geometría compleja, vetor, fuentes de luz o iluminaciones, texturas, formas, etc. Como ahora tenemos una idea básica sobre la GPU, entendamos por qué se usa mucho para el aprendizaje profundo.

¿Por qué las GPU son mejores para el aprendizaje profundo?

Una de las características más admiradas de una GPU es la capacidad de calcular procesos en paralelo. Este es el punto donde el concepto de computación paralela entra en acción. Una CPU en general completa su tarea de manera secuencial. Una CPU se puede dividir en núcleos y cada núcleo realiza una tarea a la vez. Supongamos que una CPU tiene 2 núcleos. Mais tarde, dos procesos de tareas diferentes pueden ejecutarse en estos dos núcleos, logrando así la multitarea.

Mas mesmo assim, estos procesos se ejecutan en serie.

02quyfuolnx2g6sws-2369131 — fonte (Ejemplos de muestra)

Esto no significa que las CPU no sean lo suficientemente buenas. De fato, las CPU son realmente buenas para manejar diferentes tareas relacionadas con diferentes operaciones como manejar sistemas operativos, entregar hojas de cálculo, reproducir videos HD, extraer archivos zip grandes, Tudo ao mesmo tempo. Estas son algunas de las cosas que una GPU simplemente no puede hacer.

¿Dónde está la diferencia?

0yh_3qpohpllu9cyv-9938641 — fonte (NVIDIA)

Como mencionado anteriormente, una CPU se divide en múltiples núcleos para que puedan realizar múltiples tareas al mismo tiempo, mientras que la GPU tendrá cientos y miles de núcleos, todos los cuales están dedicados a una sola tarea. Estos son cálculos simples que se realizan con más frecuencia y son independientes entre sí. Y ambos almacenan los datos requeridos con frecuencia en su respectiva memoria caché, siguiendo así el principio de ‘referencia de localidad‘.

0stjaj3bah_remflr-4635146 — fonte (NVIDIA)

Hay muchos programas y juegos que pueden aprovechar las GPU para su ejecución. La idea detrás de esto es hacer que algunas partes de la tarea o el código de la aplicación sean paralelas, pero no todos los procesos. Esto se debe a que la mayoría de los procesos de la tarea solo deben ejecutarse de manera secuencial. Por exemplo, iniciar sesión en un sistema o aplicación no necesita ser paralelo.

Cuando hay parte de la ejecución que se puede hacer en paralelo, simplemente se cambia a GPU para su procesamiento, donde al mismo tiempo se ejecuta la tarea secuencial en la CPU, luego ambas partes de la tarea se combinan nuevamente.

En el mercado de GPU, hay dos jugadores principales, quer dizer, AMD y Nvidia. Las GPU de Nvidia se utilizan ampliamente para el aprendizaje profundo porque tienen un amplio soporte en el software del foro, los controladores, CUDA y cuDNN. Então, en términos de inteligencia artificial y aprendizaje profundo, Nvidia es pionera durante mucho tiempo.

Se dice que las redes neuronales son vergonzosamente paralelo, lo que significa que los cálculos en redes neuronales se pueden ejecutar en paralelo fácilmente y son independientes entre sí.

Algunos cálculos como el cálculo de pesos y funciones de activación de cada capa, la retropropagación se pueden realizar en paralelo. También hay muchos artículos de investigación disponibles al respecto.
Las GPU de Nvidia vienen con núcleos especializados conocidos como MILAGRES núcleos que ayudan a acelerar el aprendizaje profundo.

¿Qué es CUDA?

CUDA significa ‘Compute Unified Device Architecture’ que se lanzó en el año 2007, es una forma en la que puede lograr la computación en paralelo y obtener el máximo rendimiento de la potencia de su GPU de una manera optimizada, lo que da como resultado un rendimiento mucho mejor al ejecutar tareas.

0ogbatkaijpdosxjw-6057700 — fonte (NVIDIA)

El kit de herramientas CUDA es un paquete completo que consta de un entorno de desarrollo que se utiliza para crear aplicaciones que utilizan GPU. Este kit de herramientas contiene principalmente el compilador, el depurador y las bibliotecas de c / c ++. O que mais, el tiempo de ejecución de CUDA tiene sus controladores para que pueda comunicarse con la GPU. CUDA también es un lenguaje de programación que está diseñado específicamente para instruir a la GPU para realizar una tarea. También se conoce como programación de GPU.
A continuación se muestra un programa simple de hola mundo solo para tener una idea de cómo se ve el código CUDA.

/* hello world program in cuda *
#include<stdio.h>
#include<stdlib.h>
#include<cuda.h>__global__ void demo() {
    printf("Olá, mundo!,my first cuda program");
}int main() {
    printf("From main!n");
    demo<<<1,1>>>();
    Retorna 0;
}

1ud6zvgvafahakpiqriijfg-3961769 — Produção

¿Qué es cuDNN?

0l0srgvjrqtkixa2b-2366574 — Fonte (Hyper Linuxer)

cuDNN es una biblioteca de red neuronal que está optimizada para GPU y puede aprovechar al máximo la GPU de Nvidia. Esta biblioteca consiste en la implementación de convolución, propagación hacia adelante y hacia atrás, funciones de activación y agrupación. Es una biblioteca imprescindible sin la cual no puede usar GPU para entrenar redes neuronales.

¡Un gran salto con los núcleos Tensor!

No ano 2018, Nvidia lanzó una nueva línea de sus GPU, quer dizer, la serie 2000. También llamadas RTX, estas tarjetas vienen con núcleos tensores dedicados al aprendizaje profundo y basados en la arquitectura Volta.

0yb7zq51_tknpxldo-1786349 — Fonte (Anand Tech)

Los núcleos tensores son núcleos particulares que realizan la multiplicación de matrices 4 x 4 FP16 y la suma con 4 x 4 matriz FP16 o FP32 en media precisión, la salida dará como resultado una matriz 4 x 4 FP16 o FP32 con total precisión.
Observação: ‘FP’ significa punto flotante para comprender más sobre el punto flotante y la precisión, compruebe esto Blog.

Como afirma Nvidia, los núcleos tensoriales de nueva generación basados en la arquitectura volta son mucho más rápidos que los núcleos CUDA basados en la arquitectura Pascal. Esto dio un gran impulso al aprendizaje profundo.

0r97t2ar7yph4cjco-6336862 — fonte (NVIDIA)

Al momento de escribir este blog, Nvidia anunció la última serie 3000 de su línea de GPU que viene con arquitectura Ampere. Nisto, mejoraron el rendimiento de los núcleos tensoriales en 2x. También trae nuevos valores de precisión como TF32 (tensor float 32), FP64 (punto flotante 64). El TF32 funciona igual que el FP32 pero con una aceleración de hasta 20x, como resultado de todo esto, Nvidia afirma que el tiempo de inferencia o entrenamiento de los modelos se reducirá de semanas a horas.

AMD frente a Nvidia

0uuhldm-sahwrgwmh-7118913 — fonte (Tom’s Hardware)

AMD Las GPU son decentes para los juegos, pero tan pronto como el aprendizaje profundo entra en escena, crie uma nova consulta e carregue a tabela InvOverRides do arquivo excel Nvidia está muy por delante. No significa que las GPU de AMD sean malas. Es debido a la optimización del software y los controladores que no se actualizan activamente, en el lado de Nvidia tienen mejores controladores con actualizaciones frecuentes y en la parte superior de ese CUDA, cuDNN ayuda a acelerar el cálculo.

Algunas bibliotecas conocidas como Tensorflow, compatibilidad con PyTorch para CUDA. Significa que se pueden utilizar GPU de nivel de entrada de la serie GTX 1000. Por el lado de AMD, tiene muy poco soporte de software para sus GPU. En el lado del hardware, Nvidia ha introducido núcleos tensores dedicados. AMD tiene ROCm para la aceleración, pero no es bueno como núcleos tensoriales, y muchas bibliotecas de aprendizaje profundo no son compatibles con ROCm. Durante los últimos años, no se notó ningún gran salto en términos de rendimiento.

Debido a todos estos puntos, Nvidia simplemente sobresale en el aprendizaje profundo.

Resumo

Para concluir de todo lo que hemos aprendido, está claro que a partir de ahora Nvidia es el líder del mercado en términos de GPU, pero realmente espero que incluso AMD se ponga al día en el futuro o al menos haga algunas mejoras notables en la próxima línea de sus GPU. ya que ya están haciendo un gran trabajo con respecto a sus CPU, quer dizer, la serie Ryzen.

El alcance de las GPU en los próximos años es enorme a medida que realizamos nuevas innovaciones y avances en el aprendizaje profundo, el aprendizaje automático y la HPC. La aceleración de GPU siempre será útil para que muchos desarrolladores y estudiantes ingresen a este campo, ya que sus precios también se están volviendo más asequibles. También gracias a la amplia comunidad que también contribuye al desarrollo de IA y HPC.