Introducción
Las técnicas de aprendizaje profundoEl aprendizaje profundo, una subdisciplina de la inteligencia artificial, se basa en redes neuronales artificiales para analizar y procesar grandes volúmenes de datos. Esta técnica permite a las máquinas aprender patrones y realizar tareas complejas, como el reconocimiento de voz y la visión por computadora. Su capacidad para mejorar continuamente a medida que se le proporcionan más datos la convierte en una herramienta clave en diversas industrias, desde la salud... se utilizan popularmente para datos no estructurados, como datos de texto o datos de imágenes. Y antes de trabajar con cualquier tipo de datos, es necesario conocerlos bien.
Entonces, en este artículo, discutiremos las imágenes y veremos cómo se almacenan realmente en una computadora. Vamos a cubrir dos formatos populares en los que se guardan las imágenes: formato de escala de grises y RGB.
¡Sin demora, comencemos!
Nota: Si está más interesado en aprender el concepto de escala de grises y RGB en un formato audiovisual, tenemos este artículo completo explicado en el video a continuación. Si no es así, puede seguir leyendo.
¿Cómo se almacenan las imágenes en blanco y negro o en escala de grises en una computadora?
Pongamos un ejemplo. Aquí hemos tomado un blanco y negro imagen, también conocida como a Escala de grises imagen.
Esta es la imagen de un número 8. Ahora, si nos acercamos más y si miras de cerca, puedes ver que las imágenes se distorsionan y verías algunos pequeños cuadros cuadrados en esta imagen.
Estas pequeñas cajas se llaman Pixeles. A menudo usamos el término- los dimensión"Dimensión" es un término que se utiliza en diversas disciplinas, como la física, la matemática y la filosofía. Se refiere a la medida en la que un objeto o fenómeno puede ser analizado o descrito. En física, por ejemplo, se habla de dimensiones espaciales y temporales, mientras que en matemáticas puede referirse a la cantidad de coordenadas necesarias para representar un espacio. Su comprensión es fundamental para el estudio y... de la imagen es X x Y. ¿Qué significa eso realmente? Esto significa que la dimensión de la imagen es simplemente el número de píxeles a lo largo de la altura (x) y la anchura (y) de la imagen. En este caso, si cuenta, serían 24 píxeles a lo largo de la altura y 16 píxeles a lo ancho. Por tanto, la dimensión de esta imagen será 24 x 16. Aunque vemos una imagen en este formato, la computadora almacena la imagen en forma de números-
Cada uno de estos píxeles se indica como valor numérico y estos números se denominan Valores de píxeles. Estos valores de píxeles denotan la intensidad de los píxeles. Para una imagen en escala de grises o en blanco y negro, tenemos valores de píxeles que van de 0 a 255.
Los números más pequeños más cercanos a cero representan el tono más oscuro, mientras que los números más grandes más cercanos a 255 representan el tono más claro o blanco.
Entonces, cada imagen en una computadora se guarda en este formulario donde tiene una matriz de números y esta matriz también se conoce como un canal-
¿Ahora puedes adivinar la forma de esta matriz? Bueno, será el mismo que el número de valores de píxeles a lo largo y ancho de la imagen. En este caso, la forma de la matriz sería 24 x 16
Ahora resumamos rápidamente los puntos que hemos aprendido hasta ahora:
- Las imágenes se almacenan en forma de matriz de números en una computadora donde estos números se conocen como valores de píxeles.
- Estos valores de píxeles representan la intensidad de cada píxel.
- 0 representa negro y 255 representa blanco.
- La matriz de números se conoce como canal y, en el caso de una imagen en escala de grises, solo tenemos un canal.
¿Cómo se almacenan las imágenes coloreadas en una computadora?
Ahora que tenemos una idea sobre cómo se almacenan las imágenes en escala de grises en una computadora, veamos un ejemplo de una imagen en color. Tomemos un ejemplo de una imagen en color, esta es una imagen de un perro-
Esta imagen se compone de muchos colores y casi todos los colores se pueden generar a partir de los tres colores primarios: Rojo, verde y azul. Podemos decir que cada imagen coloreada está compuesta por estos tres colores o 3 canales: rojo, verde y azul.
Esto significa que en una imagen coloreada el número de matrices o el número de canales será mayor. En este ejemplo en particular, tenemos 3 matrices – 1 matriz para el rojo conocida como canal rojo –
otra métrica para el verde conocida como el canal verde-
y finalmente una matriz para el color azul también conocido como canal azul.
Cada una de estas métricas volvería a tener valores que van de 0 a 255, donde cada uno de estos números representa la intensidad de los píxeles o se puede decir que los tonos de rojo, verde y azul. Finalmente, todos estos canales o todas estas matrices se superponen, por lo que la forma de la imagen, cuando se carga en una computadora, será-
donde N es el número de píxeles en la altura, M sería el número de píxeles en el ancho y 3 representa el número de canales, en este caso, tenemos 3 canales R, G y B. En nuestro ejemplo, la forma de la imagen coloreada sería- 6 x 5 x 3 ya que tenemos 6 píxeles en la altura, 5 en el ancho y hay 3 canales presentes.
Notas finales
En este artículo, cubrí los dos formatos de imagen más comunes: escala de grises y RGB, y cómo se almacenan en una computadora. ¡También hay otros formatos de imágenes que puedo cubrir en el próximo artículo!
Si está buscando comenzar su viaje de ciencia de datos y desea todos los temas bajo un mismo techo, su búsqueda se detiene aquí. Eche un vistazo a la IA y ML BlackBelt certificadas de DataPeaker Más Programa
Si tiene alguna consulta sobre los conceptos de escala de grises y RGB, hágamelo saber en la sección de comentarios.