¿Cómo se almacenan las imágenes en una computadora?

Contenidos

Introducción

Las técnicas de aprendizaje profundo se utilizan popularmente para datos no estructurados, como datos de texto o datos de imágenes. Y antes de trabajar con cualquier tipo de datos, es necesario conocerlos bien.

Entonces, en este artículo, discutiremos las imágenes y veremos cómo se almacenan realmente en una computadora. Vamos a cubrir dos formatos populares en los que se guardan las imágenes: formato de escala de grises y RGB.

¡Sin demora, comencemos!

Nota: Si está más interesado en aprender el concepto de escala de grises y RGB en un formato audiovisual, tenemos este artículo completo explicado en el video a continuación. Si no es así, puede seguir leyendo.

¿Cómo se almacenan las imágenes en blanco y negro o en escala de grises en una computadora?

Pongamos un ejemplo. Aquí hemos tomado un blanco y negro imagen, también conocida como a Escala de grises imagen.

screenshot-from-2021-03-16-10-56-33-8719952

Esta es la imagen de un número 8. Ahora, si nos acercamos más y si miras de cerca, puedes ver que las imágenes se distorsionan y verías algunos pequeños cuadros cuadrados en esta imagen.

screenshot-from-2021-03-16-10-56-56-221x300-7493636

Estas pequeñas cajas se llaman Pixeles. A menudo usamos el término- los dimensión de la imagen es X x Y. ¿Qué significa eso realmente? Esto significa que la dimensión de la imagen es simplemente el número de píxeles a lo largo de la altura (x) y la anchura (y) de la imagen. En este caso, si cuenta, serían 24 píxeles a lo largo de la altura y 16 píxeles a lo ancho. Por tanto, la dimensión de esta imagen será 24 x 16. Aunque vemos una imagen en este formato, la computadora almacena la imagen en forma de números-

screenshot-from-2021-03-16-10-58-08-4932679

Cada uno de estos píxeles se indica como valor numérico y estos números se denominan Valores de píxeles. Estos valores de píxeles denotan la intensidad de los píxeles. Para una imagen en escala de grises o en blanco y negro, tenemos valores de píxeles que van de 0 a 255.

Los números más pequeños más cercanos a cero representan el tono más oscuro, mientras que los números más grandes más cercanos a 255 representan el tono más claro o blanco.

Entonces, cada imagen en una computadora se guarda en este formulario donde tiene una matriz de números y esta matriz también se conoce como un canal-

screenshot-from-2021-03-16-10-58-29-8604318

¿Ahora puedes adivinar la forma de esta matriz? Bueno, será el mismo que el número de valores de píxeles a lo largo y ancho de la imagen. En este caso, la forma de la matriz sería 24 x 16

Ahora resumamos rápidamente los puntos que hemos aprendido hasta ahora:

  • Las imágenes se almacenan en forma de matriz de números en una computadora donde estos números se conocen como valores de píxeles.
  • Estos valores de píxeles representan la intensidad de cada píxel.
  • 0 representa negro y 255 representa blanco.
  • La matriz de números se conoce como canal y, en el caso de una imagen en escala de grises, solo tenemos un canal.

¿Cómo se almacenan las imágenes coloreadas en una computadora?

Ahora que tenemos una idea sobre cómo se almacenan las imágenes en escala de grises en una computadora, veamos un ejemplo de una imagen en color. Tomemos un ejemplo de una imagen en color, esta es una imagen de un perro-

screenshot-from-2021-03-16-11-00-53-7711578

Esta imagen se compone de muchos colores y casi todos los colores se pueden generar a partir de los tres colores primarios: Rojo, verde y azul. Podemos decir que cada imagen coloreada está compuesta por estos tres colores o 3 canales: rojo, verde y azul.

screenshot-from-2021-03-16-11-01-53-6656549

Esto significa que en una imagen coloreada el número de matrices o el número de canales será mayor. En este ejemplo en particular, tenemos 3 matrices – 1 matriz para el rojo conocida como canal rojo –

screenshot-from-2021-03-16-11-03-07-300x231-1057956

otra métrica para el verde conocida como el canal verde-

screenshot-from-2021-03-16-11-03-49-300x206-4692054

y finalmente una matriz para el color azul también conocido como canal azul.

screenshot-from-2021-03-16-11-03-58-300x224-4031467

Cada una de estas métricas volvería a tener valores que van de 0 a 255, donde cada uno de estos números representa la intensidad de los píxeles o se puede decir que los tonos de rojo, verde y azul. Finalmente, todos estos canales o todas estas matrices se superponen, por lo que la forma de la imagen, cuando se carga en una computadora, será-

screenshot-from-2021-03-16-11-05-22-7561510

donde N es el número de píxeles en la altura, M sería el número de píxeles en el ancho y 3 representa el número de canales, en este caso, tenemos 3 canales R, G y B. En nuestro ejemplo, la forma de la imagen coloreada sería- 6 x 5 x 3 ya que tenemos 6 píxeles en la altura, 5 en el ancho y hay 3 canales presentes.

Notas finales

En este artículo, cubrí los dos formatos de imagen más comunes: escala de grises y RGB, y cómo se almacenan en una computadora. ¡También hay otros formatos de imágenes que puedo cubrir en el próximo artículo!

Si está buscando comenzar su viaje de ciencia de datos y desea todos los temas bajo un mismo techo, su búsqueda se detiene aquí. Eche un vistazo a la IA y ML BlackBelt certificadas de DataPeaker Más Programa

Si tiene alguna consulta sobre los conceptos de escala de grises y RGB, hágamelo saber en la sección de comentarios.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.