Este tutorial se centra en uno de los conceptos más importantes de señales y sistemas. Discutiremos la convolución en su totalidad. ¿Lo que es? ¿Por qué es esto? ¿Qué podemos lograr con él?
Comenzaremos nuestra discusión sobre la convolución con los conceptos básicos del procesamiento de imágenes.
Como comentamos en la introducción a los tutoriales de procesamiento de imágenes y también en la sección de Señal y Sistema, el procesamiento de imágenes es más o menos el estudio de señales y sistemas, porque una imagen no es más que una señal bidimensional.
También comentamos que al procesar imágenes, estamos desarrollando un sistema, cuya entrada será una imagen y la salida será una imagen. Esto se representa gráficamente como.
El bloque que se muestra en la imagen de arriba, etiquetado como «Sistema de imágenes digitales», puede considerarse como una caja negra.
Es mejor imaginar esto como:
Hasta ahora, hemos discutido dos métodos importantes para manipular imágenes. O, en otras palabras, podemos decir que hasta ahora nuestra caja negra funciona de dos formas distintas.
Las dos formas diferentes de manipular imágenes fueron
Esta técnica se conoce como procesamiento de histogramas. Hemos discutido esto en detalle en tutoriales anteriores para aumentar el contraste, la mejora de la imagen, el brillo y más.
Esta técnica se conoce como transformaciones, en la que discutimos varios tipos de transformaciones y algunas transformaciones en escala de grises.
Aquà vamos a discutir otro método de trabajar con imágenes. Esta otra técnica se conoce como convolución. Normalmente, la caja negra (sistema) que se utiliza para el procesamiento de imágenes es un sistema LTI o un sistema invariante en el tiempo lineal. Por lineal nos referimos a un sistema en el que la salida es siempre lineal, ni logarÃtmica, ni exponencial, ni de ningún otro tipo. Y por invariancia en el tiempo nos referimos a un sistema que permanece sin cambios en el tiempo.
Entonces ahora usaremos el tercer método. Se puede considerar como.
Matemáticamente, esto se puede representar de dos formas.
g (x, y) = h (x, y) * f (x, y)
Esto se puede explicar como «una máscara enrollada con una imagen».
O
z (x, y) = f (x, y) * h (x, y)
Esto se puede explicar como una «imagen enmascarada».
Esto se puede representar de dos formas, porque el operador de convolución
¿Qué es una mascarilla?
¿Cómo doblo?
Ejemplo de convolución
Máscara
Tomemos nuestra máscara asÃ. | uno | 2 |
3 | cuatro | cinco |
6 | 7 | 8 |
9
Voltea la máscara horizontalmente | 3 | 2 |
uno | 6 | cinco |
cuatro | 9 | 8 |
7
Voltea la máscara verticalmente | 9 | 8 |
7 | 6 | cinco |
cuatro | 3 | 2 |
FotografÃa
Veamos una imagen como esta | 2 | cuatro |
6 | 8 | diez |
12 | 14 | dieciséis |
Circunvolución
Concepto de convolución
El cuadro rojo es la máscara y los valores naranja son los valores de la máscara. El campo es negro y los valores pertenecen a la imagen. Ahora, para el primer pÃxel de la imagen, el valor se calculará como
Primer pÃxel = (5 * 2) + (4 * 4) + (2 * 8) + (1 * 10)
= 10 + 16 + 16 + 10
= 52
Por que convolución
La convolución puede lograr algo que los dos métodos de procesamiento de imágenes anteriores no pueden lograr. Estos incluyen desenfoque, nitidez, detección de bordes, reducción de ruido y más.
🚫