Concepto de convolución

Este tutorial se centra en uno de los conceptos más importantes de señales y sistemas. Discutiremos la convolución en su totalidad. ¿Lo que es? ¿Por qué es esto? ¿Qué podemos lograr con él?

Comenzaremos nuestra discusión sobre la convolución con los conceptos básicos del procesamiento de imágenes.

¿Qué es el procesamiento de imágenes?

Como comentamos en la introducción a los tutoriales de procesamiento de imágenes y también en la sección de Señal y Sistema, el procesamiento de imágenes es más o menos el estudio de señales y sistemas, porque una imagen no es más que una señal bidimensional.

También comentamos que al procesar imágenes, estamos desarrollando un sistema, cuya entrada será una imagen y la salida será una imagen. Esto se representa gráficamente como.

Concepto de convolución

El bloque que se muestra en la imagen de arriba, etiquetado como «Sistema de imágenes digitales», puede considerarse como una caja negra.

Es mejor imaginar esto como:

Concepto de convolución

A donde hemos llegado tan lejos

Hasta ahora, hemos discutido dos métodos importantes para manipular imágenes. O, en otras palabras, podemos decir que hasta ahora nuestra caja negra funciona de dos formas distintas.

Las dos formas diferentes de manipular imágenes fueron

Gráficos (histogramas)

Concepto de convolución

Esta técnica se conoce como procesamiento de histogramas. Hemos discutido esto en detalle en tutoriales anteriores para aumentar el contraste, la mejora de la imagen, el brillo y más.

Funciones de transformación

Concepto de convolución

Esta técnica se conoce como transformaciones, en la que discutimos varios tipos de transformaciones y algunas transformaciones en escala de grises.

Otra forma de trabajar con imágenes

Aquí vamos a discutir otro método de trabajar con imágenes. Esta otra técnica se conoce como convolución. Normalmente, la caja negra (sistema) que se utiliza para el procesamiento de imágenes es un sistema LTI o un sistema invariante en el tiempo lineal. Por lineal nos referimos a un sistema en el que la salida es siempre lineal, ni logarítmica, ni exponencial, ni de ningún otro tipo. Y por invariancia en el tiempo nos referimos a un sistema que permanece sin cambios en el tiempo.

Entonces ahora usaremos el tercer método. Se puede considerar como.

Concepto de convolución

Matemáticamente, esto se puede representar de dos formas.

g (x, y) = h (x, y) * f (x, y)

Esto se puede explicar como «una máscara enrollada con una imagen».

O

z (x, y) = f (x, y) * h (x, y)

Esto se puede explicar como una «imagen enmascarada».

Esto se puede representar de dos formas, porque el operador de convolución

conmutativo. H (x, y) es una máscara o filtro.

¿Qué es una mascarilla?

La máscara también es una señal. Puede representarse como una matriz bidimensional. La máscara suele ser del orden de 1×1, 3×3, 5×5, 7×7. La máscara siempre debe ser un número impar, de lo contrario no podrá encontrar el centro de la máscara. Por qué necesitas buscar la mitad de la máscara. La respuesta se cubre a continuación, en el tema, ¿cómo doblar?

¿Cómo doblo?

  • Para doblar una imagen, debe hacer lo siguiente.
  • Voltea la máscara (horizontal y verticalmente) solo una vez
  • Pon una máscara sobre la imagen.
  • Multiplica los elementos coincidentes y luego agréguelos

Repita este procedimiento hasta que se hayan calculado todos los valores de la imagen.

Ejemplo de convolución

Hagamos una convolución. El paso 1 es darle la vuelta a la máscara.

Máscara

Tomemos nuestra máscara así. uno 2
3 cuatro cinco
6 7 8

9

Voltea la máscara horizontalmente 3 2
uno 6 cinco
cuatro 9 8

7

Voltea la máscara verticalmente 9 8
7 6 cinco
cuatro 3 2

uno

Fotografía

Veamos una imagen como esta 2 cuatro
6 8 diez
12 14 dieciséis

Dieciocho

Circunvolución

Convolución de la máscara sobre la imagen.  Y así está hecho.  Coloque el centro de la máscara en cada elemento de la imagen.  Multiplique los elementos correspondientes, luego agréguelos y pegue el resultado en el elemento de imagen en el que colocará el centro de la máscara.

Concepto de convolución

El cuadro rojo es la máscara y los valores naranja son los valores de la máscara. El campo es negro y los valores pertenecen a la imagen. Ahora, para el primer píxel de la imagen, el valor se calculará como

Primer píxel = (5 * 2) + (4 * 4) + (2 * 8) + (1 * 10)

= 10 + 16 + 16 + 10

= 52

Coloque 52 en la imagen original en el primer índice y repita este procedimiento para cada píxel de la imagen.

Por que convolución

La convolución puede lograr algo que los dos métodos de procesamiento de imágenes anteriores no pueden lograr. Estos incluyen desenfoque, nitidez, detección de bordes, reducción de ruido y más.

🚫