Álgebra Lineal en Procesamiento de Imágenes


«`html





Álgebra Lineal en Procesamiento de Imágenes

Introducción

El álgebra lineal es una herramienta fundamental en el procesamiento de imágenes, permitiendo manipular, transformar y analizar datos visuales de manera eficiente. Desde el filtrado de ruido hasta el reconocimiento de patrones, las matrices y vectores son la base de algoritmos que hacen posible la edición fotográfica, la visión por computadora y la inteligencia artificial. En este artículo, exploraremos cómo conceptos como descomposición de matrices, transformaciones lineales y espacios vectoriales se aplican en el procesamiento de imágenes, con ejemplos prácticos y demostraciones teóricas.

Representación Matricial de una Imagen

Una imagen digital en escala de grises puede representarse como una matriz $A \in \mathbb{R}^{m \times n}$, donde cada entrada $a_{ij}$ corresponde al valor de intensidad del píxel en la posición $(i,j)$. Para imágenes a color, usamos tres matrices (canales R, G, B).

Ejemplo 1: Conversión a escala de grises

Dada una imagen RGB con matrices $R$, $G$, $B$, la intensidad $I$ se calcula como:

$$ I = 0.299R + 0.587G + 0.114B $$

Esta combinación lineal aprovecha la sensibilidad del ojo humano a diferentes colores.

Transformaciones Lineales en Imágenes

Las operaciones como rotación, escalado y traslación pueden expresarse como multiplicaciones matriciales. Por ejemplo, rotar un punto $(x,y)$ un ángulo $\theta$ se define como:

$$ \begin{pmatrix} x’ \\ y’ \end{pmatrix} = \begin{pmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} $$

Teorema 1: Invarianza de la Norma bajo Rotaciones

Para cualquier vector $\mathbf{v} \in \mathbb{R}^2$ y matriz de rotación $R_\theta$, se cumple que $||R_\theta \mathbf{v}|| = ||\mathbf{v}||$.

Demostración:

Calculamos la norma al cuadrado:

$$ ||R_\theta \mathbf{v}||^2 = (R_\theta \mathbf{v})^T (R_\theta \mathbf{v}) = \mathbf{v}^T R_\theta^T R_\theta \mathbf{v} = \mathbf{v}^T I \mathbf{v} = ||\mathbf{v}||^2 $$

donde hemos usado que $R_\theta^T R_\theta = I$.

Descomposición en Valores Singulares (SVD)

La SVD descompone una matriz $A$ como $A = U \Sigma V^T$, donde $U$ y $V$ son ortogonales y $\Sigma$ es diagonal. Esto permite compresión de imágenes al conservar solo los valores singulares más grandes.

Ejemplo 2: Compresión con SVD

Para una matriz $A \in \mathbb{R}^{100 \times 100}$ con rango 10, podemos aproximarla como:

$$ A \approx \sum_{i=1}^k \sigma_i u_i v_i^T, \quad k \ll 100 $$

donde $\sigma_i$ son los valores singulares y $u_i$, $v_i$ los vectores singulares.

Teorema 2: Mejor Aproximación de Rango-k (Eckart-Young)

La aproximación $A_k$ obtenida al truncar la SVD a los $k$ mayores valores singulares minimiza $||A – B||_F$ entre todas las matrices $B$ de rango $\leq k$.

Demostración:

Sea $B$ cualquier matriz de rango $k$. Usando la desigualdad de Weyl y propiedades de la norma Frobenius, se prueba que $||A – A_k||_F \leq ||A – B||_F$.

Filtrado y Convolución

Los filtros de imágenes se implementan como convoluciones con kernels (matrices pequeñas). La convolución discreta 2D se define como:

$$ (I * K)_{ij} = \sum_{m} \sum_{n} I(i-m, j-n) K(m, n) $$

Ejercicio 1: Aplicar Filtro de Suavizado

Dada la matriz de imagen $I$ y el kernel $K$:

$$ I = \begin{pmatrix} 10 & 20 & 30 \\ 40 & 50 & 60 \\ 70 & 80 & 90 \end{pmatrix}, \quad K = \frac{1}{9} \begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{pmatrix} $$

Calcular $(I * K)_{2,2}$.

Solución:

Centramos $K$ en $(2,2)$ de $I$ y multiplicamos elemento a elemento:

$$ (I * K)_{2,2} = \frac{10 + 20 + 30 + 40 + 50 + 60 + 70 + 80 + 90}{9} = 50 $$

Autovalores en Detección de Bordes

La matriz Hessiana y sus autovalores permiten detectar bordes y esquinas. Para una imagen $I(x,y)$, el tensor de estructura es:

$$ S = \begin{pmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{pmatrix} $$

donde $I_x$, $I_y$ son derivadas parciales.

Teorema 3: Detección de Esquinas (Harris)

Un punto $(x,y)$ es una esquina si los autovalores $\lambda_1$, $\lambda_2$ de $S$ son grandes. La medida de esquina es:

$$ R = \det(S) – k \cdot \text{tr}(S)^2 $$

Demostración:

Expresando $R$ en términos de $\lambda_1$, $\lambda_2$:

$$ R = \lambda_1 \lambda_2 – k (\lambda_1 + \lambda_2)^2 $$

Valores altos de $R$ indican que ambos $\lambda_i$ son significativos.

Ejercicios Adicionales

Ejercicio 2: Rotación de Imagen

Rotar el punto $(2,3)$ 90° en sentido antihorario.

Solución:

$$ \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 3 \end{pmatrix} = \begin{pmatrix} -3 \\ 2 \end{pmatrix} $$

Ejercicio 3: SVD de Matriz 2×2

Encontrar la SVD de $A = \begin{pmatrix} 4 & 0 \\ 0 & 3 \end{pmatrix}$.

Solución:

Como $A$ es diagonal, $U = I$, $\Sigma = A$, $V = I$.

Ejercicio 4: Convolución con Kernel Identidad

¿Qué ocurre al convolucionar una imagen con $K = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix}$?

Solución:

La imagen permanece igual, pues $(I * K)_{ij} = I_{ij}$.

Ejercicio 5: Compresión con SVD

Para $A = \begin{pmatrix} 12 & 34 \\ 56 & 78 \end{pmatrix}$ con $\sigma_1 = 103.7$, $\sigma_2 = 5.6$, aproximar $A$ con $k=1$.

Solución:

$$ A \approx \sigma_1 u_1 v_1^T = 103.7 \begin{pmatrix} 0.40 \\ 0.92 \end{pmatrix} \begin{pmatrix} 0.53 & 0.85 \end{pmatrix} $$

Aplicaciones Prácticas

  • Reconocimiento Facial: PCA (Análisis de Componentes Principales) reduce la dimensionalidad de los datos faciales.
  • MRI Médico: La álgebra lineal acelera la reconstrucción de imágenes a partir de datos de resonancia.
  • Realidad Aumentada: Las transformaciones proyectivas alinean objetos virtuales con el mundo real.

Conclusión

El álgebra lineal proporciona el marco matemático esencial para el procesamiento de imágenes moderno. Desde representaciones matriciales básicas hasta técnicas avanzadas como SVD y detección de características, estos conceptos permiten manipular y analizar imágenes de manera eficiente. Los ejercicios y teoremas presentados ilustran cómo la teoría se traduce en aplicaciones prácticas que impulsan tecnologías en medicina, entretenimiento y seguridad.



«`

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *