第三阶段:中级图像处理

1. 图像滤波

数学原理及意义

1.1 平滑滤波

平滑滤波是一种常见的图像处理技术,用于去除噪声并改善图像质量。常用方法包括均值滤波高斯滤波

均值滤波(Average Filtering)

$$ g(x, y) = \frac{1}{m \cdot n} \sum_{i=-\frac{m}{2}}^{\frac{m}{2}} \sum_{j=-\frac{n}{2}}^{\frac{n}{2}} f(x+i, y+j) $$

其中:

效果

高斯滤波(Gaussian Filtering)

高斯滤波引入了加权平均思想,邻域中心像素权重更高,越远的像素权重越低,从而保留更多边缘信息。

数学模型
高斯函数的表达式为:

$$ G(x, y) = \frac{1}{2\pi\sigma^2} \exp\left(-\frac{x^2 + y^2}{2\sigma^2}\right) $$

其中:

推导公式
对中心点 ( (x, y) ),高斯滤波后的像素值为:

$$ g(x, y) = \sum_{i=-\frac{m}{2}}^{\frac{m}{2}} \sum_{j=-\frac{n}{2}}^{\frac{n}{2}} G(i, j) \cdot f(x+i, y+j) $$

推导解释

效果


1.2 边缘检测

边缘检测的目标是找到图像灰度值变化最大的区域,即梯度的极值点。

Sobel 边缘检测

Sobel 算子是基于图像梯度的边缘检测方法,通过卷积核对图像局部进行微分近似,计算灰度变化率。
梯度定义

$$ \nabla f = \left(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}\right) $$

Sobel 核矩阵

水平方向卷积核

$$ K_x = \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix} $$

垂直方向卷积核

$$ K_y = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix} $$

梯度模长计算
使用卷积核计算的梯度分别为:

$$ G_x = f \ast K_x, \quad G_y = f \ast K_y $$

梯度模长为:

$$ G = \sqrt{G_x^2 + G_y^2} $$

效果


Canny 边缘检测

公式背景
Canny 算法是一种多步骤的边缘检测方法,克服了 Sobel 算子的噪声敏感问题。

  1. 步骤解析

    • 高斯滤波:平滑噪声。
    • 梯度计算:使用 Sobel 核计算梯度。
    • 非极大值抑制(NMS):抑制非边缘点,保留梯度极值点。
    • 双阈值法:设置高、低两个阈值连接边缘。
  2. 非极大值抑制数学推导

    • 计算梯度方向 $( \theta = \arctan\left(\frac{G_y}{G_x}\right) )$。
    • 在梯度方向检查当前点是否是局部极大值:
      • 如果是,则保留。
      • 如果不是,则置为零。

1.3 形态学操作

形态学操作通过结构元素修改图像形状,常用于去噪和特征提取。

腐蚀(Erosion)

腐蚀操作使目标区域变小,定义为:

$$ A \ominus B = {z \mid (B)_z \subseteq A} $$

膨胀(Dilation)

膨胀操作使目标区域变大,定义为:

$$ A \oplus B = {z \mid (B)_z \cap A \neq \emptyset} $$

即:

意义:腐蚀去除小噪声点;膨胀填补目标区域的孔洞。


2. 特征检测

数学原理及意义

2.1 Harris 角点检测

Harris 算子基于图像灰度变化检测角点,其响应函数为:

$$ R = \det(M) - k \cdot (\text{trace}(M))^2 $$

其中:

数学意义:角点是图像中特征变化显著的区域,Harris 算子通过检测结构张量的特性来识别这些区域。


2.2 SIFT 特征提取

SIFT(尺度不变特征变换)提取图像中的关键点和描述子,其数学步骤包括:

  1. 构造高斯金字塔进行多尺度分析。
  2. 计算差分高斯(DoG)以检测特征点。
  3. 为特征点分配方向和位置。
  4. 提取特征描述子。

数学意义:SIFT 对图像缩放、旋转和光照变化具有不变性,适合特征匹配和目标识别。


2.3 特征匹配

特征匹配通过比较特征描述子实现跨图像匹配。最简单的方法是暴力匹配(Brute Force Matcher),计算欧氏距离:

$$ d(p, q) = \sqrt{\sum_{i=1}^n (p_i - q_i)^2} $$

数学意义:匹配过程寻找最相似的特征点,用于图像拼接、目标跟踪等任务。