Lecture 3⚓︎
约 2246 个字 预计阅读时间 11 分钟
数学工具⚓︎
基础的、逻辑的、空间的、概率的(对应教材的 63/750)
- 元素级操作
- 线性操作
- 算术操作
- 相加平均:平均噪声
- 相减比较:负数可能是噪声等其他信息,可以忽略
- 相乘/除校正阴影和模板:乘法选出 ROI(Region of Interest)区域,mask 效果;除法可以进行亮度矫正,normalization 效果
- 集合/逻辑运算
- 空间运算,分成刚体变换(平移+旋转)与放射变换(缩放+剪切)
公式的顺序是:先缩放,再旋转,最后平移 $\( \begin{bmatrix} x' \\ y' \\ z' \\ 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 & 0 & p \\ 0 & 1 & 0 & q \\ 0 & 0 & 1 & r \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} \cos\theta & \sin\theta & 0 & 0 \\ -\sin\theta & \cos\theta & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} \cos\omega & 0 & -\sin\omega & 0 \\ 0 & 1 & 0 & 0 \\ \sin\omega & 0 & \cos\omega & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos\phi & \sin\phi & 0 \\ 0 & -\sin\phi & \cos\phi & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} a & 0 & 0 & 0 \\ 0 & b & 0 & 0 \\ 0 & 0 & c & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix} \)$
强度变换⚓︎
点变换(像素级)⚓︎
变换根本公式如下: $\( s = T(r),\quad \text{s 是变换后的强度,r 是变换前的强度} \)$ 常用公式为:线性变换、对数变换、幂函数变换;分段线性函数(取决用户输入、算法稍微复杂,可用于强调部分灰度范围或灰度分层、去除背景增强前景)
直方图(概率)⚓︎
概率:某一亮度出现的次数/总数 。\(p(z_k) = \displaystyle \frac{n_k}{MN}\)。
直方图操作是图像处理的一种常用工具。
直方图中常见的一个现象是,图片不一样但是直方图一样
直方图均衡化⚓︎
四组图像对比:
- 暗图像 (Dark image): 像素值都集中在左边(低灰度值区域)。
-
亮图像 (Light image): 像素值都集中在右边(高灰度值区域)。
-
低对比度图像 (Low-contrast image): 像素值集中在中间很窄的区域,图像看起来灰蒙蒙的,细节分辨不清。
-
高对比度图像 (High-contrast image): 像素值均匀地分布在整个灰度范围内(从最黑到最白)。这是 视觉效果最好、细节最清晰的图像
Goal: 找到一个函数关系 s = T(r), so that 概率 \( p_s(s) = \frac{1}{L-1}\)。推导见下
数学知识补充:概率论中的变量代换法则 $\( p_s(s) = p_r(r) \left| \frac{dr}{ds} \right| \)\( **📌 选择函数** \)\( s = T(r) = (L-1) \int_{0}^{r} p_r(w)dw \)\( 选择原因:经过数学运算可知,该函数满足下列式子,则说明上式即为我们所求的式子 \)\( p_s(s) = \frac{1}{L-1} \)$
"summary"
如果用 原图像的“累积概率” 来作为转换函数,那么转换出的新图像,其直方图就一定是完美均匀分布的常数 \(\displaystyle \frac{1}{L-1}\)
数学表述是:s(r)的值是 r 的概率分布总和乘以(L-1)。即 s(r)是 r 的概率分布函数,则 s 的概率分布概率密度函数为均匀分布
对于离散函数,需要进行向下取整的操作,则直方图的值可能并非完全均匀,而是会有波动
直方图匹配⚓︎
Goal:得到一个 特定形状 的直方图。在实际应用中,绝对均匀往往不自然,我们可能想让一张照片的色调去“模仿”另一张照片
为了方便理解,把公式中的变量看作三种语言:
- \(r\) (原图 Input image): 中文
- \(z\) (目标图 Specific histogram): 法文
- \(s\) (均匀分布的中间图): 英文(桥梁)
现在你想把中文翻译成法文,但你只有一本“中英词典”和一本“法英词典”。怎么做?
第一步:中文 \(\rightarrow\) 英文(原图 \(\rightarrow\) 桥梁) $\( s = T(r) = (L-1) \int_{0}^{r} p_r(w)dw \)\( 直方图均衡化。我们把原图的像素 \)r\( 通过累积概率函数 \)T(r)\( 处理,得到一个直方图完全均匀的中间图像,它的像素值叫 \)s$。
第二步:法文 \(\rightarrow\) 英文(假设的目标图 \(\rightarrow\) 桥梁) $\( s = G(z) = (L-1) \int_{0}^{z} p_z(v)dv \)\( 假设我们手里已经有了那个理想的目标图像,它的像素叫 \)z\(,概率分布是 \)p_z\(。如果我们也对这个目标图做一次均衡化(函数叫 \)G\(),毫无疑问,它最后也会变成那个完全均匀的中间图 \)s$。
第三步:英文 \(\rightarrow\) 法文(桥梁 \(\rightarrow\) 目标图)
既然 \(s = G(z)\),我们在数学上就可以求它的 反函数: $\( z = G^{-1}(s) \)\( 这意味着:如果我们手里有一个均匀分布的图像 \)s\(,只要套用这个反函数 \)G^{-1}\(,就能把它“捏”成我们想要的那个特定形状 \)z$!这就相当于通过英文反向查找到了法文。
终极整合:中文 \(\rightarrow\) 英文 \(\rightarrow\) 法文 $\( z = G^{-1}(s) = G^{-1}[T(r)] \)\( 我们拿来原图的像素 \)r\( \)rightarrow\( 用 \)T\( 把它变成均匀的 \)s\( \)rightarrow\( 接着立刻用反函数 \)G^{-1}\( 处理这个 \)s\( \)rightarrow\( 最终得到了具有指定直方图形状的新像素 \)z$。
+ "直方图匹配最核心的数学盲区"
-
等式(1)是否能够对于特定的 \(p_z\) 成立? 不仅成立,而且它是强制成立的。\(p_z\) 是你 预先设定好 的理想形状(比如你规定它必须是一个钟形曲线)。无论你设定什么样的 \(p_z\),这个积分等式 1 都是成立的。
因为这个等式不是用来证明 \(p_r\) 和 \(p_z\) 有什么关系,这个等式是一个“方程”,我们是用这个等式来求解未知数 \(z\) 的。
-
z 与 s 的关系不一定能够通过数学表达式显现,但能够通过计算语言+查表法得到对应关系。计算机的做法简单粗暴,叫做 寻找最接近的值(查表法):
-
建表 1(原图): 统计原图,算出每一个灰度级 \(r\) 对应的累积概率(再乘 255)。比如算出来 \(r=50\) 时,\(s = 120\)。
-
建表 2(目标图): 根据你给定的目标直方图 \(p_z\),算出每一个灰度级 \(z\) (0~255) 对应的累积概率 \(G(z)\)。这是一张长长的对照表,例如:
- ...
- 当 \(z=60\) 时,\(G(60) = 110\)
- 当 \(z=61\) 时,\(G(61) = 119\)
- 当 \(z=62\) 时,\(G(62) = 126\)
- ...
-
找 \(z\)(反向匹配): 我们手里拿着原图算出来的 \(s = 120\)。去“表 2”里找,哪个 \(G(z)\) 的结果最接近 120?
一看表,\(119\) 离 \(120\) 最近。而 \(119\) 对应的 \(z\) 是 \(61\)。
-
最终映射: 原图中所有灰度为 50 的像素,全部改成 61。
-
-
概念清晰:\(p_s\), \(p_z\) 是概率密度,表示强度为 s/z 出现的概率, s、z、r 表示的是强度,映射是强度映射,表现在图像上就是强度为 \(r_x\) 的点全部替换成强度为 \(z_q\) 的强度,体现在直方图上就是按照 \(p_z\) 的概率分布的直方图曲线。核心是理解强度、概率密度、直方图等的交互关系
Summary⚓︎
AI 总结⚓︎
一句话总结⚓︎
本讲围绕图像处理中的数学工具、强度变换与直方图方法展开,重点说明了如何通过灰度映射改善图像视觉效果并实现目标分布匹配。
核心内容⚓︎
- 数学工具部分梳理了元素级操作、算术运算、逻辑运算与空间变换,为后续图像增强和几何处理提供基础。
- 强度变换以点变换为核心,用
s = T(r)描述输入灰度到输出灰度的映射关系,常见形式包括线性、对数、幂次和分段线性变换。 - 直方图是描述灰度概率分布的重要工具,可用于判断图像偏暗、偏亮、低对比度或高对比度等特征。
- 直方图均衡化通过累计分布函数构造变换,使输出灰度分布尽量接近均匀,从而提升整体对比度。
- 直方图匹配在均衡化基础上进一步引入目标分布,通过
z = G^{-1}[T(r)]让图像逼近指定的灰度统计特性。
精炼版⚓︎
这份笔记的主线是“先定义灰度变换,再利用直方图分析和设计变换”。前半部分介绍图像处理常用数学操作,后半部分重点讲直方图均衡化与直方图匹配的原理、公式和实现思路,是图像增强章节的核心内容。
关键词⚓︎
数学工具、空间变换、强度变换、点变换、直方图、概率分布、直方图均衡化、直方图匹配、累计分布函数、灰度映射