![基于深度学习的目标检测原理与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/956/48376956/b_48376956.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.1.3 卷积
最开始,卷积(Convolution)是一个物理概念,出现在信号与线性系统中,对系统的单位响应与输入信号求卷积,以求得系统的输出信号。后来,卷积被运用在数字图像处理中,与最初的原理相通,只是进一步将一维函数变成二维卷积核(卷积模板),在图像上滑动。每次滑动计算相当于矩阵的点积,直到把整幅图像遍历,如图2-1-2所示。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_1.jpg?sign=1739543162-LFa4iBnaoaH5RD0hHPdE8O4kyEcMNBX5-0-257f78124f17e1df071e5ef0283fe62a)
图2-1-2 卷积原理示例[1]
高斯卷积(高斯模糊,Gaussian Blur)是常用的卷积应用之一。为了使图像没有突出的特征点,引入了模糊的概念。简易的模糊方法是选取每个像素周边像素的平均值。高斯模糊不是简单选取平均值,而是用高斯分布与图像做卷积,换句话说,就是加权,即将某点的像素用周围点的加权来表示,距离该点距离越近的点权重越大,越远的点权重越小,从而减少“被平均”的偏误,如图2-1-3所示。二维高斯函数表达式为
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_2.jpg?sign=1739543162-0DDUxtub4wt76V08Z8SP9HgnrwsUDyQc-0-db31a9e517e1ecb07db7b7a3e1893016)
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_3.jpg?sign=1739543162-Mzc8eXZmfJcXwbLB9wdhFTWfLrIkOpHo-0-dccac65e43f61fa010ba672a3cfc26fa)
注:彩插页有对应彩色图片。
图2-1-3 高斯函数立体图
不同卷积会造成不同的效果。双边滤波(Bilateral Filter)更接近磨皮的效果,比原始图像更光滑;高斯滤波会模糊原始图像。加入噪声后检测,双边滤波和高斯滤波基本可去除噪声。运用不同滤波的对比如图2-1-4所示。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_30_1.jpg?sign=1739543162-gbifzcFOjOXqtjRgdi4fw5QfxAw1xNDj-0-0d355f56967a964c58ee10b8936eab94)
资料来源:莱娜·瑟德贝里肖像图。
图2-1-4 运用不同滤波的对比
卷积神经网络(Convolutional Neural Networks,CNN)与高斯卷积不同之处在于,其每层都运用多个卷积核。如图2-1-5所示,一只狗的图像,经过一个卷积层,会输出多幅图像。一般来说,运用3×3的卷积核即可生成多幅不同特征的图像。其好处是可以使用不同的卷积核学习不同的特征。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_30_2.jpg?sign=1739543162-L8A0cFxUVXporDYQvBn6SmeeQ5bjkrlt-0-10ef26114b70d5ff1cb17de5634644e7)
资料来源:Andrew Ng Coursera卷积神经网络课程。
图2-1-5 卷积神经网络