【CV】图像卷积计算即二维矩阵卷积(Python)
什么是卷积
一维线性卷积
线性卷积(linear convolution) 在时域描述线性系统输入和输出之间关系的一种运算。这种运算在线性系统分析和信号处理中应用很多,通常简称卷积。中文名:数字信号处理 什么是线性卷积,抛出代码:
import numpy as np >>np.convolve([1, 2, 3], [1, 2, 3], full) >>np.convolve([1, 2, 3], [1, 2, 3], same) >>np.convolve([1, 2, 3], [1, 2, 3], valid) array([ 1, 4, 10, 12, 9]) array([ 4, 10, 12]) array([ 10])
根据线性卷积的计算性质,长度x的序列1与长度y的序列2进行线性卷积,可以得到x+y-1的长度的卷积序列。而卷积规则,可以通过不进位相乘法计算出来。 即:
参数’full’
拿到完整的卷积结果,即[1, 4, 10, 12, 9]
参数’same’
以中间向两边散开,拿到第一个输入数组同样长度的卷积数组 ps:如果输入数组是偶数长度,则最后一个数向左边取,即:
>>np.convolve([1, 2, 3, 4], [1, 2, 3, 4], same) array([ 1, 4, 10, 20, 25, 24, 16])
参数’valid’
拿到卷积序列的中间部分的一个/两个数(若x×y-1为奇数则取1个,偶数则取2个)
>>np.convolve([1, 2, 3, 4], [1, 2, 3, 4], valid) >>np.convolve([1, 2, 3, 4], [1, 2, 3], valid) array([10]) array([10, 16])
二维线性卷积
现在有一张图片 f(x,y) 和一个kernel核 w(a,b)。 二维卷积又是个怎么卷法呢?从二维矩阵f(x,y)中拿到第一个值1,1的位置对上卷积核kernel w(a,b)中心位置(卷积核就是一个矩阵),对应位置的值与矩阵元素相乘最后求和,得到的值便是新的值-8,以此类推,取得所有位置的新值,最后图片的最外层填上0就可以了。二维卷积得到的大小取决与卷积核,而卷积核大小一般是奇数大小(例1×1, 3×3, 5×5),设图片大小为X1×Y1,卷积核大小为X2×X2,新的图片大小就是[X1 + (X2-1)÷2]×[Y1 + (X2-1)÷2]。为什么卷积核的大小一般是奇数呢,以3×3的卷积核,上图的图片左上角的1为例子,卷积后图片的像素值取决1周围一圈的像素值,取决的权重由卷积核决定,又因卷积核只有左上角值为4和右下角的值为-4,所以在图片的含义就是将左上角与右下角的像素亮度相减再加强。这是不是就好理解一点了呢 那么,python如何进行二维线性卷积呢?
from scipy import signal data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) nurcle = np.array([[0, 0, 0], [0, 1, 0], [0, 0, 0]]) signal.convolve2d(data, nurcle) signal.convolve2d(data, nurcle, same) signal.convolve2d(data, nurcle, valid) 第一个得到的是: [0 0 0 0 0] [0 1 2 3 0] [0 4 5 6 0] [0 7 8 9 0] [0 0 0 0 0] 第二个得到的是: [1 2 3] [4 5 6] [7 8 9] 第三个得到的是: [5]