「这是我参与11月更文挑战的第29天,活动详情查看:2021最后一次更文挑战」
图像的几何变换
几何变换主要包括缩放、平移、旋转、仿射变换、透视变换和图像裁剪等。执行这些几何变换的两个关键函数是 cv2.warpAffine()
和 cv2.warpPerspective()
。
cv2.warpAffine()
函数使用以下 2 x 3
变换矩阵来变换源图像:
dst(x,y)=src(M11x+M12y+M13,M21x+M22y+M23)dst(x,y)=src(M_{11}x+M_{12}y+M_{13}, M_{21}x+M_{22}y+M_{23})dst(x,y)=src(M11x+M12y+M13,M21x+M22y+M23)cv2.warpPerspective()
函数使用以下 3 x 3
变换矩阵变换源图像:
dst(x,y)=src(M11x+M12y+M13M31x+M32y+M33,M21x+M22y+M23M31x+M32y+M33)dst(x,y)=src(\frac {M_{11}x+M_{12}y+M_{13}} {M_{31}x+M_{32}y+M_{33}}, \frac {M_{21}x+M_{22}y+M_{23}} {M_{31}x+M_{32}y+M_{33}})dst(x,y)=src(M31x+M32y+M33M11x+M12y+M13,M31x+M32y+M33M21x+M22y+M23)
接下来,我们将了解最常见的几何变换技术。
缩放图像
缩放图像时,可以直接使用缩放后图像尺寸调用 cv2.resize()
:
1 | python复制代码# 指定缩放后图像尺寸 |
除了上述用法外,也可以同时提供缩放因子 fx
和 fy
值。例如,如果要将图像缩小 2 倍:
1 | python复制代码# 使用缩放因子 |
如果要放大图像,最好的方法是使用 cv2.INTER_CUBIC
插值方法(较耗时)或 cv2.INTER_LINEAR
。如果要缩小图像,一般的方法是使用 cv2.INTER_LINEAR
。OpenCV
提供的五种插值方法如下表所示:
插值方法 | 原理 |
---|---|
cv2.INTER_NEAREST | 最近邻插值 |
cv2.INTER_LINEAR | 双线性插值 |
cv2.INTER_AREA | 使用像素面积关系重采样 |
cv2.INTER_CUBIC | 基于4x4像素邻域的3次插值 |
cv2.INTER_LANCZOS4 | 正弦插值 |
显示缩放后的图像:
1 | python复制代码def show_with_matplotlib(color_img, title, pos): |
可以通过坐标系观察图片的缩放情况:
平移图像
为了平移对象,需要使用 NumPy
数组创建 2 x 3
变换矩阵,其中提供了 x
和 y
方向的平移距离(以像素为单位):
1 | python复制代码M = np.float32([[1, 0, x], [0, 1, y]]) |
其对应于以下变换矩阵:
[10tx01ty]\begin{bmatrix}
1 & 0 & t_x \
0 & 1 & t_y
\end{bmatrix}[1001txty]
创建此矩阵后,调用 cv2.warpAffine()
函数:
1 | python复制代码dst_image = cv2.warpAffine(image, M, (width, height)) |
cv2.warpAffine()
函数使用提供的 M 矩阵转换源图像。第三个参数 (width, height
) 用于确定输出图像的大小。
例如,如果图片要在 x 方向平移 200 个像素,在 y 方向移动 30 像素:
1 | python复制代码height, width = image.shape[:2] |
平移也可以为负值,此时为反方向移动:
1 | python复制代码M = np.float32([[1, 0, -200], [0, 1, -30]]) |
显示图片如下:
旋转图像
为了旋转图像,需要首先使用 cv.getRotationMatrix2D()
函数来构建 2 x 3
变换矩阵。该矩阵以所需的角度(以度为单位)旋转图像,其中正值表示逆时针旋转。旋转中心 (center
) 和比例因子 (scale
) 也可以调整,使用这些元素,以下方式计算变换矩阵:
[αβ(1−a)⋅center.x−β⋅center.y−βαβ⋅center.x−(1−α)⋅center.y]\begin{bmatrix}
\alpha & \beta & (1-a)\cdot center.x-\beta\cdot center.y \
-\beta & \alpha & \beta\cdot center.x-(1-\alpha)\cdot center.y
\end{bmatrix}[α−ββα(1−a)⋅center.x−β⋅center.yβ⋅center.x−(1−α)⋅center.y]
其中:
α=scale⋅cosθ,β=scale⋅sinθ\alpha=scale\cdot cos\theta, \beta=scale\cdot sin\thetaα=scale⋅cosθ,β=scale⋅sinθ
以下示例构建 M 变换矩阵以相对于图像中心旋转 180 度,缩放因子为 1(不缩放)。之后,将这个 M 矩阵应用于图像,如下所示:
1 | python复制代码height, width = image.shape[:2] |
接下来使用不同的旋转中心进行旋转:
1 | python复制代码M = cv2.getRotationMatrix2D((width/1.5, height/1.5), 30, 1) |
显示旋转后的图像:
2.4 图像的仿射变换
在仿射变换中,首先需要使用 cv2.getAffineTransform()
函数来构建 2 x 3
变换矩阵,该矩阵将从输入图像和变换图像中的相应坐标中获得。最后,将 M 矩阵传递给 cv2.warpAffine()
:
1 | python复制代码pts_1 = np.float32([[135, 45], [385, 45], [135, 230]]) |
仿射变换是保留点、直线和平面的变换。此外,平行线在此变换后将保持平行。但是,仿射变换不会同时保留像素点之间的距离和角度。
可以通过以下图像观察仿射变换的结果:
2.5 图像的透视变换
为了进行透视变换,首先需要使用 cv2.getPerspectiveTransform()
函数创建 3 x 3
变换矩阵。该函数需要四对点(源图像和输出图像中四边形的坐标),函数会根据这些点计算透视变换矩阵。然后,将 M 矩阵传递给 cv2.warpPerspective()
:
1 | python复制代码pts_1 = np.float32([[450, 65], [517, 65], [431, 164], [552, 164]]) |
透视变换效果如下所示:
2.6 裁剪图像
可以使用 NumPy
切片裁剪图像:
1 | python复制代码dst_image = image[80:200, 230:330] |
裁剪结果如下所示:
本文转载自: 掘金