OpenCV图像处理：Resize函数详细介绍与Python示例

引言

在数字图像处理的广阔天地中，图像尺寸的调整（Resize）无疑是最基础、最常用，也最关键的操作之一。无论是为了适应不同的显示设备、优化存储空间、提高处理速度，还是作为机器学习模型（如卷积神经网络）输入数据预处理的必要步骤，图像尺寸的调整都扮演着不可或缺的角色。

OpenCV（Open Source Computer Vision Library）作为一个功能强大、开源的计算机视觉库，提供了高效且灵活的图像处理工具，其中就包括了用于图像缩放的cv2.resize()函数。本文将带您深入探索cv2.resize()函数的奥秘，从其基本用法、参数解析，到不同插值方法的原理与应用，并通过丰富的Python代码示例，帮助您彻底掌握这一核心功能。

1. 为什么需要调整图像尺寸？

在深入cv2.resize()函数之前，我们先来理解为什么图像尺寸调整如此重要：

统一输入尺寸： 许多计算机视觉算法和深度学习模型（尤其是CNN）要求输入图像具有统一的尺寸。例如，一个预训练的ImageNet模型可能要求输入图像为224×224或256×256像素。
优化存储与传输： 高分辨率图像占用大量存储空间，传输也耗时。在不需要极致细节的场景下，适当缩小图像可以显著减少资源消耗。
提高处理效率： 对较小尺寸的图像进行操作通常比对大尺寸图像更快。在实时应用或对性能有较高要求的场景中，缩放图像是提升效率的有效手段。
适应显示设备： 图像可能需要在不同分辨率的屏幕上显示，调整尺寸可以确保图像在各种设备上都能以最佳效果呈现。
图像金字塔与多尺度分析： 在某些计算机视觉任务中，如特征检测（SIFT, SURF）或目标跟踪，会构建图像金字塔，即一系列不同尺寸的图像，以便在不同尺度上分析图像内容。

2. `cv2.resize()` 函数概览

cv2.resize()是OpenCV中用于调整图像大小的核心函数。它的完整签名如下：

python cv2.resize(src, dsize, fx=None, fy=None, interpolation=None)

下面我们来详细解析每一个参数。

2.1 参数详解

src (Source Image)
- 类型： NumPy数组（代表图像）。
- 描述： 这是要进行尺寸调整的原始输入图像。可以是单通道（灰度图）或多通道（彩色图，如BGR）。
dsize (Desired Size / Destination Size)
- 类型： 元组 (width, height)。
- 描述： 指定输出图像的绝对尺寸。注意，这里的顺序是 (宽度, 高度)，与NumPy数组的 (高度, 宽度, 通道数) 表示方式相反，这一点非常重要，新手常犯此错误。
- 重要提示： 如果 dsize 为 (0, 0)，则输出图像的尺寸将根据 fx 和 fy 参数计算得出。也就是说，dsize 和 fx/fy 至少要指定其中一个。如果两者都指定了，dsize 优先。
fx (Factor X)
- 类型： 浮点数。
- 描述： 沿水平方向（宽度）的缩放因子。如果为0，OpenCV会根据 dsize 计算出 fx。
- 计算方式： fx = (double)dsize.width / src.cols。
fy (Factor Y)
- 类型： 浮点数。
- 描述： 沿垂直方向（高度）的缩放因子。如果为0，OpenCV会根据 dsize 计算出 fy。
- 计算方式： fy = (double)dsize.height / src.rows。
- 重要提示： fx 和 fy 通常用于按比例缩放图像。如果 fx 和 fy 都指定，并且 dsize 为 (0, 0)，那么输出图像的宽度将是 src.cols * fx，高度将是 src.rows * fy。
interpolation (Interpolation Method)
- 类型： 整型常量。
- 描述： 指定用于计算新像素值的插值方法。这是决定缩放图像质量的关键参数。OpenCV提供了多种插值方法，每种方法在速度和质量之间有不同的权衡。

2.2 返回值

cv2.resize()函数返回一个新的NumPy数组，代表了调整尺寸后的图像。该图像的数据类型通常与输入图像相同。

3. 指定输出尺寸的两种方式

cv2.resize()提供了两种主要方式来指定输出图像的尺寸：通过绝对尺寸 dsize 或通过缩放因子 fx/fy。

3.1 方式一：指定绝对输出尺寸 (`dsize`)

直接设定输出图像的宽度和高度。

“`python
import cv2
import numpy as np

创建一个示例图像（一个200×150的蓝色矩形）

注意：OpenCV图像通常是BGR格式

img_src = np.zeros((150, 200, 3), dtype=np.uint8)
cv2.rectangle(img_src, (50, 25), (150, 125), (255, 0, 0), -1) # 蓝色矩形

显示原始图像

cv2.imshow(“Original Image”, img_src)
print(f”Original Image Shape: {img_src.shape}”) # (150, 200, 3)

示例1：将图像缩放到300×200像素

注意：dsize参数是 (width, height)

resized_abs_300x200 = cv2.resize(img_src, (300, 200))
cv2.imshow(“Resized to 300×200″, resized_abs_300x200)
print(f”Resized to 300×200 Shape: {resized_abs_300x200.shape}”) # (200, 300, 3)

示例2：将图像缩放到50×50像素 (可能会导致图像失真，因为宽高比改变)

resized_abs_50x50 = cv2.resize(img_src, (50, 50))
cv2.imshow(“Resized to 50×50″, resized_abs_50x50)
print(f”Resized to 50×50 Shape: {resized_abs_50x50.shape}”) # (50, 50, 3)

cv2.waitKey(0)
cv2.destroyAllWindows()
`` **注意：** 当使用dsize直接指定尺寸时，如果新的宽高比与原始图像的宽高比不一致，图像将会被拉伸或压缩，导致失真。这是使用dsize`时需要特别注意的一点。

3.2 方式二：指定缩放因子 (`fx`, `fy`)

通过为宽度和高度指定一个缩放比例。这种方式在保持图像宽高比时非常方便。

“`python
import cv2
import numpy as np

创建一个示例图像

img_src = np.zeros((150, 200, 3), dtype=np.uint8)
cv2.rectangle(img_src, (50, 25), (150, 125), (0, 255, 0), -1) # 绿色矩形

cv2.imshow(“Original Image”, img_src)
print(f”Original Image Shape: {img_src.shape}”) # (150, 200, 3)

示例1：将图像放大2倍 (fx=2, fy=2)

dsize设置为(0,0)，表示尺寸由fx和fy决定

resized_factor_2x = cv2.resize(img_src, (0, 0), fx=2, fy=2)
cv2.imshow(“Resized by Factor 2x”, resized_factor_2x)
print(f”Resized by Factor 2x Shape: {resized_factor_2x.shape}”) # (300, 400, 3)

示例2：将图像缩小到一半 (fx=0.5, fy=0.5)

resized_factor_0_5x = cv2.resize(img_src, (0, 0), fx=0.5, fy=0.5)
cv2.imshow(“Resized by Factor 0.5x”, resized_factor_0_5x)
print(f”Resized by Factor 0.5x Shape: {resized_factor_0_5x.shape}”) # (75, 100, 3)

示例3：不同比例缩放，导致失真 (fx=1.5, fy=0.8)

resized_factor_distorted = cv2.resize(img_src, (0, 0), fx=1.5, fy=0.8)
cv2.imshow(“Resized by Different Factors (Distorted)”, resized_factor_distorted)
print(f”Resized by Different Factors Shape: {resized_factor_distorted.shape}”) # (120, 300, 3)

cv2.waitKey(0)
cv2.destroyAllWindows()
`` 使用fx和fy时，如果fx == fy`，则图像的宽高比将保持不变，避免失真。

4. 核心：插值方法 (Interpolation Methods)

插值是图像缩放中最核心的概念之一。当图像尺寸改变时，新生成的像素点可能没有对应的原始像素点。插值方法的作用就是根据周围已知像素点的颜色信息，推断出新像素点的颜色值。不同的插值方法在计算复杂度、处理速度和图像质量之间提供了不同的平衡。

OpenCV支持以下几种主要的插值方法：

cv2.INTER_NEAREST (最近邻插值)
- 原理： 对于新生成的像素点，直接采用离它最近的原始像素点的颜色值。
- 特点：
  - 速度最快： 计算量最小，因为它不需要进行复杂的数学运算。
  - 质量最差： 图像边缘会产生明显的锯齿状（块状效应），细节丢失严重。
  - 应用场景： 对速度要求极高，对图像质量要求不高，或者图像本身就比较简单、颜色区域分明的场景。在对二值图像或标签图（segmentation maps）进行缩放时，这是唯一能保留像素原始语义的方法。
- 总结： 速度优先，质量最低。
cv2.INTER_LINEAR (双线性插值)
- 原理： 对于新生成的像素点，取其周围四个最近的原始像素点的颜色值，并根据距离进行加权平均。
- 特点：
  - 速度较快： 比最近邻慢，但比双三次插值快。
  - 质量较好： 能够有效平滑图像，减少锯齿感，效果比最近邻插值好很多。
  - 应用场景： 默认插值方法，适用于大多数通用图像缩放场景，尤其是放大图像时。
- 总结： 速度和质量的良好折衷，默认选项。
cv2.INTER_CUBIC (双三次插值)
- 原理： 对新生成的像素点，取其周围16个（4×4）最近的原始像素点的颜色值，并根据距离进行加权平均。它使用一个3次多项式来拟合周围的像素。
- 特点：
  - 速度较慢： 计算量大，比双线性插值慢。
  - 质量最好（通常）： 能够生成更平滑、细节更丰富的图像，尤其在放大时效果显著优于双线性。能更好地保留图像的边缘信息。
  - 应用场景： 对图像质量要求较高，愿意牺牲一些处理速度的场景，尤其是在放大图像时。
- 总结： 质量优先，速度次之。
cv2.INTER_AREA (区域插值)
- 原理：
  - 缩小图像： 当缩小图像时，它通过对原始图像中对应区域的像素进行平均来计算新像素的值。这个过程就像是把原图的每一个“区域”压缩成一个像素，新像素的值就是该区域内所有像素的平均值。
  - 放大图像： 当放大图像时，它与INTER_NEAREST类似。
- 特点：
  - 缩小图像效果最佳： 在缩小图像时，INTER_AREA通常被认为是效果最好的方法，因为它能够有效地避免图像出现摩尔纹（Moiré pattern）和锯齿。它通过计算像素区域的平均值来减少信息的丢失。
  - 速度较快： 在缩小图像时效率很高。
  - 应用场景： 主要用于缩小图像，以获得高质量和避免伪影。
- 总结： 缩小图像的最佳选择，速度和质量兼顾。
cv2.INTER_LANCZOS4 (Lanczos插值)
- 原理： 使用Lanczos核函数进行插值。它考虑了周围8×8或更多像素的信息，提供了比双三次插值更高级的数学处理。
- 特点：
  - 速度最慢： 计算量最大，对CPU资源消耗较高。
  - 质量最优： 在许多情况下，尤其是在放大图像时，它能产生比双三次插值更清晰、更锐利的边缘，同时减少锯齿和振铃效应。
  - 应用场景： 对图像质量有极高要求，并且对处理时间不敏感的专业图像处理场景。
- 总结： 极致质量，速度最慢。

4.1 插值方法选择总结

缩小图像（Downscaling）： cv2.INTER_AREA 通常是最佳选择，因为它能有效去除锯齿和摩尔纹，并保留图像的整体结构。
放大图像（Upscaling）：
- 如果追求速度，选择 cv2.INTER_NEAREST。
- 如果平衡速度和质量，选择 cv2.INTER_LINEAR。
- 如果追求高质量，选择 cv2.INTER_CUBIC 或 cv2.INTER_LANCZOS4 (INTER_LANCZOS4通常是最高质量)。
标签图/语义分割图： 必须使用 cv2.INTER_NEAREST 以保留像素的类别信息，避免引入新的、混合的类别值。

4.2 不同插值方法的Python示例

“`python
import cv2
import numpy as np

加载一张图像

try:
img_path = ‘input_image.jpg’ # 请确保您的项目目录下有一张名为input_image.jpg的图片
img = cv2.imread(img_path)
if img is None:
raise FileNotFoundError(f”Cannot load image from {img_path}”)
except FileNotFoundError as e:
print(e)
# 如果图片不存在，创建一个合成图像作为替代
img = np.zeros((300, 400, 3), dtype=np.uint8)
cv2.putText(img, “OpenCV Resize Demo”, (50, 150), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA)
cv2.circle(img, (200, 200), 80, (0, 0, 255), -1) # 添加一个圆形，观察边缘

print(f”Original Image Shape: {img.shape}”)
cv2.imshow(“Original Image”, img)

目标尺寸：放大2倍

target_width = img.shape[1] * 2
target_height = img.shape[0] * 2
target_dsize = (target_width, target_height)

— 放大图像的插值方法比较 —

INTER_NEAREST

resized_nearest = cv2.resize(img, target_dsize, interpolation=cv2.INTER_NEAREST)
cv2.imshow(“INTER_NEAREST (Upscale)”, resized_nearest)
print(f”INTER_NEAREST (Upscale) Shape: {resized_nearest.shape}”)

INTER_LINEAR (默认)

resized_linear = cv2.resize(img, target_dsize, interpolation=cv2.INTER_LINEAR)
cv2.imshow(“INTER_LINEAR (Upscale)”, resized_linear)
print(f”INTER_LINEAR (Upscale) Shape: {resized_linear.shape}”)

INTER_CUBIC

resized_cubic = cv2.resize(img, target_dsize, interpolation=cv2.INTER_CUBIC)
cv2.imshow(“INTER_CUBIC (Upscale)”, resized_cubic)
print(f”INTER_CUBIC (Upscale) Shape: {resized_cubic.shape}”)

INTER_LANCZOS4

resized_lanczos4 = cv2.resize(img, target_dsize, interpolation=cv2.INTER_LANCZOS4)
cv2.imshow(“INTER_LANCZOS4 (Upscale)”, resized_lanczos4)
print(f”INTER_LANCZOS4 (Upscale) Shape: {resized_lanczos4.shape}”)

— 缩小图像的插值方法比较 —

目标尺寸：缩小到一半

target_width_down = img.shape[1] // 2
target_height_down = img.shape[0] // 2
target_dsize_down = (target_width_down, target_height_down)

INTER_NEAREST (Downscale)

resized_nearest_down = cv2.resize(img, target_dsize_down, interpolation=cv2.INTER_NEAREST)
cv2.imshow(“INTER_NEAREST (Downscale)”, resized_nearest_down)
print(f”INTER_NEAREST (Downscale) Shape: {resized_nearest_down.shape}”)

INTER_LINEAR (Downscale)

resized_linear_down = cv2.resize(img, target_dsize_down, interpolation=cv2.INTER_LINEAR)
cv2.imshow(“INTER_LINEAR (Downscale)”, resized_linear_down)
print(f”INTER_LINEAR (Downscale) Shape: {resized_linear_down.shape}”)

INTER_AREA (Downscale) – 推荐用于缩小

resized_area_down = cv2.resize(img, target_dsize_down, interpolation=cv2.INTER_AREA)
cv2.imshow(“INTER_AREA (Downscale)”, resized_area_down)
print(f”INTER_AREA (Downscale) Shape: {resized_area_down.shape}”)

cv2.waitKey(0)
cv2.destroyAllWindows()
`` **实验观察：** 运行上述代码并对比不同插值方法的输出图像。你会发现： * **放大时：**INTER_NEAREST会出现明显的马赛克方块；INTER_LINEAR比较平滑，但细节略模糊；INTER_CUBIC和INTER_LANCZOS4边缘更锐利，细节保留更好，其中INTER_LANCZOS4通常被认为是视觉效果最好的。 * **缩小时：**INTER_NEAREST会丢失大量细节并产生锯齿；INTER_LINEAR效果尚可；而INTER_AREA` 通常能提供最清晰、最少伪影的缩小图像。

5. 实际应用中的高级技巧

5.1 保持图像宽高比 (Aspect Ratio)

在很多情况下，我们希望在调整图像尺寸时保持其原始的宽高比，以避免图像失真。这通常通过两种策略实现：按比例缩放（Fit）或填充/裁剪（Pad/Crop）。

5.1.1 策略一：按比例缩放至最大尺寸（Fit within a bounding box）

将图像缩放到目标框内，同时保持宽高比，即图像的某个边（宽或高）会达到目标尺寸，而另一边则按比例缩放，使得图像完全适应目标尺寸，且不超出。

“`python
import cv2
import numpy as np

加载图像

try:
img = cv2.imread(‘input_image.jpg’)
if img is None:
raise FileNotFoundError
except FileNotFoundError:
img = np.zeros((400, 600, 3), dtype=np.uint8)
cv2.putText(img, “Original Image”, (50, 200), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2, cv2.LINE_AA)

original_height, original_width = img.shape[:2]
target_size = (300, 300) # 目标是一个300×300的正方形

计算缩放比例

找到使得图像完全适应目标尺寸的最大缩放因子

如果按照宽度缩放，高度可能超出；如果按照高度缩放，宽度可能超出

目标是：缩放后，新宽度 <= target_width 且新高度 <= target_height

所以，选择较小的缩放因子

r_w = target_size[0] / original_width
r_h = target_size[1] / original_height
scale = min(r_w, r_h)

new_width = int(original_width * scale)
new_height = int(original_height * scale)

resized_fit = cv2.resize(img, (new_width, new_height), interpolation=cv2.INTER_AREA)

print(f”Original: {original_width}x{original_height}”)
print(f”Target Size: {target_size}”)
print(f”Resized (Fit): {resized_fit.shape[1]}x{resized_fit.shape[0]}”)

cv2.imshow(“Original”, img)
cv2.imshow(“Resized_Fit_Within_Box”, resized_fit)
cv2.waitKey(0)
cv2.destroyAllWindows()
“`

5.1.2 策略二：填充（Padding）以达到目标尺寸

将图像按比例缩放至目标尺寸的某个维度（例如宽度达到目标宽度），然后通过在边缘添加颜色（通常是黑色或灰色）来填充图像，使其达到完全的目标尺寸。这在深度学习中常用于将不同宽高比的图像填充成统一的正方形输入。

“`python
import cv2
import numpy as np

加载图像

original_height, original_width = img.shape[:2]
target_size = (300, 300) # 目标是一个300×300的正方形
target_width, target_height = target_size

计算缩放比例

找到使得图像的任一边达到目标尺寸，另一边按比例缩放的最大缩放因子

目标是：缩放后，新宽度 <= target_width 且新高度 <= target_height

scale = min(target_width / original_width, target_height / original_height)
new_width = int(original_width * scale)
new_height = int(original_height * scale)

先进行缩放

resized_img = cv2.resize(img, (new_width, new_height), interpolation=cv2.INTER_AREA)

创建一个目标尺寸的画布

这里的颜色是黑色 (0, 0, 0)

padded_img = np.zeros((target_height, target_width, 3), dtype=np.uint8)

计算图像在新画布上的起始位置，使其居中

start_x = (target_width – new_width) // 2
start_y = (target_height – new_height) // 2

将缩放后的图像粘贴到画布中央

padded_img[start_y:start_y + new_height, start_x:start_x + new_width] = resized_img

print(f”Original: {original_width}x{original_height}”)
print(f”Target Size: {target_size}”)
print(f”Resized (Padded): {padded_img.shape[1]}x{padded_img.shape[0]}”)

cv2.imshow(“Original”, img)
cv2.imshow(“Resized_Padded_to_Target”, padded_img)
cv2.waitKey(0)
cv2.destroyAllWindows()
“`

5.1.3 策略三：裁剪（Cropping）以达到目标尺寸

将图像按比例缩放，使得图像的宽或高至少有一个维度达到目标尺寸，然后从中心或指定位置裁剪掉多余的部分，以适应目标尺寸。这确保了图像完全覆盖目标尺寸，但可能会丢失部分原始图像内容。

“`python
import cv2
import numpy as np

加载图像

original_height, original_width = img.shape[:2]
target_size = (300, 300) # 目标是一个300×300的正方形
target_width, target_height = target_size

计算缩放比例

找到使得图像的任一边达到目标尺寸，另一边按比例缩放的最小缩放因子

目标是：缩放后，新宽度 >= target_width 且新高度 >= target_height

scale = max(target_width / original_width, target_height / original_height)
new_width = int(original_width * scale)
new_height = int(original_height * scale)

先进行缩放

resized_img = cv2.resize(img, (new_width, new_height), interpolation=cv2.INTER_CUBIC)

计算裁剪的起始点，使其居中裁剪

start_x = (new_width – target_width) // 2
start_y = (new_height – target_height) // 2

执行裁剪

cropped_img = resized_img[start_y : start_y + target_height, start_x : start_x + target_width]

print(f”Original: {original_width}x{original_height}”)
print(f”Target Size: {target_size}”)
print(f”Resized (Cropped): {cropped_img.shape[1]}x{cropped_img.shape[0]}”)

cv2.imshow(“Original”, img)
cv2.imshow(“Resized_Cropped_to_Target”, cropped_img)
cv2.waitKey(0)
cv2.destroyAllWindows()
“`

5.2 批量调整图像尺寸

在处理大量图像数据集时，我们经常需要对文件夹中的所有图像进行批量尺寸调整。

“`python
import cv2
import os
import glob # 用于查找文件路径

创建一个用于存放原始图像和输出图像的文件夹

input_dir = ‘images_to_resize’
output_dir = ‘resized_images’
os.makedirs(input_dir, exist_ok=True)
os.makedirs(output_dir, exist_ok=True)

假设我们在 input_dir 中有一些图像 (为了演示，我们先创建几个模拟图像)

for i in range(3):
dummy_img = np.random.randint(0, 256, (np.random.randint(200, 500), np.random.randint(300, 600), 3), dtype=np.uint8)
cv2.putText(dummy_img, f”Image {i+1}”, (50, 100), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA)
cv2.imwrite(os.path.join(input_dir, f’image_{i+1}.jpg’), dummy_img)
print(f”Created {len(os.listdir(input_dir))} dummy images in {input_dir}”)

target_width = 224
target_height = 224
target_dsize = (target_width, target_height)
interpolation_method = cv2.INTER_AREA # 缩小图像推荐使用

获取所有图像文件

image_files = glob.glob(os.path.join(input_dir, ‘.jpg’)) + \
glob.glob(os.path.join(input_dir, ‘.png’)) + \
glob.glob(os.path.join(input_dir, ‘*.jpeg’))

print(f”Found {len(image_files)} images to process.”)

for img_path in image_files:
# 读取图像
img = cv2.imread(img_path)
if img is None:
print(f”Warning: Could not read {img_path}. Skipping.”)
continue

# 调整尺寸
resized_img = cv2.resize(img, target_dsize, interpolation=interpolation_method)

# 构建输出文件路径
base_name = os.path.basename(img_path)
output_path = os.path.join(output_dir, base_name)

# 保存调整后的图像
cv2.imwrite(output_path, resized_img)
print(f"Resized {base_name} to {resized_img.shape[1]}x{resized_img.shape[0]} and saved to {output_path}")

print(“Batch resizing complete.”)
“`

5.3 性能考虑

缩小图像： 对于缩小图像，cv2.INTER_AREA 不仅效果好，而且计算效率也很高，通常是首选。
放大图像：
- cv2.INTER_NEAREST 最快，但质量差。
- cv2.INTER_LINEAR 在速度和质量之间取得平衡。
- cv2.INTER_CUBIC 和 cv2.INTER_LANCZOS4 质量最高，但速度最慢。
硬件加速： OpenCV的resize函数通常已经高度优化，可能会利用底层的SIMD指令集（如SSE/AVX）甚至GPU（如果OpenCV是带CUDA编译的）进行加速。对于大规模图像处理，考虑使用多线程或多进程进行批处理。

6. 常见问题与注意事项

dsize 参数的顺序： 再次强调，dsize 是 (width, height)，而不是 (height, width)。这是初学者最容易出错的地方。
宽高比失真： 如果不仔细计算，直接设置 dsize 可能会导致图像比例失真。务必根据需要使用保持宽高比的策略。
数据类型： cv2.resize() 通常会保留输入图像的数据类型。例如，如果输入是 np.uint8，输出也是 np.uint8。这对于后续操作（如图像归一化）很重要。
图像加载失败： 在进行批量处理时，务必检查 cv2.imread() 的返回值，确保图像被成功加载（如果返回 None 则表示加载失败）。
内存占用： 放大图像会显著增加内存占用。在处理非常大的图像或大量图像时，需要注意内存管理，避免内存溢出。

7. 结论

cv2.resize()函数是OpenCV中一个极其重要且功能强大的图像处理工具。通过本文的详细介绍和Python示例，我们已经全面了解了其参数、各种插值方法的原理与应用场景，以及如何在实际项目中高效、高质量地进行图像尺寸调整，包括如何保持图像宽高比、如何进行批量处理以及需要注意的性能和常见问题。

掌握cv2.resize()不仅是入门OpenCV的基石，更是进行任何高级计算机视觉任务（如目标检测、图像分类、图像分割等）之前不可或缺的预处理步骤。通过灵活运用不同的插值策略，您可以根据具体需求，在图像质量、处理速度和资源消耗之间找到最佳平衡点。希望本文能为您在OpenCV图像处理的学习和实践中提供坚实的帮助。

OpenCV图像处理：Resize函数详细介绍与Python示例

引言

1. 为什么需要调整图像尺寸？

2. cv2.resize() 函数概览

2.1 参数详解

2.2 返回值

3. 指定输出尺寸的两种方式

3.1 方式一：指定绝对输出尺寸 (dsize)

创建一个示例图像（一个200×150的蓝色矩形）

注意：OpenCV图像通常是BGR格式

显示原始图像

示例1：将图像缩放到300×200像素

注意：dsize参数是 (width, height)

示例2：将图像缩放到50×50像素 (可能会导致图像失真，因为宽高比改变)

3.2 方式二：指定缩放因子 (fx, fy)

创建一个示例图像

示例1：将图像放大2倍 (fx=2, fy=2)

dsize设置为(0,0)，表示尺寸由fx和fy决定

示例2：将图像缩小到一半 (fx=0.5, fy=0.5)

示例3：不同比例缩放，导致失真 (fx=1.5, fy=0.8)

4. 核心：插值方法 (Interpolation Methods)

4.1 插值方法选择总结

4.2 不同插值方法的Python示例

加载一张图像

目标尺寸：放大2倍

— 放大图像的插值方法比较 —

INTER_NEAREST

INTER_LINEAR (默认)

INTER_CUBIC

INTER_LANCZOS4

— 缩小图像的插值方法比较 —

目标尺寸：缩小到一半

INTER_NEAREST (Downscale)

INTER_LINEAR (Downscale)

INTER_AREA (Downscale) – 推荐用于缩小

5. 实际应用中的高级技巧

5.1 保持图像宽高比 (Aspect Ratio)

5.1.1 策略一：按比例缩放至最大尺寸（Fit within a bounding box）

加载图像

计算缩放比例

找到使得图像完全适应目标尺寸的最大缩放因子

如果按照宽度缩放，高度可能超出；如果按照高度缩放，宽度可能超出

目标是：缩放后，新宽度 <= target_width 且 新高度 <= target_height

所以，选择较小的缩放因子

5.1.2 策略二：填充（Padding）以达到目标尺寸

加载图像

计算缩放比例

找到使得图像的任一边达到目标尺寸，另一边按比例缩放的最大缩放因子

目标是：缩放后，新宽度 <= target_width 且 新高度 <= target_height

先进行缩放

创建一个目标尺寸的画布

这里的颜色是黑色 (0, 0, 0)

计算图像在新画布上的起始位置，使其居中

将缩放后的图像粘贴到画布中央

5.1.3 策略三：裁剪（Cropping）以达到目标尺寸

加载图像

计算缩放比例

找到使得图像的任一边达到目标尺寸，另一边按比例缩放的最小缩放因子

目标是：缩放后，新宽度 >= target_width 且 新高度 >= target_height

先进行缩放

计算裁剪的起始点，使其居中裁剪

执行裁剪

5.2 批量调整图像尺寸

创建一个用于存放原始图像和输出图像的文件夹

假设我们在 input_dir 中有一些图像 (为了演示，我们先创建几个模拟图像)

获取所有图像文件

5.3 性能考虑

6. 常见问题与注意事项

7. 结论

发表评论 取消回复

2. `cv2.resize()` 函数概览

3.1 方式一：指定绝对输出尺寸 (`dsize`)

3.2 方式二：指定缩放因子 (`fx`, `fy`)

目标是：缩放后，新宽度 <= target_width 且新高度 <= target_height

目标是：缩放后，新宽度 <= target_width 且新高度 <= target_height

目标是：缩放后，新宽度 >= target_width 且新高度 >= target_height

发表评论取消回复