首頁 > 軟體

OpenCV影象縮放之cv.resize()函數詳解

2022-09-14 22:03:02

系列前言

這個系列是我第一個想要更下去的系列。每篇會全面介紹一個 OpenCV 函數,會給出 API 和範例。範例主要是用 Python 去寫,但是 OpenCV 的原生語言是 C++,所以想翻譯過去其實很簡單。介紹過程中如果有相關的 CV 知識也會一併寫入,還是那句話,爭取做到說人話,讓小白也能看得懂。

API

API 來自 OpenCV官方檔案

C++

void cv::resize(InputArray    src,
                OutputArray   dst,
                Size          dsize,
                double        fx = 0,
                double        fy = 0,
                int           interpolation = INTER_LINEAR 
               )		

Python

dst = cv.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])

函數詳解

顧名思義,這個函數可以把圖片縮放到你想要的大小。

參數列

在這裡我們主要說 Python 的引數。把各個引數的含義和相關資訊打一張表:

引數型別是否必須指定具體含義
srcnumpy.ndarray原影象
dsizetuple<int>縮放後的影象大小
dst無所謂目標影象,但是在 Python 裡面沒有任何意義。一般不傳參或者設成 None
fx, fy數值型別x 和 y 方向上的縮放比例
interpolationint插值方式表示程式碼,本質是一個 int 數值,一般用 OpenCV 內建的引數代號以提高可讀性。

看這張表想必大家就很清楚了。

縮放方式其一

那麼,想要實現縮放影象,有兩種方法。第一種方法是指定縮放後的影象大小。下面是實現這個功能的一個簡單的程式。後面的給出的其他程式都是對 resize 所在行進行的改動。

import numpy as np
import cv2 as cv

img = cv.imread("你希望縮放的圖片")

# 縮放影象,後面的其他程式都是在這一行上改動
dst = cv.resize(img, (400, 300))

# 顯示影象
cv.imshow("dst: %d x %d" % (dst.shape[0], dst.shape[1]), dst)
cv.waitKey(0)
cv.destroyAllWindows()

在這個例子中,我們指定了縮放後影象的大小為 400 x 300resize 函數就會將影象拉伸到這個大小,拉伸後的影象相比於原圖不會有任何的裁剪。

縮放方式其二

另一種方法,就是利用後面的 fxfy,指定縮放後影象長寬相對於原圖的比例。如果利用這兩個引數,前面的 dsize 要寫成一個不合法的形式(比如:(0, 0))。具體原因後面會解釋。

注意,在 dsizefx 中間其實隔了一個無用的 dst,雖然沒有實際作用,但是這個引數確實存在,按照 Python 的函數傳參規則,要麼指明實參傳遞給哪個形參,要麼按順序傳參不能遺漏。具體看下面的例子,兩行的效果一致,都是將影象橫向縮放為原來的 0.5 倍,縱向縮放為原來的 0.3 倍。

# 形參預設
dst = cv.resize(img, (0, 0), None, 0.5, 0.3)

# 指明形參
dst = cv.resize(img, (0, 0), fx=0.5, fy=0.3)

值得注意的是,縮放後的影象寬高是根據 round(img.shape[0] * fx)round(img.shape[1] * fy) 來計算的,所以即使 fxfy 並不是0,只要這兩個計算結果中有一個是 0,也會報錯。

兩種方式的優先順序

OpenCV 會先檢查 dsize 是否合法,即影象的寬和高是否都是非 0 的。如果是,就按照這個縮放,忽略後面的 fxfy;如果不是,就按照 fxfy 來計算。即優先順序: dsize > fx fy.

另外,兩種方式是獨立定義的,也就是不能混著,用數值指定長卻用比率指定寬。不存在 cv.resize(img, (0, 400), fx=0.42) 這種用法!

關於插值方式

最後一個引數,在 resize 函數裡有 7 種可能取值,參考OpenCV檔案相關頁。但是我這裡第 7 個引數是不存在的,或許是版本問題?最後兩個引數我試過,會報錯,不行。

雖然這些引數非常龐雜,但他們的插值效果卻差不多,一般情況下,預設的線性插值就夠用。如果非要給點建議的話,我翻譯一下官網方檔案的原話

要縮小圖片,一般來說最好的插值方法是 cv.INTER_AREA,而要放大一張圖片的話,一般來說效果最好的是 cv.INTER_CUBIC (速度慢)或者 cv.INTER_LINEAR (速度快一些但結果仍然不錯)

擴充套件 —— 相關函數

OpenCV 為縮放影象的大小提供了其他的選擇,這裡說兩個函數:cv.pyrUpcv.pyrDown

這兩個函數可以用於構建影象金字塔,pyrUp 可以將影象長寬均放大為原來的 2 倍,而 pyrDown 則可以將影象長寬縮小為原來的 1/2. 與 resize 不同的是,這兩個函數和高斯折積核緊密相關。pyrUp 是對影象升取樣,隔行隔列插入零向量之後用高斯核折積,而 pyrDown 則是對影象高斯折積後隔行隔列取樣。兩個的折積核成倍數關係,前者是後者的4倍。

總結

到此這篇關於OpenCV影象縮放之cv.resize()函數詳解的文章就介紹到這了,更多相關OpenCV影象縮放cv.resize()函數內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com