Python影象處理之影象金字塔詳解

2022-02-11 13:01:31

一.影象金字塔原理

上一篇文章講解的影象取樣處理可以降低影象的大小，本文將補充影象金字塔知識，瞭解專門用於影象向上取樣和向下取樣的pyrUp()和pyrDown()函數。

影象金字塔是指由一組影象且不同分別率的子圖集合，它是影象多尺度表達的一種，以多解析度來解釋影象的結構，主要用於影象的分割或壓縮。一幅影象的金字塔是一系列以金字塔形狀排列的解析度逐步降低，且來源於同一張原始圖的影象集合。如圖10-1所示，它包括了四層影象，將這一層一層的影象比喻成金字塔。影象金字塔可以通過梯次向下取樣獲得，直到達到某個終止條件才停止取樣，在向下取樣中，層級越高，則影象越小，解析度越低[1-2]。

生成影象金字塔主要包括兩種方式：

向下取樣
向上取樣

在圖中，將影象G0轉換為G1、G2、G3，影象解析度不斷降低的過程稱為向下取樣；將G3轉換為G2、G1、G0，影象解析度不斷增大的過程稱為向上取樣。

二.影象向上取樣

在影象向上取樣是由小影象不斷放影象的過程。它將影象在每個方向上擴大為原影象的2倍，新增的行和列均用0來填充，並使用與“向下取樣”相同的折積核乘以4，再與放大後的影象進行折積運算，以獲得“新增畫素”的新值。如圖10-2所示，它在原始畫素45、123、89、149之間各新增了一行和一列值為0的畫素。

在OpenCV中，向上取樣使用的函數為pyrUp()，其原型如下所示：

dst = pyrUp(src[, dst[, dstsize[, borderType]]])

– src表示輸入影象，

– dst表示輸出影象，和輸入影象具有一樣的尺寸和型別

– dstsize表示輸出影象的大小，預設值為Size()

– borderType表示畫素外推方法，詳見cv::bordertypes

向上取樣的程式碼如下所示：

# -*- coding: utf-8 -*-
# By：Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt

#讀取原始影象
img = cv2.imread('lena-small.png')

#影象向上取樣
r = cv2.pyrUp(img)

#顯示影象
cv2.imshow('original', img)
cv2.imshow('PyrUp', r)
cv2.waitKey()
cv2.destroyAllWindows()

輸出結果如圖10-3所示，它將原始影象擴大為原影象的四倍。

多次向上取樣的程式碼如下。

# -*- coding: utf-8 -*-
# By：Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt

#讀取原始影象
img = cv2.imread('lena-small.png')

#影象向上取樣
r1 = cv2.pyrUp(img)
r2 = cv2.pyrUp(r1)
r3 = cv2.pyrUp(r2)

#顯示影象
cv2.imshow('original', img)
cv2.imshow('PyrUp1', r1)
cv2.imshow('PyrUp2', r2)
cv2.imshow('PyrUp3', r3)
cv2.waitKey()
cv2.destroyAllWindows()

輸出結果如圖10-4所示，每次向上取樣均為上次影象的四倍，但影象的清晰度會降低。

三.影象向下取樣

在影象向下取樣中，使用最多的是高斯金字塔。它將對影象Gi進行高斯核折積，並刪除原圖中所有的偶數行和列，最終縮小影象。其中，高斯核折積運算就是對整幅影象進行加權平均的過程，每一個畫素點的值，都由其本身和鄰域內的其他畫素值（權重不同）經過加權平均後得到。常見的3×3和5×5高斯核如下：

高斯核折積讓臨近中心的畫素點具有更高的重要度，對周圍畫素計算加權平均值，如圖10-5所示，其中心位置權重最高為0.4。

在OpenCV中，向下取樣使用的函數為pyrDown()，其原型如下所示：

dst = pyrDown(src[, dst[, dstsize[, borderType]]])

– src表示輸入影象，

– dst表示輸出影象，和輸入影象具有一樣的尺寸和型別

– dstsize表示輸出影象的大小，預設值為Size()

– borderType表示畫素外推方法，詳見cv::bordertypes

向下取樣的程式碼如下所示：

# -*- coding: utf-8 -*-
# By：Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt

#讀取原始影象
img = cv2.imread('nv.png')

#影象向下取樣
r = cv2.pyrDown(img)

#顯示影象
cv2.imshow('original', img)
cv2.imshow('PyrDown', r)
cv2.waitKey()
cv2.destroyAllWindows()

輸出結果如圖10-6所示，它將原始影象壓縮成原圖的四分之一。

多次向下取樣的程式碼如下。

# -*- coding: utf-8 -*-
# By：Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt

#讀取原始影象
img = cv2.imread('nv.png')

#影象向下取樣
r1 = cv2.pyrDown(img)
r2 = cv2.pyrDown(r1)
r3 = cv2.pyrDown(r2)

#顯示影象
cv2.imshow('original', img)
cv2.imshow('PyrDown1', r1)
cv2.imshow('PyrDown2', r2)
cv2.imshow('PyrDown3', r3)
cv2.waitKey()
cv2.destroyAllWindows()

輸出結果如圖10-7所示，每次向下取樣均為上次的四分之一，並且影象的清晰度會降低。

四.總結

本文主要講解影象金字塔處理，包括影象向上取樣和向下取樣。需要注意，向上取樣放大後的影象比原始影象要模糊，而每次向下取樣會刪除偶數行和列，它會不停地丟失影象的資訊。此外，向上取樣和向下取樣不是互逆的操作，經過兩種操作後，是無法恢復原始影象的。

以上就是Python影象處理之影象金字塔詳解的詳細內容，更多關於Python影象金字塔的資料請關注it145.com其它相關文章！

Python影象處理之影象金字塔詳解

目錄

一.影象金字塔原理

二.影象向上取樣

三.影象向下取樣

四.總結

熱門文章