本站小編為你精心準備了高效人臉檢測算法參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
【摘要】對于一個完整的、自動的人臉信息分析系統(tǒng)來說,高效的人臉檢測算法是必不可少的。本文主要是對彩色圖像皮膚區(qū)域分割算法及人臉檢測系統(tǒng)的設(shè)計研究。主要運用了YCbCr色彩空間的膚色模型,利用其混合高斯分布的特性對膚色進行比對分割。最終得出基于高斯膚色模型的圖像皮膚區(qū)域分割算法。
【關(guān)鍵詞】高斯膚色模型皮膚分割人臉檢測
1引言
人臉檢測(facedetection)主要是指在輸入圖像中確定人臉(如果存在)的位置、大小等信息。基本思想是利用統(tǒng)計的方法對人臉建模,比較所有可能的待檢測區(qū)域與人臉模型的匹配度。人臉檢測系統(tǒng)的輸入是可能包含人臉的圖像,也可能是不包含人臉的圖像,輸出是關(guān)于圖像中是否存在人臉以及人臉的數(shù)目、位置、尺度、位姿等信息的參數(shù)化描述。人臉檢測問題如果追蹤求源的話,它來源于人臉識別(facerecognition),而人臉識別的研究可以追溯到20世紀60—70年代,經(jīng)過幾十年的曲折發(fā)展己日趨成熟。人臉檢測是自動人臉識別系統(tǒng)中的一個重要環(huán)節(jié),但是早期的人臉識別研究主要針對具有較強約束條件的人臉圖像(如無背景的圖像),往往假設(shè)人臉位置己知或很容易獲得,因此人臉檢測問題并未受到重視。近幾年隨著信息化社會的發(fā)展,人臉識別成為最有潛力的生物身份驗證手段,這使得人臉檢測開始作為一個獨立的課題受到研究并得到重視。在檢測靜止目標的場合中,膚色的應用提供有價值的候選區(qū)域。比如,在人臉的檢測中,圖像中的膚色區(qū)域可有助于加速人臉的檢測過程。本文將對基于高斯膚色模型的圖像皮膚區(qū)域分割算法進行研究。
2色度空間模型選取
在具體的色度空間中通過實踐找到膚色區(qū)間,建立起可操作性的膚色模型,這樣就讓提取膚色信息成為了人臉檢測的核心方法。不同膚色模型的建立基于不同的色度空間,且為色度空間的一個子空間。膚色信息主要由膚色模型描述。使用何種形式的膚色模型與色度空間(chrominancespace)選擇密切相關(guān)。可以從兩個方面考察某種色度空間:(1)在該色度空間中能否用給定的模型描述“膚色”區(qū)域的分布;(2)色度空間中“膚色”與“非膚色”區(qū)域的重疊有多少。人臉檢測常用的色度空間主要有:RGB(亮度歸一化的三基色)、HSI(色調(diào)、飽和度、亮度)、YIQ(NTSC制的光亮度和色度模型)、YUV(PAL制的光亮度和色度模型)、YCbCr(CCIR601)編碼方式的色度模型、CIEL(國際照明委員會提出的基于色度學的彩色模型)等。
不論在什么樣的色度空間中,膚色模型大體上分為四種:區(qū)域模型(IF-THEN)模型、簡單高斯模型、混合高斯模型和直方圖模型。
2.1區(qū)域模型
該模型又稱IF-THEN模型、簡單門限模型,它主要是利用了膚色在色度空間的聚類性(即取值范圍),將一塊滿足一定條件的區(qū)域標定為膚色區(qū)域。采用這個模型來判別膚色需要分兩步:首先通過統(tǒng)計的方法確定模型(即歸屬于膚色的具體范圍);其次利用這個模型來判別新的像素或區(qū)域是否為膚色。因此,對于一幅新的圖像,如果某個像素或區(qū)域滿足給定的條件就為膚色,否則就是非膚色。從上面的判斷過程來看,它是一種較簡單的膚色模型。該模型的困難之處在于如何確定閾值。閾值選擇不當可能會使膚色檢測率下降,誤檢率上升。此方法計算簡單,使用方便,速度快,但是效果不是很好,只適用于特定條件下的膚色檢測。
2.2簡單高斯模型
這種方法是假設(shè)膚色分布服從單峰高斯分布。它主要通過統(tǒng)計分析,預測高斯分布的參數(shù),其中參數(shù)確定常用的方法有EM算法,Maximum-Likelihood或通過統(tǒng)計直接求得色度空間中每個分量(一般利用的是該色度空間中的色度分量)的均值與方差。采用這種方法也分為兩步:首先選擇方法確定模型的參數(shù)(即均值和方差);其次利用該模型來判別新的像素或區(qū)域是否為膚色。簡單高斯模型相對區(qū)域模型能更好的表示膚色分布,因此相對而言,它的膚色檢測率也高出許多,并且模型的參數(shù)也易于計算,但是速度比區(qū)域模型慢。
2.3混合高斯模型
由于具有不同種族的膚色直方圖并不完全滿足單峰高斯分布,通過研究可以采用多峰的高斯分布來精確表示。因此,提出了混合高斯模型,如公式2.1所示:
(2.1)
其中,為膚色像素在色彩空間中的混合概率密度,為分量的概率密度,為分量的先驗概率,i=1,2,...,m為混合密度的分量個數(shù)。該模型表明膚色的每個像素密度都屬于概率密度的混合體。在這個模型中主要難點是對混合高斯模型的參數(shù)估計,其參數(shù)的估計常采用基于極大似然的算法。利用該算法需要進行迭代,而迭代的收斂速度受參數(shù)的初值影響,同時與分量密度個數(shù)關(guān)系很大,分量越多,運算越復雜。這種方法相對于前面兩種模型來說,膚色的檢測率要高得多,誤檢率也要小得多,但是模型的確定(即模型的參數(shù)估計)較難,速度相對來說也比較慢,不適合快速的膚色檢測。
2.4直方圖模型
通過對膚色直方圖的統(tǒng)計,然后利用閾值來進行判別。對于三維直方圖,盡管效果很好,但是需要很多的訓練樣本,而且訓練時間很長。由于樣本原因和時效性差,這里不詳細討論這種方法。
3YCbCr色彩空間模型
YCbCr色彩系統(tǒng)是一種常見的重要的色彩系統(tǒng),網(wǎng)絡(luò)上比比皆是的JPEG圖片采用的色彩系統(tǒng)正是該系統(tǒng)。本文則著重對此膚色模型進行研究。它由YUV色彩系統(tǒng)衍生而來,Cb=k1,Cr=k2,其中k1、k2分別為壓縮系數(shù),壓縮的目的是防止色差信號對亮度信號的干擾及超過亮度信號的電平,也就是說Cb和Cr則是將U和V做少量調(diào)整而得到的。Y仍為亮度信息(電視機中稱其為亮度信號)。YCbCr色彩系統(tǒng)與RGB色彩系統(tǒng)的轉(zhuǎn)換關(guān)系如下:
Y=0.299*R+0.587*G+0.114*B
Cr=(R-Y)*0.713+128
Cb=(B-Y)*0.564+128
即:
3.1CbCr空間膚色區(qū)域模型
由于統(tǒng)計表明不同人種的膚色區(qū)別主要受亮度信息影響,而受色度信息的影響較小,所以直接考慮YCbCr空間的CbCr分量,映射為CbCr空間,在CbCr空間下,受亮度變化的影響少,而且是二維獨立分布。通過實踐,選取大量膚色樣本進行統(tǒng)計,發(fā)現(xiàn)膚色在CbCr空間的分布呈現(xiàn)良好的聚類特性,統(tǒng)計分布滿足:
77≤Cb≤127(3.1)
并且滿足
133≤Cr≤173(3.2)3.2高斯膚色模型
不同人種的皮膚雖然相差很大,但在色度上的差異遠遠小于亮度上的差異,其實不同人的膚色在色度上比較接近,但在亮度上的差異很大,在二維色度平面上,膚色的區(qū)域比較集中,可以用高斯分布描述。
根據(jù)膚色在色度空間的高斯分布,對根據(jù)膚色在色度空間的高斯分布,對于彩色圖像中每個像素,將其從RGB色彩空間轉(zhuǎn)換到Y(jié)CbCr空間后,就可以計算該點屬于皮膚區(qū)域的概率,即根據(jù)該點離高斯分布中心的遠近得到和膚色的相似度,將彩色圖像轉(zhuǎn)化為灰度圖,其中每個像素的灰度對應該點與膚色的相似度,相似度的計算公式如下:
(3.3)
其中,m為均值,m=E(x),C為協(xié)方差矩陣,。
膚色分布的2D高斯模型G(m,V2)也可表示為:
其中,為Cb、Cr相應的平均值,V為協(xié)方差矩陣。
通過高斯膚色模型將彩色圖像轉(zhuǎn)換為相似度灰色圖像后,選取合適的閾值,就可以分離膚色與非膚色區(qū)域。這種膚色模型的特點是基于統(tǒng)計的膚色模型,它需要對每一個像素點進行相似度計算,因此速度也不是太快。當然在實際用于膚色檢測中,可以直接利用公式(3.3)中的項進行判決,以提高檢測速度。
結(jié)合以上分析由于人膚色的不同主要體現(xiàn)為亮度分量的不同,所以選擇亮度分量和色度分量分離的YCbCr色彩空間進行膚色建模。
4基于YCbCr空間的高斯膚色模型的檢驗
4.1膚色模型的建立
為了利用膚色在色度空間的聚類性,選取YCbCr色彩空間進行膚色提取。首先選取大量彩色圖片進行手工處理只保留人體皮膚區(qū)域。接下來將彩色圖片顏色空間轉(zhuǎn)換到Y(jié)CbCr空間,然后對該區(qū)域的CbCr值進行統(tǒng)計處理。處理的方法就是采用前文提到的高斯模型。
,C為協(xié)方差矩陣,。
通過這個膚色高斯分布可得到待檢測彩色圖像中任意一個像素點屬于皮膚的概率。對于某像素點s,從RGB空間轉(zhuǎn)換到Y(jié)CbCr色彩空間得到色度值(Cb,Cr)則該像素的膚色概率密度可由下式計算得到:
式中:。
通過計算,得到m和C的值如下:
(4.1)
(4.2)
4.2膚色分割步驟
圖片空間低通濾波是為了減少圖像高頻噪聲的影響,先采用低通濾波器對圖象進行處理。采用的低通濾波器的沖擊響應矩陣為:
(4.3)
對于一幅被檢測的彩色圖像,首先將它由RGB空間轉(zhuǎn)換到Y(jié)CbCr色彩空間,便于后面的統(tǒng)計。
(1)得到似然圖:根據(jù)(Cb,Cr)值通過式(3.3)找到該值所對應的膚色似然度,并且得到整幅圖像的最大膚色似然度。每一點像素的膚色似然度除以最大膚色似然度所得到的值,作為該像素點的灰度值,從而得到膚色似然度圖像,其中每一個像素點的灰度值表征了這個像素點屬于皮膚的概率。
(2)閾值分割:閾值分割的目的是將皮膚與圖片背景分開。通常有固定閾值法、自適應閾值法等。建議選用的是固定閾值法,主要是從運算速度上考慮的。當然,相比之下,自適應的閾值法一般不會漏檢,檢測效果肯定比固定值法好。
(3)圖像二值化處理:二值化處理的目的是將皮膚區(qū)域和其他區(qū)域更好地區(qū)分開來。皮膚區(qū)域用“1”(白色)表示,其他區(qū)域用“0”(黑色)表示。
(4)形態(tài)學處理:該步驟的目的是改善分割效果。形態(tài)學(Morphology)原(中國論文聯(lián)盟整理)本是對于動植物調(diào)查時采取的某種形式的研究。數(shù)學形態(tài)學(MathematicalMorphology)是分析幾何形狀和結(jié)構(gòu)的數(shù)學方法,它建立在集合代數(shù)的基礎(chǔ)上,是用集合論方法定量描述集合結(jié)構(gòu)的學科。1985年之后,數(shù)學形態(tài)學逐漸成為分析圖像幾何特征的工具。數(shù)學形態(tài)學包括一組基本的形態(tài)學運算子:腐蝕(Erosion),膨脹(Dilation)、開運算(Opening)、閉運算(Closing)等。運用這些算子及其組合來進行圖像形狀和結(jié)構(gòu)的分析及處理。形態(tài)學的理論基礎(chǔ)是集合論。在圖像處理中形態(tài)學的集合代表著黑白和灰度圖像的形狀,如黑白圖像中的所以黑像素點組成了此圖像的完全描述。通常我們選擇圖像中感興趣的目標圖像區(qū)域像素集合來進行形態(tài)學變換。
通常,當有噪聲的圖像用閉值二值化時,所得到的邊界往往是不平滑的,物體區(qū)域具有一些錯判,背景區(qū)域上則散布著一些小的噪聲。使用形態(tài)學上的連續(xù)的開和閉運算可以顯著的改善這種情況。開閉運算后的圖像可以去除圖像上的一些細小的毛刺,達到去噪的目的。填孔處理可以進一步去除毛刺,但是也將一些非皮膚區(qū)域保留為皮膚區(qū)域處理。所以綜合考慮后,只采用開閉運算改善效果。
5結(jié)論
實驗結(jié)果表明:在YCbCr色度空間中的高斯膚色模型的聚類特性比較好。YCbCr色度空間中的高斯膚色模型具有如下優(yōu)點:
(1)具有與人類視覺感知過程相類似的構(gòu)成原理。
(2)YCbCr色彩空間格式被廣泛地應用在電視顯示等領(lǐng)域中,也是許多視頻壓縮編碼,如MPEG,JPEG等標準中普遍采用的顏色表示格式。
(3)YCbCr色彩空間格式具有與HSI等其他一些色彩空間格式相類似的將色彩中的亮度分量分離出來的優(yōu)點,有助于提高皮膚區(qū)域分割的效果。
(4)YCbCr色彩空間格式的計算過程和空間坐標表示形式相比于HSI等其他一些色彩空間格式比較簡單,從而提高皮膚區(qū)域分割的速度。
參考文獻
[1]JieYang,WEierLu,AlexWaibel.Skin-ColorModelingandAdaptation[J].CMU-CS-97-146,May1997.
[2]TerrillonJC,ShiraziMN,FukamachiH,parativeperformanceofdifferentskinchrominancemodelsandchrominancespacesfortheautomaticdetectionofhumanfacesincolorimages.In:Proc.Conf.onAutomaticFaceandGestureRecognition,Grenoble,France,2000.
[3]李偉.基于膚色分割的人臉檢測技術(shù),電子科技大學碩士論文,2006.
[4]何東健.數(shù)字圖像處理[M],西安電子科技大學出版社,2003.
[5]岡薩雷斯.數(shù)字圖像處理(matlab版)[M],電子工業(yè)出版社,2006.
[6]章毓晉.圖像處理[M],清華大學出版社,2006.
[7]陳永春.MATLABM語言高級編程[M],清華大學出版社,2004.