基于嵌入式系統(tǒng)實時交互的手勢識別方法
通過靜態(tài)手勢的識別,使系統(tǒng)能夠?qū)Ρ桓檶ο笥幸粋€基本的理解,為實現(xiàn)自動跟蹤初始化與跟蹤的自動恢復(fù)奠定了基礎(chǔ)。首先,手部區(qū)域需要從場景中分割出來。本文采用一種基于模糊集和模糊運(yùn)算的方法進(jìn)行手的區(qū)域和輪廓提取,通過對視頻流中空域和時域上的背景、運(yùn)動、膚色等信息執(zhí)行模糊運(yùn)算,分割出精確的人手。
靜態(tài)手勢的識別是基于輪廓特征的識別,對分割出來的人手作邊緣檢測,得到手勢完整的輪廓邊緣。通過前面的模糊集合運(yùn)算,能得到圖像的手勢分割的二值圖。兩個具有不同灰度值的相鄰區(qū)域之間總存在邊緣。邊緣是灰度值不連續(xù)的結(jié)果,這種不連續(xù)可利用求導(dǎo)方便地檢測出來。
這樣就能得到完整的輪廓邊緣。如圖3所示,左邊為手部區(qū)域,右邊為手勢的輪廓。
接下來是對提取的手勢輪廓作外接多邊形擬合。KenjiOka和YoichiSato的指尖搜索方法是首先在一個較大的搜索窗口內(nèi)掃描確定20個候選指尖位置,然后再對匹配度最大的候選位置周圍的候選進(jìn)行抑制,同時按一定規(guī)則去除位于指尖中間的部分候選。該方法由于需要對搜索區(qū)域進(jìn)行多次逐像素的掃描,造成計算量較大,而且除去手勢中部候選位置的方法的魯棒性較差。文獻(xiàn)[5]給出了通過遍歷手勢輪廓的曲率來進(jìn)行之間位置搜索的方法,通過對手勢按輪廓順序進(jìn)行定長掃描的方法,可以找出指尖并做出輪廓線的外接多邊形。但是這種查找方式需要遍歷輪廓線的每個點,而且對每個點還需要作除法運(yùn)算,這使得算法的計算量太大,而且在搜索指尖時,當(dāng)受到光線變化使得輪廓線出現(xiàn)很多突起的邊緣時,使得識別工作出現(xiàn)困難。本文提出了一種查找外接邊的搜索方法,通過對手勢輪廓按輪廓點順序進(jìn)行定長掃描,將手勢輪廓線的外接多邊形擬合出來,同時將滿足定義1的手勢輪廓外接凸邊形缺陷結(jié)構(gòu)設(shè)為手勢識別的判斷特征。
2.1.1手勢缺陷圖
定義1手勢缺陷圖是指由手勢輪廓線外接多邊形以及多邊形各條邊所對應(yīng)的谷底(depthpoint)所組成的特征描述方程。谷底是指外接多邊形的邊與該邊所對應(yīng)的輪廓線上距離邊最遠(yuǎn)的輪廓點。定義手勢缺陷圖的數(shù)據(jù)結(jié)構(gòu)如下:
TypedefstructCvConvexityDefect{
CvPoint*start;//缺陷開始的輪廓點
CvPoint*end;//缺陷結(jié)束的輪廓點
CvPoint*depth_point;//缺陷中距離凸性最遠(yuǎn)的輪廓點
Floatdepth;//谷底距離凸性的深度
}CvConvexityDefect;
如圖4所示,手勢輪廓缺陷圖能很好地描述各種手勢,通過對手勢輪廓線外接多邊形的邊數(shù)以及邊所對應(yīng)的谷底深度,可以將手勢缺陷圖映射到不同的手勢。其中A、B、C、D、E、F、G為手勢輪廓線的外接多邊形的各條邊,Da、Db、Dc、Dd、De、Df、Dg為手勢缺陷圖中的谷底到對應(yīng)邊的深度。
為了得到手勢輪廓缺陷圖,首先必須對手勢輪廓進(jìn)行多邊形擬合,得出它的外接多邊形。本文提出了一種根據(jù)手勢輪廓上相鄰兩點間的凹凸性來進(jìn)行擬合,通過一次遍歷輪廓上的點,對以下方程進(jìn)行判定,將適當(dāng)?shù)狞c剔除,剩下的點即為外接多邊形的候選定點:
by=nexty-cury(1)
ay×bx-ax×by(2)
ax=pcur.x-pprev.x,ay=pcur.y-pprev.y
bx=pnext.x-pcur.x,by=pnext.y-pcur.y
其中:pcur為當(dāng)前遍歷的輪廓線上的點;pprev、pnext分別表示當(dāng)前點的前一個點和后一個點;ax、ay分別為當(dāng)前點和前一點的x和y坐標(biāo)值差;bx、by分別為當(dāng)前點和后一點指尖的x和y坐標(biāo)值差。
基于輪廓線凹凸形的擬合算法流程如下:
a)將所有的輪廓線上的點按x坐標(biāo)值大小排序,并找出所有的點中y坐標(biāo)的最大最小值maxY和minY.
b)將排序后的輪廓點劃分為四部分:首先按照y坐標(biāo)將輪廓線分為上下兩個部分,將上半部分以maxY所在的x坐標(biāo)(記為Xmaxy)劃分為兩個部分,分別記為topLeft〈左上〉和topRight〈右上〉;將下半部分以minY所在的x坐標(biāo)(記為Xminy)劃分為兩個部分,分別記為bottomLeft〈左下〉和bottom-Right〈右下〉。
c)分別對前一步劃分的四個部分(topLeft,topRight,bottomLeft,bottomRight)進(jìn)行遍歷:對區(qū)域topLeft將滿足式(1)0,式(2)>0的點剔除;對區(qū)域TopRight將滿足(1)0,式(2)0的點剔除;對區(qū)域bottomLeft將滿足式式(1)>0,式(2)>0的點剔除;對區(qū)域bottomRight將滿足式(1)>0,式(2)>0的點剔除。剔除后剩下的點即為手勢輪廓線外接多邊形的頂點。
手勢缺陷圖的谷底以及谷底深度的求解是建立在擬合外接多邊形基礎(chǔ)上,還需要對外接多邊形的每條邊所對應(yīng)的輪廓線再進(jìn)行一次遍歷,并將滿足以下方程的最大值求出即是該邊所對應(yīng)的谷底:
其中:scale為單位化量值;hull_cur和hull_next分別為外接多邊形當(dāng)前遍歷的邊和下一條邊;dx0、dy0分別為外接多邊形當(dāng)前邊的x和y坐標(biāo)的差值;dx、dy分別為當(dāng)前遍歷的輪廓線上的點與hull_cur點之間x和y坐標(biāo)的差值;depth為遍歷點與對應(yīng)邊之間的距離,它的最大值即為該邊對應(yīng)的谷底深度,相應(yīng)的點為谷底。
通過以上搜索可以將手勢輪廓缺陷圖的特征值找出來,接下來便可以將缺陷圖的特征值(多邊形與谷底的關(guān)系)與已建立的庫中的特征值相比較,對手勢進(jìn)行匹配,將手勢輪廓缺陷圖映射到不同的手勢上去。
2.1.2手勢匹配
手勢的匹配主要是基于手勢缺陷圖的匹配,手勢缺陷圖的特征值由外接多邊形以及谷底的位置和深度組成,如圖5所示。
根據(jù)多邊形的邊數(shù)以及各條邊的程度可以確定手指的數(shù)量,而谷底的深度和位置可以確定手指的關(guān)系和位置。由于這是根據(jù)手勢的整體圖像來進(jìn)行分析,所以具有一定的魯棒性,當(dāng)光線變化而導(dǎo)致手勢圖出現(xiàn)差別時,并不會導(dǎo)致手勢缺陷圖的變化。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論