在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            手語識別和翻譯

            作者:陳俊杰,舒劍飛,劉瑞峰 時間:2012-09-21 來源:電子產(chǎn)品世界 收藏

              其后我們關(guān)掉骨架提取的功能,使用率大幅降低到只有25%。經(jīng)過進(jìn)一步性能分析的工作,我們證實了瓶頸的來源就是骨骼提取。不幸地,骨骼提取的算法并不是開源的,而是被PrimeSence所保護(hù)。所以我們并不能通過修改原代碼或是把算法放到FPGA里以達(dá)致降低處理器使用率的效果。  

            本文引用地址:http://www.biyoush.com/article/137079.htm
             

              解決方法
              為了解決這個問題,我們嘗試選擇性地使用原始數(shù)據(jù)。原來數(shù)據(jù)傳遞方式是用戶產(chǎn)生器(User Generator)直接從深度圖像產(chǎn)生器(Depth Generator)得到原始數(shù)據(jù)。新的方法就是設(shè)立一個仿真深度圖像產(chǎn)生器(Mock Depth Generator)。它會仿真成原來的產(chǎn)生器,而用戶產(chǎn)生器則從它得到數(shù)據(jù)。

              當(dāng)得到新的數(shù)據(jù),它會將數(shù)據(jù)傳給深度產(chǎn)生器,然后后者會發(fā)給仿真深度圖像產(chǎn)生器。而每隔一個幀,仿真深度圖像產(chǎn)生器會將得到的數(shù)據(jù)傳給用戶產(chǎn)生器。換言之,兩幀從上得到的數(shù)據(jù),只有一幀會真正被用作提取骨架,而另一幀將會被忽略。

              這個做法雖然令幀率降低到15,但處理器使用率卻降至只有50%。而且經(jīng)過我們的驗證,幾乎沒有出現(xiàn)丟幀的情況,即使出現(xiàn)亦沒有影響到提取骨架節(jié)點的質(zhì)素。經(jīng)過這個特殊處理,我們確定在這平臺使用是可行的,甚至還可提取額外的處理器資源用以其他運(yùn)算工作。

              設(shè)計和實現(xiàn)

              概述
              系統(tǒng)通過Kinect獲取深度影像,并使用應(yīng)用程序從深度影像中提取用戶的骨架。在獲取的骨架中,我們選取左右手、肘、肩六個關(guān)節(jié)點??偟膩砜?,用戶完成了一個手語,通過Kinect和,系統(tǒng)將記錄一系列的幀,每一幀由左右手、肘、肩六個關(guān)節(jié)點的三維空間向量組成。用戶每一次完成同一個手語都會有差別,所以我們在特征提取之前需要對記錄的幀進(jìn)行常態(tài)化處理。我們使用支持向量機(jī)(SVM)對提取的特征向量進(jìn)行分類。每一類表示一個手語。圖2描述了整個手語識別的流程?! ?/p>

             

              手語獲取
              雙手交叉握于腹部前方。這一動作我們稱之為“預(yù)備動作”,表示手語的開始和結(jié)束。為了避免潛在的識別錯誤,我們要求每相鄰的兩幀(0.13s),用戶至少移動5厘米。如果用戶做預(yù)備動作超過100幀(6.67s),系統(tǒng)將會停止獲取手語數(shù)據(jù)。

              數(shù)據(jù)處理
              正如我們之前提到的常態(tài)化處理,我們將獲取的一系列幀通過均分和插入的方法統(tǒng)一成121幀,即2178個三維空間向量。我們對常態(tài)化處理后的數(shù)據(jù)進(jìn)行特征提取,產(chǎn)生1694個特征向量。最后我們將所有的特征向量放在一個矩陣?yán)?,用于SVM分類。

              手語訓(xùn)練和分類
              LIBSVM是一個用于支持向量機(jī)的集成軟件,支持多類分類。用戶使用LIBSVM提供的庫,可以更容易地使用SVM。我們使用“svm-train”讀取輸入文件(Input File),生成模型文件(Model file)。我們的輸入文件包含1694個特征向量。我們對每個手語單詞訓(xùn)練20到30次。到目前為止,我們總共訓(xùn)練了48個手語。我們可以通過訓(xùn)練更多的手語擴(kuò)展我們的數(shù)據(jù)庫。

              使用“svm-predict”可以預(yù)測用戶所做的手語屬于哪一類。

              參考文獻(xiàn):
              [1]Chinese Sign Language [R/OL].http://baike.baidu.com/view/42806.htm
              [2] [R/OL].http://75.98.78.94/About.aspx
              [3]PrimeSense 3D Sensor Data Sheet[R/OL].http://www.primesense.com/press-room/resources/file/4-primesense-3d-sensor-data-sheet?lang=en
              [4]LIBSVM [R/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm/
              [5]Hardware Requirements of Kinect[R/OL].http://www.microsoft.com/en-us/kinectforwindows/purchase/sensor_setup.aspx
              [6]FPGA-based MP3 Player[R/OL].http://cegt201.bradley.edu/projects/proj2010/fpgamp3/FPGAMP3_Project_Report.pdf
              [7]Altera wiki - MP3 player[R/OL].http://www.alterawiki.com/wiki/MP3_Player


            上一頁 1 2 下一頁

            關(guān)鍵詞: Intel Kinect OpenNI 201209

            評論


            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉