軟硬結(jié)合的智能視覺(jué)讓機(jī)器人行動(dòng)更靈敏

作者：時(shí)間：2016-12-20 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

為了讓機(jī)器人更好地與其周?chē)氖挛镞M(jìn)行互動(dòng)，并靈活地移動(dòng)，機(jī)器人必須能夠看到并辨別其周?chē)沫h(huán)境。經(jīng)濟(jì)高效且功能強(qiáng)大的視覺(jué)處理器(通過(guò)深度辨別圖像傳感器進(jìn)行數(shù)據(jù)傳輸，并采用極具魯棒性的軟件算法)正在使人們盼望已久的自適應(yīng)機(jī)器人成為現(xiàn)實(shí)。

機(jī)器人，這一長(zhǎng)期出現(xiàn)在科幻世界和航運(yùn)產(chǎn)品文檔中的事物，被描述為能夠幫助人類(lèi)從呆板、單調(diào)和難以忍受的工作中釋放出來(lái)，并利用其高速度及高精度的特點(diǎn)提升工作效果。無(wú)論是可完成吸塵、地毯清洗，甚至排水溝的清潔工作的第一代自主消費(fèi)機(jī)器人系統(tǒng)，或是多種類(lèi)型的生產(chǎn)環(huán)境下機(jī)器人的使用正不斷增長(zhǎng)，都可以說(shuō)明上述觀點(diǎn)(圖1)。

newmaker.com

newmaker.com
圖1：為消費(fèi)者量身定制的自主產(chǎn)品(a)和工業(yè)制造系統(tǒng)(b)是眾多可以通過(guò)視覺(jué)處理功能而得到增強(qiáng)的機(jī)器人中的一部分。

然而第一代消費(fèi)類(lèi)機(jī)器人采用了相對(duì)粗糙的方案來(lái)定位并感知其周?chē)h(huán)境。這些基本技術(shù)包括由紅外線(xiàn)發(fā)射器組成的人造壁壘，它可與內(nèi)置在機(jī)器人當(dāng)中的紅外線(xiàn)傳感器進(jìn)行協(xié)作，從而防止機(jī)器人從樓梯上滾下或游蕩到另一個(gè)房間。當(dāng)自主機(jī)器人撞到了不可移動(dòng)的物體時(shí)，震動(dòng)傳感器可通知機(jī)器人，讓機(jī)器人不再繼續(xù)前進(jìn)。而更先進(jìn)的繪圖功能設(shè)計(jì)甚至讓機(jī)器人不必再次回到這個(gè)特殊的位置。與人類(lèi)的工作方式相比，機(jī)器人的工作不必考慮體力因素、更加快捷，并且更加準(zhǔn)確，但機(jī)器人成功的前提是讓來(lái)料到達(dá)固定的方向和位置，因此提升了制造流程的復(fù)雜性。來(lái)料部件的位置及方向出現(xiàn)任何偏離都將導(dǎo)致裝配的失敗。

人類(lèi)用眼睛(以及感覺(jué))和大腦對(duì)其周?chē)氖澜邕M(jìn)行辨識(shí)和定位。從理論上講，采用攝像頭組件、視覺(jué)處理器和各種軟件算法的機(jī)器人系統(tǒng)也應(yīng)該可以做到。但縱觀歷史，這樣的圖像分析技術(shù)通常只有在復(fù)雜并且昂貴的系統(tǒng)中才能找到。但數(shù)字集成電路在成本、性能和功耗方面的進(jìn)步，為視覺(jué)功能使用在多樣化和高容量的應(yīng)用上鋪平了道路，其中包括機(jī)器人實(shí)現(xiàn)的功能越來(lái)越多。雖然機(jī)器人在功能實(shí)現(xiàn)方面仍然面臨著諸多挑戰(zhàn)，但與以往相比，今天已經(jīng)可以更加輕松、快速、經(jīng)濟(jì)高效地解決這些問(wèn)題。

軟件技術(shù)

開(kāi)發(fā)出可根據(jù)視覺(jué)適應(yīng)其環(huán)境的機(jī)器人系統(tǒng)需要采用電腦視覺(jué)算法，該算法可將一個(gè)或多個(gè)圖像傳感器中的數(shù)據(jù)轉(zhuǎn)換成該環(huán)境的可執(zhí)行信息。機(jī)器人的兩個(gè)常見(jiàn)任務(wù)分別是識(shí)別外部目標(biāo)和方向，并決定機(jī)器人的位置和方向。許多機(jī)器人可與一個(gè)或多個(gè)特定目標(biāo)進(jìn)行互動(dòng)。對(duì)于情境自適應(yīng)機(jī)器人而言，必須能夠檢測(cè)到那些在未知地點(diǎn)和方向的目標(biāo)，并且還要了解到這些目標(biāo)很可能會(huì)移動(dòng)。

攝像頭每秒產(chǎn)生上百萬(wàn)像素的數(shù)據(jù)，從而形成了一個(gè)肩負(fù)著沉重處理負(fù)擔(dān)的有效載荷。解決該問(wèn)題的一種常見(jiàn)方法是檢測(cè)這些多像素的特征，如視頻數(shù)據(jù)每一幀的角、點(diǎn)、邊或線(xiàn)(圖2)。

newmaker.com
圖2：完整處理二維或三維機(jī)器人視覺(jué)傳感器的原始輸出涉及四個(gè)主要階段，
每個(gè)階段都有自己的獨(dú)特性并受其處理要求的制約。

這種像素到特征的轉(zhuǎn)換可使在視覺(jué)處理管道的這個(gè)特殊階段的數(shù)據(jù)處理需求降低一千倍或更多；上百萬(wàn)的像素降低成了上百個(gè)特征，機(jī)器人就可以高效地對(duì)目標(biāo)進(jìn)行識(shí)別，并確定其空間特征(圖3)。

newmaker.com
圖3：視覺(jué)處理器可以集成多種類(lèi)型的內(nèi)核，以滿(mǎn)足每個(gè)處理階段的獨(dú)特需求。

目標(biāo)檢測(cè)首先包括采用機(jī)器學(xué)習(xí)或其他算法與多個(gè)特征相結(jié)合。然后，通過(guò)利用這些特征的數(shù)據(jù)庫(kù)(該數(shù)據(jù)庫(kù)根據(jù)特定目標(biāo)在不同角度和方向的大量已采集圖像生成)，用戶(hù)可以采用分類(lèi)器算法運(yùn)行并訓(xùn)練機(jī)器人正確地識(shí)別每個(gè)新目標(biāo)。最有名的目標(biāo)檢測(cè)算法之一是Viola-Jones framework，它采用類(lèi)Haar的特征和大量Adaboost分類(lèi)器。該算法非常擅長(zhǎng)于識(shí)別臉部，也可經(jīng)過(guò)訓(xùn)練來(lái)識(shí)別其他常見(jiàn)目標(biāo)。而基于機(jī)器學(xué)習(xí)算法的一大缺點(diǎn)是：他們需要大量的訓(xùn)練數(shù)據(jù)集，才能準(zhǔn)確地檢測(cè)目標(biāo)。

通過(guò)特征來(lái)確定目標(biāo)方位需要一種像RANSAC (隨機(jī)抽樣和均測(cè))那樣的基于統(tǒng)計(jì)的算法。該算法采用一組特征來(lái)模擬一個(gè)潛在的目標(biāo)方向，然后確定多少其他特征適合該模型。具有最大數(shù)量匹配特征的模型對(duì)應(yīng)于被正確識(shí)別的目標(biāo)方向。為了檢測(cè)移動(dòng)目標(biāo)，用戶(hù)可以將特征識(shí)別與跟蹤算法相結(jié)合。一旦一組特征正確地識(shí)別了一個(gè)目標(biāo)， KLT(Kanade-Lucas-Tomasi)或卡爾曼濾波等算法將在視頻的幀之間跟蹤這些特征的運(yùn)動(dòng)軌跡。無(wú)論方向和阻塞如何改變，這些技術(shù)都是非?？煽康?，因?yàn)樗麄儍H需要跟蹤一組最初特征便可成功。

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

新聞中心

軟硬結(jié)合的智能視覺(jué)讓機(jī)器人行動(dòng)更靈敏

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)