智能圖像處理 讓機(jī)器視覺及其應(yīng)用更智能高效
機(jī)器視覺(Machine Vision)是人工智能領(lǐng)域中發(fā)展迅速的一個重要分支,目前正處于不斷突破、走向成熟的階段。一般認(rèn)為機(jī)器視覺“是通過光學(xué)裝置和非接觸傳感器自動地接受和處理一個真實(shí)場景的圖像,通過分析圖像獲得所需信息或用于控制機(jī)器運(yùn)動的裝置”,可以看出智能圖像處理技術(shù)在機(jī)器視覺中占有舉足輕重的位置。
本文引用地址:http://www.biyoush.com/article/201806/381668.htm智能圖像處理是指一類基于計算機(jī)的自適應(yīng)于各種應(yīng)用場合的圖像處理和分析技術(shù),本身是一個獨(dú)立的理論和技術(shù)領(lǐng)域,但同時又是機(jī)器視覺中的一項(xiàng)十分重要的技術(shù)支撐。
具有智能圖像處理功能的機(jī)器視覺,相當(dāng)于人們在賦予機(jī)器智能的同時為機(jī)器按上了眼睛,使機(jī)器能夠“看得見”、“看得準(zhǔn)”,可替代甚至勝過人眼做測量和判斷,使得機(jī)器視覺系統(tǒng)可以實(shí)現(xiàn)高分辨率和高速度的控制。而且,機(jī)器視覺系統(tǒng)與被檢測對象無接觸,安全可靠。
1.機(jī)器視覺技術(shù)
機(jī)器視覺的起源可追溯到20世紀(jì)60年代美國學(xué)者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學(xué)院(MIT)人工智能實(shí)驗(yàn)室“機(jī)器視覺”課程的開設(shè)。到80年代,全球性機(jī)器視覺研究熱潮開始興起,出現(xiàn)了一些基于機(jī)器視覺的應(yīng)用系統(tǒng)。90年代以后,隨著計算機(jī)和半導(dǎo)體技術(shù)的飛速發(fā)展,機(jī)器視覺的理論和應(yīng)用得到進(jìn)一步發(fā)展。
進(jìn)入21世紀(jì)后,機(jī)器視覺技術(shù)的發(fā)展速度更快,已經(jīng)大規(guī)模地應(yīng)用于多個領(lǐng)域,如智能制造、智能交通、醫(yī)療衛(wèi)生、安防監(jiān)控等領(lǐng)域。目前,隨著人工智能浪潮的興起,機(jī)器視覺技術(shù)正處于不斷突破、走向成熟的新階段。
在中國,機(jī)器視覺的研究和應(yīng)用開始于20世紀(jì)90年代。從跟蹤國外品牌產(chǎn)品起步,經(jīng)過二十多年的努力,國內(nèi)的機(jī)器視覺從無到有,從弱到強(qiáng),不僅理論研究進(jìn)展迅速,而且已經(jīng)出現(xiàn)一些頗具競爭力的公司和產(chǎn)品。估計隨著國內(nèi)對機(jī)器視覺研究、開發(fā)和推廣的不斷深入,趕上和超越世界水平已不是遙不可及的事情了。
常見機(jī)器視覺系統(tǒng)主要可分為兩類,一類是基于計算機(jī)的,如工控機(jī)或PC,另一類是更加緊湊的嵌入式設(shè)備。典型的基于工控機(jī)的機(jī)器視覺系統(tǒng)主要包括:光學(xué)系統(tǒng),攝像機(jī)和工控機(jī)(包含圖像采集、圖像處理和分析、控制/通信)等單元。機(jī)器視覺系統(tǒng)對核心的圖像處理要求算法準(zhǔn)確、快捷和穩(wěn)定,同時還要求系統(tǒng)的實(shí)現(xiàn)成本低,升級換代方便。
2.智能圖像處理技術(shù)
機(jī)器視覺的圖像處理系統(tǒng)對現(xiàn)場的數(shù)字圖像信號按照具體的應(yīng)用要求進(jìn)行運(yùn)算和分析,根據(jù)獲得的處理結(jié)果來控制現(xiàn)場設(shè)備的動作,其常見功能如下:
(1)圖像采集
圖像采集就是從工作現(xiàn)場獲取場景圖像的過程,是機(jī)器視覺的第一步,采集工具大多為CCD或CMOS照相機(jī)或攝像機(jī)。照相機(jī)采集的是單幅的圖像,攝像機(jī)可以采集連續(xù)的現(xiàn)場圖像。就一幅圖像而言,它實(shí)際上是三維場景在二維圖像平面上的投影,圖像中某一點(diǎn)的彩色(亮度和色度)是場景中對應(yīng)點(diǎn)彩色的反映。這就是我們可以用采集圖像來替代真實(shí)場景的根本依據(jù)所在。
如果相機(jī)是模擬信號輸出,需要將模擬圖像信號數(shù)字化后送給計算機(jī)(包括嵌入式系統(tǒng))處理?,F(xiàn)在大部分相機(jī)都可直接輸出數(shù)字圖像信號,可以免除模數(shù)轉(zhuǎn)換這一步驟。不僅如此,現(xiàn)在相機(jī)的數(shù)字輸出接口也是標(biāo)準(zhǔn)化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直接送入計算機(jī)進(jìn)行處理,以免除在圖像輸出和計算機(jī)之間加接一塊圖像采集卡的麻煩。后續(xù)的圖像處理工作往往是由計算機(jī)或嵌入式系統(tǒng)以軟件的方式進(jìn)行。
(2)圖像預(yù)處理
對于采集到的數(shù)字化的現(xiàn)場圖像,由于受到設(shè)備和環(huán)境因素的影響,往往會受到不同程度的干擾,如噪聲、幾何形變、彩色失調(diào)等,都會妨礙接下來的處理環(huán)節(jié)。為此,必須對采集圖像進(jìn)行預(yù)處理。常見的預(yù)處理包括噪聲消除、幾何校正、直方圖均衡等處理。
通常使用時域或頻域?yàn)V波的方法來去除圖像中的噪聲;采用幾何變換的辦法來校正圖像的幾何失真;采用直方圖均衡、同態(tài)濾波等方法來減輕圖像的彩色偏離??傊?,通過這一系列的圖像預(yù)處理技術(shù),對采集圖像進(jìn)行“加工”,為體機(jī)器視覺應(yīng)用提供“更好”、“更有用”的圖像。
(3)圖像分割
圖像分割就是按照應(yīng)用要求,把圖像分成各具特征的區(qū)域,從中提取出感興趣目標(biāo)。在圖像中常見的特征有灰度、彩色、紋理、邊緣、角點(diǎn)等。例如,對汽車裝配流水線圖像進(jìn)行分割,分成背景區(qū)域和工件區(qū)域,提供給后續(xù)處理單元對工件安裝部分的處理。
圖像分割多年來一直是圖像處理中的難題,至今已有種類繁多的分割算法,但是效果往往并不理想。近來,人們利用基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法進(jìn)行圖像分割,其性能勝過傳統(tǒng)算法。
(4)目標(biāo)識別和分類
在制造或安防等行業(yè),機(jī)器視覺都離不開對輸入圖像的目標(biāo)進(jìn)行識別和分類處理,以便在此基礎(chǔ)上完成后續(xù)的判斷和操作。識別和分類技術(shù)有很多相同的地方,常常在目標(biāo)識別完成后,目標(biāo)的類別也就明確了。近來的圖像識別技術(shù)正在跨越傳統(tǒng)方法,形成以神經(jīng)網(wǎng)絡(luò)為主流的智能化圖像識別方法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、回歸神經(jīng)網(wǎng)絡(luò)(RNN)等一類性能優(yōu)越的方法。
(5)目標(biāo)定位和測量
在智能制造中,最常見的工作就是對目標(biāo)工件進(jìn)行安裝,但是在安裝前往往需要先對目標(biāo)進(jìn)行定位,安裝后還需對目標(biāo)進(jìn)行測量。安裝和測量都需要保持較高的精度和速度,如毫米級精度(甚至更小),毫秒級速度。這種高精度、高速度的定位和測量,倚靠通常的機(jī)械或人工的方法是難以辦到的。在機(jī)器視覺中,采用圖像處理的辦法,對安裝現(xiàn)場圖像進(jìn)行處理,按照目標(biāo)和圖像之間的復(fù)雜映射關(guān)系進(jìn)行處理,從而快速精準(zhǔn)地完成定位和測量任務(wù)。
(6)目標(biāo)檢測和跟蹤
圖像處理中的運(yùn)動目標(biāo)檢測和跟蹤,就是實(shí)時檢測攝像機(jī)捕獲的場景圖像中是否有運(yùn)動目標(biāo),并預(yù)測它下一步的運(yùn)動方向和趨勢,即跟蹤。并及時將這些運(yùn)動數(shù)據(jù)提交給后續(xù)的分析和控制處理,形成相應(yīng)的控制動作。圖像采集一般使用單個攝像機(jī),如果需要也可以使用兩個攝像機(jī),模仿人的雙目視覺而獲得場景的立體信息,這樣更加有利于目標(biāo)檢測和跟蹤處理。
評論