嵌入式視覺設計要創(chuàng)新,選擇FPGA成關鍵
什么樣的積極創(chuàng)新可以幫助您設計出這樣一個系統(tǒng)——它能夠提醒用戶有兒童在游泳池中溺水,或是有入侵者試圖闖入住宅或者辦公場所?這種技術還能夠提醒駕駛員道路上即將發(fā)生的危險,甚至可以制止他們并線、加速及其它可能會給自身或他人帶來危險的操作。它能夠給軍用無人機或其他機器人配上電子“眼”,使這些設備部分實現(xiàn)甚至完全實現(xiàn)自動化操作。它能夠協(xié)助內科醫(yī)生診斷患者的病情。它能夠準確地進行面部識別,隨后啟動一系列操作(例如自動登錄用戶賬號,或者獲取相關新聞及其它信息),解讀姿態(tài), 甚至覺察人的情緒狀態(tài)。與GPS、指南針、加速計、陀螺儀和其他功能配合,它還能夠提供數據強化(data augmented) 的場景再現(xiàn)。
本文引用地址:http://www.biyoush.com/article/221572.htm上面談到的應用實例都采用了一項共同的技術,即嵌入式視覺。該技術正準備書寫新一代電子系統(tǒng)的成功篇章。嵌入式視覺最初應用于組裝生產線檢測、光學字符識別、機器人、監(jiān)視和軍用系統(tǒng)等傳統(tǒng)的計算機視覺應用。不過近年來,隨著關鍵技術構建塊成本的不斷下降以及功能的不斷豐富,嵌入式視覺技術不斷向主要的大批量市場加速滲透。
例如,在日益豐富和不斷提高的應用需求的推動下,圖像傳感器的分辨率、低亮度性能、幀速率、尺寸、功耗和成本等關鍵特性都有著明顯的改善。同樣,嵌入式視覺應用也要求處理器具備高性能、低成本、低功耗以及靈活的可編程功能。這些理想的特性在不計其數的產品設計中正日漸變?yōu)楝F(xiàn)實。最新一代光學系統(tǒng)、照明模塊、易失性和非易失性存儲器以及I/O 標準也正在實現(xiàn)類似的特性優(yōu)化。因此,算法到了迎接挑戰(zhàn)的關口,需要充分利用這些硬件性能的改進來提供更穩(wěn)健可靠的分析結果。
嵌入式視覺指的是能夠通過視覺方式理解其所處環(huán)境的機器。“嵌入式”的意思指內置圖像傳感器的非通用型計算機系統(tǒng)。比如,嵌入式可以是手機、平板電腦、監(jiān)視系統(tǒng)、地面或者具備飛行能力的機器人、安裝有一套 360°攝像頭的車輛或者是醫(yī)療診斷設備。它也可以是有線或者無線用戶界面外設。這方面微軟針對 Xbo x360 游戲機提供的 Kinect 可能是最好的例證,上市頭 2 個月就銷售出 800萬件。
FPGA 的商機:案例研究
可供選用的穩(wěn)健可靠的嵌入式視覺處理產品豐富多樣,如微處理器與嵌入式控制器、專用 SoC、DSP、圖形處理器、ASIC 和 FPGA。FPGA 是一款用于實現(xiàn)嵌入式視覺技術的極富吸引力的芯片平臺,因為它將 ASIC的高性能和低功耗硬件以及可運行在CPU、GPU 或 DSP 上的軟件算法的靈活性和快速上市優(yōu)勢集于一身。在嵌入式視覺市場處于襁褓時期的當前階段,靈活性具有特別重要的意義。因為為了支持多樣化的算法選擇,迅速完成缺陷修正和特性集改進是一種常態(tài),而非偶然。FPGA 的硬件可配置能力也便于讓設計經簡單直觀修改就能適用于支持各種串行和并行(以及模擬和數字)接口的圖像傳感器。
嵌入式視覺聯(lián)盟是由世界各地的開發(fā)商和提供商組成的統(tǒng)一的全球性聯(lián)盟,其宗旨是以豐富、迅速和高效的方式將嵌入式視覺的潛力變?yōu)楝F(xiàn)實(見側邊欄)。該聯(lián)盟的兩個創(chuàng)始成員 (BDTI) 伯克利設計技術公司和賽靈思已聯(lián)合開發(fā)出一個參考設計,用于證實嵌入式視覺技術不可估量的市場前景以及 FPGA 在實現(xiàn)該前景中可能發(fā)揮的作用。這個項目的目的是探索系統(tǒng)設計人員在開發(fā)高度復雜的智能視覺平臺時可進行的典型架構決策,該平臺所包含的元件需要高強度硬件處理和復雜的軟件及算法控制。
BDTI 和賽靈思對設計進行了分區(qū),其中 FPGA 架構負責處理數字信號處理密集型運算,而 CPU 則負責處理復雜的控制和預測算法。在這個探索性實現(xiàn)方案中,CPU 電路板通過以太網接口連接到 FPGA 開發(fā)板。FPGA 執(zhí)行高帶寬處理,僅有元數據通過網絡 (network tether) 進行交換。該項目還探索了軟硬件同步開發(fā),故要求在最終的 FPGA 硬件實現(xiàn)之前使用精準的仿真模型。
第一階段:道路標志檢測
項目的第一階段和第二階段均采用了兩個基于 PC 的專門功能:正在開發(fā)中的賽靈思視頻 IP 模塊的仿真模型和一個由 BDTI 開發(fā)的處理應用(見圖 1)。輸入數據為 720p 高清分辨率、60 fps 的 YUV 編碼視頻流,代表車輛正前方攝像頭可能采集到的圖像。其目的是識別(雖然沒有采用光學字符職別技術“讀取”,但這項功能可以自然延伸出來)視頻幀中的四種類型的對象,以輔助駕駛員駕駛:
• 綠色方向標志
• 黃色和桔紅色危險標志
• 藍色信息標志
• 桔紅色安全錐
賽靈思提供的 IP 模塊仿真模型負責輸出用于識別每幀中各顏色像素組的位置和大小的元數據,這些也是最終硬件 IP 模塊生成的元數據。許多嵌入式視覺系統(tǒng)的精度受多種外部因素的影響,比如成像傳感器的噪聲、突然的照度變化以及難以預測的外部運動。對本項目的必要要求之一是要求FPGA 硬件在盡量節(jié)約硬件資源的情況下,借助能夠容忍大量外部干擾且不降低檢測精確度的預測性軟件,在有大量外部干擾的條件下完成圖像處理并生成元數據。
BDTI 針對這種特定應用,對這些IP 模塊豐富的配置參數集進行了優(yōu)化,而且 BDTI 的后處理算法還提供了進一步的優(yōu)化和預測功能。例如,在某些情況下,該硬件只能部分識別一幀中的對象,但應用層軟件使用跟蹤算法能夠繼續(xù)預測對象的位置。這種方法非常有效,因為在許多情況下物理探測無法做到持續(xù)不斷,因此軟件智能層對提供持續(xù)的預測起著關鍵作用。
再舉一個例子。高速公路綠色指路標志上的黑色或白色字符可能會擾亂 IP 模塊普通的圖像分析功能,會將路標錯誤地分解成多像素的子集合(見圖 2)。根據該應用中使用的成像傳感器的質量和設置,IP 模塊還會混淆紅色和桔紅色,從而將其他車輛的尾燈或剎車燈誤認為交通錐或交通標識。
圖 2 - 采用專門針對應用定制的二級算法進一步處理 FPGA 的視頻分析硬件電路輸出的元數據
評論