利用先進(jìn)技術(shù)保家衛(wèi)國(guó):深度學(xué)習(xí)進(jìn)行小目標(biāo)檢測(cè)(適合初學(xué)者入門)
論文地址:https://arxiv.org/pdf/2201.03243v1.pdf
一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng),該系統(tǒng)可以高精度地檢測(cè)和跟蹤非常小的無(wú)人機(jī)。
整體的介紹都比較基礎(chǔ)簡(jiǎn)單,初學(xué)者可以簡(jiǎn)單了解!
一、前言
如今,無(wú)人機(jī)等被廣泛用于各種用途,例如從航空?qǐng)D像中捕獲和目標(biāo)檢測(cè)等。這些小型ariel車輛輕松進(jìn)入公眾可能會(huì)造成嚴(yán)重的安全威脅。例如,關(guān)鍵地點(diǎn)可能會(huì)被混入公共場(chǎng)所的間諜使用無(wú)人機(jī)監(jiān)控。
Study in hand提出了一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng),該系統(tǒng)可以高精度地檢測(cè)和跟蹤非常小的無(wú)人機(jī)。所提出的系統(tǒng)由一個(gè)定制的深度學(xué)習(xí)模型“Tiny YOLOv3”組成,這是一種非常快速的目標(biāo)檢測(cè)模型“You Look Only Once”(YOLO)被構(gòu)建并用于檢測(cè)。目標(biāo)檢測(cè)算法將有效地檢測(cè)無(wú)人機(jī)。與之前的YOLO版本相比,所提出的架構(gòu)顯示出明顯更好的性能。在資源使用和時(shí)間復(fù)雜度方面得到了改進(jìn)。
二、背景
隨著世界在融合最新技術(shù)的同時(shí)不斷進(jìn)步,安全系統(tǒng)也在快速發(fā)展,以利用創(chuàng)新的力量來(lái)應(yīng)對(duì)可能出現(xiàn)的任何安全威脅。在過(guò)去的幾年里,無(wú)人機(jī)的使用量急劇增加,包括對(duì)公眾的可及性,這進(jìn)一步增加了其使用量。隨著無(wú)人機(jī)使用量的增加,安全威脅也隨之增加。我們已經(jīng)看到了一些無(wú)人機(jī)飛越不同建筑物的事件,包括一些需要安全的敏感區(qū)域。
無(wú)人機(jī)還提出了許多威脅,包括無(wú)人機(jī)被用作毒品走私工具、入侵無(wú)人機(jī)導(dǎo)致它們爆炸或使用它們竊取敏感信息,無(wú)人機(jī)還被用于進(jìn)行非法監(jiān)視,造成安全和隱私威脅。這些事件對(duì)安全和隱私構(gòu)成了巨大威脅。因此,解決這些安全問(wèn)題的方法是檢測(cè)和跟蹤這些無(wú)人機(jī),以便采取反制技術(shù)來(lái)阻止這些無(wú)人機(jī),以確保安全和隱私。
此外,大多數(shù)安全或防御系統(tǒng)都具有檢測(cè)可能發(fā)生的威脅程度的能力,但是,很少有人能夠深入分析威脅。隨著機(jī)器學(xué)習(xí)和人工智能的進(jìn)步,通過(guò)減少人為干預(yù)使此類系統(tǒng)變得智能化,有效的目標(biāo)檢測(cè)可以幫助提高安全系統(tǒng)的效率并執(zhí)行更好的分析。
三、新框架分析
前期主要介紹了深度學(xué)習(xí)的一些基礎(chǔ)知識(shí):
Image matrix convolution operation with multiplies filter matrix
Convolution with 3 x3 filter using Stride 2
ReLU operation
Max-Pooling
Fully Connected Layer
如上展示,盡管Tiny YOLOv3比YOLOv3快得多,但它因?yàn)樗?個(gè)尺度上執(zhí)行檢測(cè),并沒有提供更好的準(zhǔn)確度。
為了更好地實(shí)現(xiàn)準(zhǔn)確性,研究者引入了一個(gè)修改后的Tiny YOLOv3架構(gòu)。該架構(gòu)總共包括31層:16個(gè)卷積層,3個(gè)檢測(cè)層,其余是用最大池化和ReLU層。以前的YOLOV3微型架構(gòu)由總共24層組成,其中包括13個(gè)卷積層、3個(gè)檢測(cè)層。
研究者修改了Tiny YOLOv3架構(gòu),通過(guò)使用前幾層的ReLU層提取特征,將在三個(gè)尺度上進(jìn)行檢測(cè)。這意味著3個(gè)yolo層將負(fù)責(zé)檢測(cè)對(duì)象。錨框用于計(jì)算預(yù)測(cè)邊界框的寬度和高度。通常,YOLOv3為每個(gè)單元使用3個(gè)錨點(diǎn),這些錨點(diǎn)預(yù)測(cè)三個(gè)邊界框,總共9個(gè)錨點(diǎn)框。對(duì)于研究者的自定義目標(biāo)檢測(cè)器,總共使用了6個(gè)錨框。
預(yù)測(cè)特征圖將分別為3個(gè)尺度上的13x13、26x26和52x52。隨著網(wǎng)絡(luò)向前傳播圖像,在第一個(gè)yolo層,得到一個(gè)13x13的輸出特征圖。在放置第一個(gè)yolo層之后,對(duì)下一層進(jìn)行了兩倍的采樣,然后將具有相似大小的前一層的特征圖連接起來(lái)。對(duì)于第二個(gè)yolo層,得到26x26的輸出特征圖,在第三個(gè)yolo層,得到一個(gè)52x52的特征圖。這種架構(gòu)比原始的yolov3架構(gòu)更簡(jiǎn)潔、更小,后者在3個(gè)尺度上進(jìn)行檢測(cè)。此外,研究者的小而輕的架構(gòu)可以檢測(cè)具有高置信度分?jǐn)?shù)的小物體。
四、實(shí)驗(yàn)
Results Evaluated
AVG FPS
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。