基于ELM改進(jìn)K-SVD算法的多特征融合物體成像識(shí)別
0 引言
作為一項(xiàng)重要可用于恢復(fù)樣品高分辨率和相位的技術(shù),近幾年來(lái)傅里葉疊層成像(FP) 取得顯著進(jìn)步[1,2]。樣品高分辨率成像在大視場(chǎng)下完成的主要原因是具有相對(duì)較為簡(jiǎn)單的運(yùn)行設(shè)施及FP 技術(shù)所需算法,實(shí)現(xiàn)的功能還包括三維重聚焦[3,4]。在處理稀疏矩陣時(shí)應(yīng)用協(xié)同過(guò)濾算法,該算法基于內(nèi)存分析完成建立,所以系統(tǒng)準(zhǔn)確預(yù)測(cè)及高效運(yùn)行均不能得到充分有效保障,此問(wèn)題需將新算法引入完成處理,將原傳統(tǒng)算法進(jìn)行改進(jìn)。在推薦算法中早已應(yīng)用SVD 技術(shù),表現(xiàn)出較強(qiáng)的降維性能,結(jié)果顯示可顯著改善數(shù)據(jù)稀疏性[5]。最初在搜索潛在語(yǔ)義領(lǐng)域應(yīng)用SVD 技術(shù),該算法被應(yīng)用于推薦算法中,確定維數(shù)完成預(yù)測(cè)前,需按照含有奇異值對(duì)角矩陣、用戶(hù)特征向量矩陣、低維項(xiàng)目特征向量矩陣分解高維用戶(hù)- 項(xiàng)目評(píng)分矩陣,維數(shù)確定需結(jié)合奇異值大小及數(shù)量[6]。
本文獲取ELM 算法采用K-SVD 算法改進(jìn)處理實(shí)現(xiàn),并成功應(yīng)用于多特征融合物體成像識(shí)別領(lǐng)域。
1 ELM改進(jìn)K-SVD算法
1.1 SVD梯度下降法
針對(duì)以SVD技術(shù)為基礎(chǔ)的推薦算法,應(yīng)用梯度下降法獲取的優(yōu)化效果較佳,優(yōu)化原理為:將點(diǎn)集(X, Y)預(yù)先設(shè)置,特征變量及預(yù)測(cè)值分別對(duì)應(yīng)X 和Y 變量,通過(guò)迭代學(xué)習(xí)對(duì)某X 特征采用機(jī)器學(xué)習(xí)模式查詢(xún)獲取估計(jì)函數(shù),然后再獲取估計(jì)值Y,通過(guò)該函數(shù)預(yù)測(cè)新數(shù)據(jù)[7]。設(shè)定點(diǎn)集X 內(nèi)第n 個(gè)特征分量為xn,構(gòu)建變量X = (x1,x2, ... xn),擬合函數(shù)h(x) 表達(dá)式為:
h(x)=a0+a1x1+a2x2+...anxn
式中,a 參數(shù)需通過(guò)迭代運(yùn)算求解。同時(shí)判斷真實(shí)值與預(yù)測(cè)值間的差異時(shí)需利用誤差函數(shù),利用該算法迭代求解,用以下形式表示該誤差函數(shù):
J(a)= (1)
然后最小化J(a),求解最小J(a)主要依據(jù)各a值完成。用一個(gè)曲面或一條曲線代替J(a),同時(shí)參考數(shù)學(xué)分析理論基礎(chǔ),通過(guò)計(jì)算曲面或最低點(diǎn)替代最小值求解問(wèn)題[8]。然后以最快速度并結(jié)合梯度最大方向完成最值搜索,求導(dǎo)J(a)后再按上述步驟進(jìn)行求解。按照以下形式調(diào)整a表達(dá)式:
a i - J(a) = a i - α(h(x) - y)xi (2)
學(xué)習(xí)效率高低用α 表示,操縱迭代步長(zhǎng),最佳效果在未合理控制此參數(shù)的情況下將難以達(dá)到。
按照以下步驟應(yīng)用梯度下降法完成計(jì)算:
第1步:確定初始值h 及誤差閾值ε,同時(shí)要求ε > 0。
第2步:最小化誤差函數(shù)J (a),然后再求解下降方向,計(jì)算
第3步:判斷J(a)是否比ε小,將計(jì)算結(jié)果輸出;否則則按上述步驟進(jìn)行重新計(jì)算。
1.2 訓(xùn)練ELM算法
訓(xùn)練DELM-AE 算法的流程圖如圖1所示。在測(cè)試樣本稀疏編碼過(guò)程中,所利用字典選用全部的測(cè)試樣本,測(cè)試樣本標(biāo)簽值的判定則需依據(jù)重構(gòu)誤差最小準(zhǔn)則。
訓(xùn)練算法數(shù)據(jù)傳輸模式在隱含層及輸入均選用全連接模式,學(xué)習(xí)參數(shù)用β 表示。同時(shí)選用單隱層ELM算法解析算法各層及前一層,有利于訓(xùn)練成本的大幅降低,單隱層ELM“輸入層”用“輸出層”代替。參考此方法可完成極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)模型的構(gòu)建,實(shí)現(xiàn)自編碼功能,訓(xùn)練參考以上步驟進(jìn)行。
圖1 ELM改進(jìn)K-SVD算法流程圖
2 物體識(shí)別的應(yīng)用
2.1 物體識(shí)別
在Coil-20 數(shù)據(jù)集中驗(yàn)證ELM 算法。旋轉(zhuǎn)10°后再對(duì)每個(gè)物體進(jìn)行照片采集,共計(jì)獲得36×20 張圖片。采用隨機(jī)方式,在識(shí)別物體的過(guò)程中進(jìn)行訓(xùn)練選取圖片為18×20 個(gè),專(zhuān)門(mén)用于測(cè)試的樣本數(shù)據(jù)為剩余圖片。
基于3 層ELM 算法完成隱含層節(jié)點(diǎn)在K-SVD 算法中的設(shè)定,然后完成20 個(gè)節(jié)點(diǎn)的選取,各個(gè)節(jié)點(diǎn)識(shí)別率在ELM 算法隱含層中的測(cè)試結(jié)果如表1所示。
表1 ELM算法的識(shí)別率
為全方位評(píng)價(jià)字典學(xué)習(xí)結(jié)果,K-SVD 學(xué)習(xí)字典情況依據(jù)ELM 算法獲取,具體結(jié)果見(jiàn)圖2。通過(guò)ELM 算法,同時(shí)結(jié)合圖2 詳細(xì)數(shù)據(jù),字典精確度和優(yōu)勢(shì)在處理后的提升效果均十分顯著。
圖2 經(jīng)過(guò)ELM預(yù)處理前后的字典
對(duì)比分析表2數(shù)據(jù),發(fā)現(xiàn)應(yīng)用不同算法獲取的計(jì)算準(zhǔn)確率不同,包括K-SVD算法、SAE 算法及ELM 算法。數(shù)據(jù)結(jié)果顯示,從收斂速度來(lái)看,K-SVD 算法相對(duì)較快,同時(shí)相比SAE 算法,該算法的收斂時(shí)間更短。因此,不論是從計(jì)算效率還是計(jì)算準(zhǔn)確率來(lái)看,相比于ELM算法,改進(jìn)的K-SVD算法表現(xiàn)出較佳的性能優(yōu)勢(shì)。
表2 Coil-20的實(shí)驗(yàn)結(jié)果
2.2 多特征融合的物體識(shí)別
本實(shí)驗(yàn)采集數(shù)據(jù)環(huán)節(jié)抓取目標(biāo)數(shù)據(jù)集時(shí)應(yīng)用的機(jī)械臂由康奈爾大學(xué)機(jī)器研究實(shí)驗(yàn)室開(kāi)發(fā)而成。由8 005 張圖像及260 個(gè)對(duì)象構(gòu)成數(shù)據(jù)集,圖像拍攝和存儲(chǔ)利用Kinect,利用機(jī)械臂抓取目標(biāo),按特定方向和適當(dāng)?shù)谋尘包c(diǎn)云擺放各對(duì)象和設(shè)置各圖像。同時(shí)按照24×24 的尺寸標(biāo)準(zhǔn)調(diào)整設(shè)置圖像像素大小,任何彩色與深度的圖片都涵蓋在內(nèi),2 304 維的目標(biāo)由各機(jī)械臂抓取,576維深度特征及1 728 維RGB 特征均包含在內(nèi)。
經(jīng)實(shí)驗(yàn)測(cè)試得到,共有3 個(gè)節(jié)點(diǎn)數(shù)均為100 的隱含層包含在ELM 網(wǎng)絡(luò)模型中,識(shí)別效果良好,計(jì)算準(zhǔn)確率結(jié)合實(shí)驗(yàn)測(cè)試結(jié)果最終為90.1%;參數(shù)條件設(shè)置一致,僅有RGB 特征存在的情況下,識(shí)別率僅為83.1%。參考上述分析得出,系統(tǒng)識(shí)別精度在應(yīng)用深度特征后得到顯著提升。本實(shí)驗(yàn)測(cè)試的具體結(jié)果可參考表3 與表4數(shù)據(jù)。
表3 三個(gè)隱含層ELM改進(jìn)K-SVD算法識(shí)別率統(tǒng)計(jì)
對(duì)比分析表3數(shù)據(jù)得出,實(shí)驗(yàn)過(guò)程中采用K-SVD算法但未應(yīng)用深度信息的情況下, 識(shí)別準(zhǔn)確率為76.3%,該項(xiàng)參數(shù)數(shù)據(jù)在使用深度特征信息后有顯著提升,可達(dá)到81.4%的識(shí)別準(zhǔn)確率;當(dāng)深度信息匱乏的情況,ELM識(shí)別率為81.5%;新增深度信息后則增長(zhǎng)至82.9%;除此之外,在對(duì)原始圖像融合特征進(jìn)行處理的過(guò)程中,將ELM 網(wǎng)絡(luò)模型引入到前端,即使應(yīng)用傳統(tǒng)K-SVD算法也能獲取89.83% 準(zhǔn)確率較高的識(shí)別率,但是識(shí)別準(zhǔn)確率在深度信息未涵蓋的情況下僅為83.9%。K-SVD 算法性能可通過(guò)ELM 得到顯著提升,當(dāng)然算法識(shí)別準(zhǔn)確率在多特征加入后也相應(yīng)得到快速增長(zhǎng)。
表4 多特征融合結(jié)果對(duì)比
將較低分辨率的樣本從圖像中篩選出來(lái),然后再將其分辨率進(jìn)行恢復(fù),有利于減少傅里葉疊層成像數(shù)量。
3 結(jié)束語(yǔ)
本文開(kāi)展基于ELM 改進(jìn)K-SVD 算法的多特征融合物體成像識(shí)別分析,得到如下有益結(jié)果:
1)不論是從計(jì)算效率還是計(jì)算準(zhǔn)確率來(lái)看,改進(jìn)的K-SVD 算法表現(xiàn)出較佳優(yōu)勢(shì)。
2)K-SVD 算法性能可通過(guò)ELM 顯著提升,算法識(shí)別準(zhǔn)確率在多特征加入后也相應(yīng)快速增長(zhǎng)。
參考文獻(xiàn):
[1] 何承剛,朱友強(qiáng),王斌.基于粒子群優(yōu)化的宏觀傅里葉疊層成像位置失配校準(zhǔn)[J].光學(xué)精密工程,2022,30(23):2975-2986.
[2] 宋東翰,王斌,朱友強(qiáng),等.基于多尺度特征融合網(wǎng)絡(luò)的傅里葉疊層成像[J].液晶與顯示,2022,37(11):1476-1487.
[3] 浦東,何小亮,戈亞萍,等.基于宏觀傅里葉疊層成像技術(shù)的光學(xué)傳遞函數(shù)測(cè)量[J].光學(xué)學(xué)報(bào),2022,42(14):117-124.
[4] CHAMARA L L, ZHOU H, HUANG G B. Representational learning with ELMs for big data[J]. Intelligent Systems,IEEE,2013, 28(6):31-34.
[5] WIDROW B, GREENBLATT A, KIM Y, et al. The no-prop algorithm: a new learning algorithm for multilayer neural networks[J]. Neural Networks the Official Journal of the International Neural Network Society,2013,37(1):182-188.
[6] 毛海鋒,趙巨峰,崔光茫,等.基于傅里葉疊層顯微成像的LED陣列位置校正方法[J].光學(xué)學(xué)報(bào),2021,41(4):103-113.
[7] 沙浩,劉陽(yáng)哲,張永兵.基于深度學(xué)習(xí)的傅里葉疊層成像技術(shù)[J].激光與光電子學(xué)進(jìn)展,2021,58(18):374-383.
[8] 胡躍輝,房國(guó)慶,方勇,等.基于凸優(yōu)化的傅里葉疊層成像技術(shù)研究[J].應(yīng)用光學(xué), 2021, 42(4): 651-655.
(本文來(lái)源于《電子產(chǎn)品世界》雜志2023年8月期)
評(píng)論