自律學習SDL模型賦能自動駕駛
最近發(fā)生的幾起自動駕駛惡性事故,某種意義上看,都是因為深度學習的識別問題造成的。為什么被大家崇拜的深度學習在識別圖像上會出現(xiàn)問題?
本文引用地址:http://www.biyoush.com/article/202109/428180.htm原因有幾個方面,最主要的是深度學習在理論上屬于函數(shù)映射模型,簡單說就是給它訓練什么圖像就只能識別哪個圖像,不具有舉一反三的能力。通常我們用手機拍攝一個圖像,在屏幕上雖然看不出圖像有什么變化,這是因為大腦有記憶能力。但是對于沒有智能的機器識別來說,隨著相機的抖動,拍攝角度,光線等的微小變化所得到的都是完全不同的圖像。深度學習就是這樣,哪怕圖像有一點錯位,也會認為是另一個圖像。所以深度學習需要上萬乃至上百萬個圖像的訓練才能識別一個圖像。這就意味著用深度學習模型的自動駕駛的圖像識別裝置,遇到?jīng)]有訓練過的圖像時,明明有障礙物,也會做出沒有障礙物的判斷結果,出現(xiàn)撞車的惡性事故在所難免。盡管開發(fā)者們下力量不斷的搜集大量圖像數(shù)據(jù)進行訓練,但是面對眾多種路況這種做法從科學觀的立場上講是徒勞的。這也就是馬斯克指責目前學術界給出的AI不夠智能的原因所在。
我們希望更加智能的自動駕駛的誕生,需要各方努力,特別需要探索和尋找更好的算法模型。2018年發(fā)表在國際機器人大會上的自律學習模型是一個值得自動駕駛領域關注的算法模型。自律學習(Self-Discipline Learning)SDL模型其實就是人工智能領域所期待的機器學習模型。這種模型之所以強大是因為具有四個特殊的技術特征。
第一個技術特征是能讓機器模仿人來處理自動駕駛的識別,機器推理,以及自動駕駛的控制問題的算法。深度學習是基于統(tǒng)計學的機器學習模型,其實是屬于模式識別的理論,本不是人工智能的主流算法。人工智能的定義就是把人的智慧授予機器,讓機器具有超越人的能力。因此對于上述自動駕駛所面臨的復雜系問題,近幾十年一直圍繞著如何實現(xiàn)人為介入,就是說讓人介入到算法里去,把人在如何解決問題的方法構成算法,用這樣的算法讓機器去代替人解決復雜系問題。人工智能的第一,二次高潮的主流算法就是力圖解決給機器賦予人的智慧的問題,只是因為當時缺少數(shù)學基礎理論的支持,還無法在技術上實現(xiàn)讓機器智能的目的。因此真正的人工智能算法一定要直接解決如何把人的智慧讓機器深度理解,讓機器變聰明來代替人的工作。
談到這里,恐怕包括一些專家學者們都會感到茫然。這么復雜的算法何時才能得到?其實支持新一代人工智能的核心理論并不一定是極其抽象的理論,傳統(tǒng)的理論由于過于僵化不容易做到人為介入,把人的智慧授予機器,在當今人工智能領域是行不通的。而往往被人看不上的現(xiàn)代數(shù)學卻是可以成為人工智能可以產(chǎn)生突破性的核心理論。其中,模糊集合理論就為我們提供了可以針對任何一種事物的定式化方法。把人的智慧用足夠多的隸屬函數(shù)(Membership Function)的公式來表達,機器按照這些隸屬函數(shù)來處理各種復雜系問題,機器就可以同人一樣聰明起來。
這是受第二次人工智能高潮為了讓機器聰明起來,所推出的規(guī)則庫理論的啟發(fā),由于當時用規(guī)則所實現(xiàn)的知識表現(xiàn)過于簡單,規(guī)則只能告訴機器在什么情況下,應該如何做?面對復雜系問題卻需要無窮個規(guī)則才能解決,所以規(guī)則庫理論以失敗告終。今天,用隸屬函數(shù)進行知識表現(xiàn),一個隸屬函數(shù)可以相當無窮個規(guī)則,所以不用懷疑隸屬函數(shù)的能力。
我們可以用自動駕駛中目前很難解決的機器推理為例子,介紹上述算法的驚人作用。
自動駕駛的機器推理難就難在要想控制自動駕駛車正確的行駛,至少要考慮前后左右共有8輛車之間的距離,速度,加速度,以及自動駕駛車的速度,加速度,嚴格講這就是超越了40個組合要素的圖靈機不可解的NP(Non-deterministic Polynomial)問題。所以目前推出的自動駕駛就是國際大公司也苦于做不好這個功能,我們看到的這些自動駕駛很少變道,寧可跟著前面的車停下等待。
面對這個難題,我們搞的自動駕駛中的機器推理系統(tǒng),就是把人在駕駛汽車時的安全駕駛,安全禮讓,以及魚貫而行的安全駕駛的智慧用數(shù)百個隸屬函數(shù)來表達實現(xiàn)了機器深度理解,再通過深度的推理指揮自動駕駛的行駛,這樣的自動駕駛在路上跑,真的同人的駕駛很接近。為了讓機器推理能夠適應目前在路上經(jīng)常出現(xiàn)的野蠻駕駛的同行車,我們做了幾乎可以模擬實際路況的自動駕駛仿真系統(tǒng),這個仿真系統(tǒng)中自動駕駛車是用我們的機器推理模型來控制,周圍的同行車可以由人來控制,用人來控制同行車的目的就是,可以由人主動的構成各種變化多端甚至包括一些危險的路況場景,通過人同自動駕駛博弈,用以考驗機器推理的效果。這就是在新一代人工智能模型下,目前傳統(tǒng)模型不可解決的問題,卻可以輕而易舉的解決的案例。
由此可見,讓機器聰明起來并不是不可想象的神話,路在腳下只要用心就可以擺脫傳統(tǒng)的理論的束縛,在人工智能的研究中產(chǎn)生突破性的成果。
近代數(shù)學中的高斯過程理論也是人工智能的核心理論。著名數(shù)學家高斯發(fā)明的高斯分布的偉大之處在于它可以通過少量的數(shù)據(jù)就能得到大數(shù)據(jù)的訓練結果,基于這個理論所搞出的機器學習模型一定具有舉一反三的能力。高斯分布還給出了一切事務發(fā)展的必然結果,如同人類發(fā)展也是不以人的意志為轉(zhuǎn)移的,一定按照高斯分布由人類起源到人類的高度發(fā)展時期,最后一定趨于逐漸的終結,由起源到終結是一個對稱的過程,是由高斯分布所決定的。
構成自律學習SDL模型的其中一個核心的算法是“概率尺度自組織”,這是一個既簡單又實用的自律學習的算法?!案怕食叨茸越M織”的迭代過程是在高斯分布的任何的初始空間里,逐步朝著最大的概率空間遷移,并最終在最大概率空間里收斂的過程。我們的自動駕駛的三維圖像識別就是用了這么簡單的算法,自動駕駛所遇到的任何障礙物,在三維空間里是一個密度很大的物體,也就是概率分布最大的空間,利用概率尺度自組織的遷移特性,不管障礙物在什么地方,都可以被算法直接抓住,這種圖像識別不需要事先訓練圖像,不需要特征抽出,徹底避免了深度學習對障礙物與背景不好分離,造成把白色車廂看成是云而釀成惡性事故的發(fā)生。
隨著機器學習被業(yè)界高度重視,距離問題是機器學習的核心理論。為解決概率空間的數(shù)據(jù)的直接分類問題,吸引了無數(shù)數(shù)學家們投入概率空間距離的研究,雖然有KL(Kullback ?Leible)距離等很多的概率空間距離被發(fā)明,但是基于目前的數(shù)學基礎,數(shù)學家們把概率空間抽象化,看成是獨立的無窮維的空間,不能把歐幾里德空間與概率空間融合,以及還解決不了非線性函數(shù)的復雜的求解問題,致使目前數(shù)學界提出幾乎所有的概率空間距離都不能在工程上應用。
其實依據(jù)概率空間的嚴格定義,測度為一的空間就是概率空間,也就是一個高斯分布的數(shù)據(jù)就是一個概率空間數(shù)據(jù)。這就揭示出我們現(xiàn)實的數(shù)據(jù)是由歐幾里德空間發(fā)展到了概率空間的。經(jīng)過長時間的探索,我們發(fā)現(xiàn)了歐幾里德里空間距離與概率空間距離之間僅僅存在一個與概率空間的概率密度相關常數(shù),在歐幾里德空間距離里消除概率空間的距離的這個常數(shù)就可以得到一個精確的可以統(tǒng)一歐幾里德空間與概率空間的距離公式。
自律學習SDL模型就是用我們發(fā)明的概率空間距離作為概率空間數(shù)據(jù)之間的尺度,以概率尺度自組織的最大概率尺度為聚類的依據(jù),就可以自律的進行數(shù)據(jù)聚類。特別是在最大概率空間下的聚類,也可以說是在接近母體的高斯分布下的聚類。這是一個當今最佳的機器學習模型。即可以把概率空間的數(shù)據(jù)直接聚類,又可以得到在概率空間里以小數(shù)據(jù)學習得到相當于大數(shù)據(jù)學習的效果。
SDL模型還可以直接用于自動駕駛的控制,在控制領域近20年一直沒有突破,本來為解決隨機性的控制問題引入了自適應控制理論,但是,控制是應用于在線系統(tǒng)的,利用統(tǒng)計學理論,需要在線的抽取大量的統(tǒng)計數(shù)據(jù),這是現(xiàn)實應用中很難做到的,因此自適應控制一直停滯不前。機器學習為自適應控制提供了非常強大的支持,機器學習可以在離線上訓練數(shù)據(jù),使用訓練后的數(shù)據(jù)進行在線控制,不影響在線控制的速度。因此導入機器學習實現(xiàn)最佳的自適應控制是人們期待的算法。
自動駕駛的控制問題也對現(xiàn)代控制理論提出了挑戰(zhàn),汽車是重的載體,在高速運動中會產(chǎn)生很大的動能,目前雖然有模型預測控制(Model Predictive Control)MPC模型,以及線性二次型調(diào)節(jié)器控制(Linear Quadratic Regulator)LQR模型,但是,自動駕駛需要根據(jù)不同的路況不斷的改變控制狀態(tài),傳統(tǒng)的最佳控制是最不適應多變的自動駕駛的控制。把人在駕駛汽車時的生物意識的自然反應是駕駛汽車的最佳的方法,把人的駕駛智慧通過SDL模型的機器學習所得到的自動駕駛的高階信息,機器通過調(diào)用高階信息控制自動駕駛,實現(xiàn)了讓機器按照人的駕駛智慧進行自動駕駛,這是目前最理想的自動駕駛的控制方法。這種控制方法,不管是冰凍的道路,雪地,以及大水淹沒的道路都可以讓自動駕駛平穩(wěn)的行駛,實踐證明導入這樣的自動駕駛的控制算法,可獲得最理想的自動駕駛的效果。
使用我們發(fā)明的概率尺度自組織以及概率空間距離公式,以概率空間為中心的自律聚類這一新的機器學習的發(fā)明其先進性,在美國獲得的發(fā)明專利中被肯定,這也是構成了SDL模型的第二個技術特征。
只有符合科學的理論才可以被實踐所接受!在人工智能領域存在著很多缺乏科學依據(jù)宣傳,人工神經(jīng)網(wǎng)絡是否是深度學習可以產(chǎn)生一定應用效果的根源?
帶著這個問題我們的團隊勵志要打開人工神經(jīng)網(wǎng)絡的黑箱,我們基于組合理論的基本原則,經(jīng)過大家的努力奮戰(zhàn)終于在一個人工神經(jīng)網(wǎng)絡中找到了全局最佳解,這個全局最佳解實際上就是一個高維線性方程的解。在獲得全局最佳解的過程中,我們又掌握了各種數(shù)據(jù)函數(shù)映射的特點,以及與梯度下降法SGD(Steepest Gradient Descent)的解的關系。從而人工神經(jīng)網(wǎng)絡的不被人知的黑箱被打開了。通過打開黑箱推動了深度學習的技術進步,我們發(fā)現(xiàn)深度學習的應用效果主要是卷積核以及反向傳播的作用,而人工神經(jīng)網(wǎng)絡的作用主要是分類。利用SDL模型可以最佳的最高效率的自律聚類的特點,再加上把SDL模型與卷積核與反向傳播技術的融合,甩掉人工神經(jīng)網(wǎng)絡,使小數(shù)據(jù)小模型的SDL模型的能力超越一般的深度學習,這就是自律學習SDL模型的第三個技術特征。
自律學習SDL模型的第四個技術特征就是:利用自律學習的聚類結構簡單以及可分析性的特點,可以方便的融合其他技術。為了解決深度學習還很難解決的針對不同類的數(shù)據(jù)在低維空間混合在一起不可分問題,引用核函數(shù)(Kernel Function)理論,把數(shù)據(jù)映射到高維空間,使不可分離的數(shù)據(jù)利用高維空間的超平面就可以分離的技術特征,使SDL模型在分類技術上又產(chǎn)生了飛躍。
SDL模型在幾十年的人工智能的應用中,如今已形成一整套完整的理論體系,和立竿見影的應用效果??梢栽谀壳吧疃葘W習所做不到的工業(yè)控制,醫(yī)療領域,自動駕駛,以及嵌入式系統(tǒng)等的所有IT產(chǎn)品,以及所有的應用場景下發(fā)揮獨特的作用。SDL模型確實可以實現(xiàn)人們對人工智能的期望,實現(xiàn)全社會的人工智能的大普及,可以獲得以往任何技術所不能產(chǎn)生的經(jīng)濟效果。
當今在人工智能領域的技術發(fā)展日新月異,經(jīng)過長年的實踐針對復雜系問題用人的智慧賦予機器讓機器做出超越人的工作是新一代人工智能的核心理論,也是在工程上最行之有效的方法,在目前人工智能的基礎理論還沒有完全建立起來時,掌握這一核心理論一定會在實踐中獲得突破!寄托于年輕一代利用這個核心理論,在人工智能的發(fā)展過程之中建功立業(yè)!
評論