有關(guān)機(jī)器學(xué)習(xí)每個(gè)人都應(yīng)該了解的東西
在過(guò)去的幾個(gè)月中,我與很多的決策者交流了有關(guān)人工智能特別是機(jī)器學(xué)習(xí)方面的問(wèn)題。其中有幾名高管已經(jīng)被投資者詢問(wèn)了有關(guān)他們?cè)?a class="contentlabel" href="http://www.biyoush.com/news/listbylabel/label/機(jī)器學(xué)習(xí)">機(jī)器學(xué)習(xí)(Machine Learning)方面的戰(zhàn)略,以及在哪些方面運(yùn)用了機(jī)器學(xué)習(xí)。那么這個(gè)技術(shù)課題為什么突然會(huì)成為公司董事會(huì)討論的話題呢?
本文引用地址:http://www.biyoush.com/article/201711/370980.htm計(jì)算機(jī)應(yīng)該為人類解決問(wèn)題。傳統(tǒng)的方法是“編寫”所需的程序,換句話說(shuō),就是我們教電腦問(wèn)題解決的算法。該算法詳細(xì)描述了解決問(wèn)題的過(guò)程,就像食譜一樣。很多任務(wù)都可以用算法來(lái)描述。例如,在小學(xué)里,我們學(xué)習(xí)了數(shù)字加法算法。當(dāng)涉及到要快速、完美地運(yùn)行這種算法時(shí),計(jì)算機(jī)比人類更勝任這個(gè)工作。
然而,這個(gè)問(wèn)題解決的過(guò)程是有局限性的。我們?nèi)绾巫R(shí)別一張貓的照片呢?這個(gè)看起來(lái)很簡(jiǎn)單的任務(wù)卻難以用一種算法來(lái)描述。讓我們稍等片刻,仔細(xì)想想。即使是簡(jiǎn)單的說(shuō)明(如“有四條腿”或“有兩只眼睛”)也有其缺點(diǎn),因?yàn)檫@些特點(diǎn)可能會(huì)被隱藏,或照片可能只顯示了貓的一部分。如果我們遇到識(shí)別腿或眼睛的任務(wù)時(shí),那與識(shí)別貓一樣的困難。
這正是機(jī)器學(xué)習(xí)展現(xiàn)其實(shí)力的地方。計(jì)算機(jī)不需要開(kāi)發(fā)算法來(lái)解決問(wèn)題,而是使用示例來(lái)學(xué)習(xí)算法本身。我們用樣本來(lái)訓(xùn)練計(jì)算機(jī)。對(duì)于識(shí)別貓這個(gè)例子,我們需要使用大量的標(biāo)注了貓的照片來(lái)訓(xùn)練系統(tǒng)(監(jiān)督學(xué)習(xí))。通過(guò)這種方式,算法會(huì)發(fā)生進(jìn)化,繼而成熟,并最終能夠識(shí)別出陌生圖片上的貓。
事實(shí)上,在這種情況下,計(jì)算機(jī)通常不會(huì)學(xué)習(xí)經(jīng)典程序,甚至都不會(huì)學(xué)習(xí)模型中的參數(shù),例如網(wǎng)絡(luò)中的邊緣權(quán)重。這個(gè)原理可以與我們大腦(包含了神經(jīng)元)的學(xué)習(xí)過(guò)程相比較。像大腦一樣,與傳統(tǒng)程序不同,這種具有邊緣權(quán)重的網(wǎng)絡(luò)幾乎不可能被人類所理解。
在這種情況下,被稱為深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法得到了巨大的成功。深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí),反過(guò)來(lái)又是人工智能的一門學(xué)科,是計(jì)算機(jī)科學(xué)研究的主要分支。早在2012年,谷歌研究小組成功地訓(xùn)練了一個(gè)擁有16000臺(tái)計(jì)算機(jī),并從1000萬(wàn)段YouTube視頻中識(shí)別貓(和其他對(duì)象類別)的網(wǎng)絡(luò)。他們采用的就是深度學(xué)習(xí)技術(shù)。
許多與練習(xí)有關(guān)的問(wèn)題更傾向于屬于“識(shí)別貓”這個(gè)類別,而不是“數(shù)字加法”,因此,很難用人類編寫的算法來(lái)解決這些問(wèn)題。這些問(wèn)題通常是在某些數(shù)據(jù)中識(shí)別模式,例如識(shí)別圖像中的對(duì)象、語(yǔ)言中的文本或交易數(shù)據(jù)中的欺詐行為。
這里有一個(gè)簡(jiǎn)單的例子,我們來(lái)看一下預(yù)測(cè)性維護(hù)。想象一下許多傳感器正在發(fā)送數(shù)據(jù)流,有時(shí),某些機(jī)器會(huì)發(fā)生故障。現(xiàn)在的難題就是學(xué)習(xí)導(dǎo)致故障的數(shù)據(jù)流的模式。一旦學(xué)會(huì)了這種模式,就可以在正常操作期間識(shí)別出這種模式,從而預(yù)防潛在的故障。
雖然機(jī)器學(xué)習(xí)的原理并不新鮮,但目前深受大眾的追捧。這主要有三個(gè)原因:首先,用于應(yīng)用和訓(xùn)練的大量數(shù)據(jù)的可用性(“大數(shù)據(jù)”);其次,我們現(xiàn)在擁有巨大的計(jì)算能力,特別是在云端;第三,一系列的開(kāi)源項(xiàng)目使得每個(gè)人或多或少會(huì)使用一些算法。
機(jī)器學(xué)習(xí)不能代替?zhèn)鹘y(tǒng)編程,而是對(duì)傳統(tǒng)編程的補(bǔ)充。它提供了一些工具,使得我們能夠解決迄今為止難以甚至不可能解決的很多類問(wèn)題??偠灾?,這些給我們帶來(lái)了新的機(jī)會(huì),而現(xiàn)有的系統(tǒng)也越來(lái)越多地被改造并加入了機(jī)器學(xué)習(xí)功能。
遵循某種模式的重復(fù)操作就是一個(gè)典型的例子。假設(shè)有一個(gè)計(jì)算機(jī)程序,你可以通過(guò)點(diǎn)擊一系列復(fù)雜的菜單來(lái)使用它的一百個(gè)功能,但你每天只主動(dòng)地使用其中的某些功能。通過(guò)觀察你平時(shí)點(diǎn)擊的步驟,計(jì)算機(jī)可以學(xué)習(xí)預(yù)測(cè)你的下一步動(dòng)作,從而提高你操作的效率。計(jì)算機(jī)通過(guò)“學(xué)習(xí)”這些重復(fù)的數(shù)據(jù)和對(duì)象,可以使得許多步驟自動(dòng)化執(zhí)行,從而加快了速度。
在每個(gè)領(lǐng)域都可以找到更多的例子:針對(duì)個(gè)別學(xué)生(特別是“大型開(kāi)放式在線課程”,即MOOC)定制學(xué)習(xí)教材、疾病的早期診斷、在線營(yíng)銷目標(biāo)群體、客戶流失、自動(dòng)識(shí)別數(shù)據(jù)質(zhì)量問(wèn)題,或通過(guò)約會(huì)服務(wù)匹配用戶個(gè)人信息。
由于Spark擁有很多先進(jìn)的工具,它(集成在Hadoop中)已經(jīng)在機(jī)器學(xué)習(xí)領(lǐng)域成為領(lǐng)先的大數(shù)據(jù)框架。 Talend也正向著這個(gè)目標(biāo)發(fā)展,并且通過(guò)建模能夠抽象出一個(gè)更高的層次。建模可以降低復(fù)雜度,同時(shí)還會(huì)弱化與發(fā)展迅速并且門檻較高的基礎(chǔ)技術(shù)之間的依賴關(guān)系。
只有少數(shù)專家需要真正了解機(jī)器學(xué)習(xí)方面的算法細(xì)節(jié)。但是,如果每個(gè)人都能理解機(jī)器學(xué)習(xí)相關(guān)概念的話也是有好處的,比如知道機(jī)器學(xué)習(xí)是從示例中學(xué)習(xí)模式,并且能夠應(yīng)用到新的數(shù)據(jù)集上。最終,機(jī)器學(xué)習(xí)擴(kuò)大了機(jī)器可以解決問(wèn)題的類別,從而實(shí)現(xiàn)自動(dòng)化:具體來(lái)說(shuō)就是通過(guò)決策來(lái)實(shí)現(xiàn)。這正是計(jì)算機(jī)學(xué)到的東西;它根據(jù)從訓(xùn)練數(shù)據(jù)積累到的知識(shí),對(duì)新的數(shù)據(jù)做出決策。一方面,我們可以通過(guò)自動(dòng)化的決策,將機(jī)器學(xué)習(xí)應(yīng)用在我們的業(yè)務(wù)或圈子中。另一方面,我們自己本身就是一個(gè)數(shù)據(jù)源,其他的機(jī)器可以對(duì)我們進(jìn)行分析并優(yōu)化他們自己的業(yè)務(wù)。
總而言之,我想給大家留下這樣一幅畫面:計(jì)算機(jī)現(xiàn)在不僅能夠遵循明確的指令(例如數(shù)字相加),還可以通過(guò)例子進(jìn)行學(xué)習(xí)(例如通過(guò)訓(xùn)練樣例來(lái)識(shí)別貓的圖片)。根據(jù)要解決的問(wèn)題的不同,某個(gè)方法可能比另外一個(gè)更合適。然而,當(dāng)這兩個(gè)方法以某種方式結(jié)合起來(lái)使用的話,最終能為自動(dòng)化帶來(lái)更多的機(jī)會(huì)。
評(píng)論