有哪些深度學習效果不如傳統(tǒng)方法的經(jīng)典案例?
作者丨桔了個仔、莫笑傅立葉、LinT
來源丨知乎問答
編輯丨極市平臺
深度學習作為目前最前沿的科技領域之一,一般都引導著科技進步,但是是否存在一些深度學習的效果反而不如傳統(tǒng)方法的案例呢?本文匯總了一些該問題下的優(yōu)質(zhì)回答,回答均來自知乎。 >>加入極市CV技術交流群,走在計算機視覺的最前沿
問題鏈接:https://www.zhihu.com/question/451498156
# 回答一
作者:桔了個仔
來源鏈接:https://www.zhihu.com/question/451498156/answer/1802577845
對于解釋性有要求的領域,基本深度學習是沒法和傳統(tǒng)方法比的。我這幾年都在做風控/反洗錢的產(chǎn)品,但監(jiān)管要求我們的決策要可解釋性,而我們曾經(jīng)嘗試深度學習,解釋性很難搞,而且,效果也不咋地。對于風控場景,數(shù)據(jù)清洗是非常重要的事,否則只會是garbage in garge out。
在寫上面內(nèi)容時,我想起前兩年看的一篇文章:《你不需要ML/AI,你需要SQL》
https://news.ycombinator.com/item?id=17433752
作者是尼日利亞的軟件工程師Celestine Omin,在尼日利亞最大的電商網(wǎng)站之一Konga工作。我們都知道,對老用戶精準營銷和個性化推薦,都是AI最為常用的領域之一。當別人在用深度學習搞推薦時,他的方法顯得異常簡單。他只是跑了一遍數(shù)據(jù)庫,篩選出所有3個月沒有登錄過的用戶,給他們推優(yōu)惠券。還跑了一遍用戶購物車的商品清單,根據(jù)這些熱門商品,決定推薦什么相關聯(lián)的商品。
結(jié)果,他這種簡單的而基于SQL的個性化推薦,大多數(shù)營銷郵件的打開率在7-10%之間,做得好時打開率接近25-30%,是行業(yè)平均打開率的三倍。
當然,這個例子并不是告訴大家,推薦算法沒用,大家都應該用SQL,而是說,深度學習應用時,需要考慮成本,應用場景等制約因素。我在之前的回答里(算法工程師的落地能力具體指的是什么?),說到過算法落地時需要考慮實際制約因素。
https://news.ycombinator.com/item?id=17433752
而尼日利亞的電商環(huán)境,依然出于非常落后的狀態(tài),物流也跟不上。即使使用深度學習方法,提升了效果,實際對公司整體利潤并不會有太大影響。
所以,算法落地時必須「因地制宜」否則,又會出現(xiàn)「電風扇吹香皂盒」的情況。
某大企業(yè)引進了一條香皂包裝生產(chǎn)線,結(jié)果發(fā)現(xiàn)這條生產(chǎn)線有個缺陷:常常會有盒子里沒裝入香皂??偛荒馨芽蘸凶淤u給顧客啊,他們只得請了一個學自動化的博士后設計一個方案來分揀空的香皂盒。
博士后拉起了一個十幾人的科研攻關小組,綜合采用了機械、微電子、自動化、X射線探測等技術,花了90萬,成功解決了問題。每當生產(chǎn)線上有空香皂盒通過,兩旁的探測器會檢測到,并且驅(qū)動一只機械手把空皂盒推走。
中國南方有個鄉(xiāng)鎮(zhèn)企業(yè)也買了同樣的生產(chǎn)線,老板發(fā)現(xiàn)這個問題后大為發(fā)火,找了個小工來說“你他媽給老子把這個搞定,不然你給老子爬走?!毙」ず芸煜氤隽宿k法他花了190塊錢在生產(chǎn)線旁邊放了一臺大功率電風扇猛吹,于是空皂盒都被吹走了。
(雖然只是個段子)
深度學習是錘子,而世間萬物不都是釘子。
# 回答二
作者:莫笑傅立葉
來源鏈接:https://www.zhihu.com/question/451498156/answer/1802730183
有兩個比較常見的場景:
1.追求可解釋性的場景。
深度學習非常善于解決分類和回歸問題,但對于什么影響了結(jié)果的解釋很弱,如果實際業(yè)務場景中,對于解釋性要求很高,諸如以下場景,那么深度學習往往被干翻。
2. 許多運籌優(yōu)化場景
諸如調(diào)度,規(guī)劃,分配問題,往往這類問題無法很好的轉(zhuǎn)化為監(jiān)督學習格式,因此常采用優(yōu)化算法。在現(xiàn)在研究中,在求解過程中往往融合深度學習算法更好地求解,但總體而言,模型本身還不是深度學習為主干。
深度學習是一個非常好的求解思路,但不是唯一,甚至在落地時依舊問題很大。若將深度學習融合于優(yōu)化算法,作為求解的一個部件,依舊有很大的用武之地。
總之,
# 回答三
作者:LinT
來源鏈接:https://www.zhihu.com/question/451498156/answer/1802516688
這個問題要分場景看。深度學習固然免去了特征工程的麻煩,但是在一些場景下應該很難應用:
應用對時延有高要求,而對精度沒有那么高的要求,這時簡單的模型可能是更好的選擇;
一些數(shù)據(jù)類型,例如tabular數(shù)據(jù),可能更適合使用基于樹的模型等統(tǒng)計學習模型而不是深度學習模型;
模型決策有重大影響,例如安全相關、經(jīng)濟決策相關,要求模型具有可解釋性,那么線性模型或者基于樹的模型,相對深度學習是更好的選擇;
應用場景決定了數(shù)據(jù)采集難,使用深度學習有過擬合的風險。
真實的應用都是從需求出發(fā)的,拋開需求(精度、時延、算力消耗)談表現(xiàn)是不科學的。如果把問題中的『干翻』限定到某個指標上,可能討論范圍可以縮小一些。
本文僅做學術分享,如有侵權,請聯(lián)系刪文。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。