在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 業(yè)界動態(tài) > 【E課堂】一文帶你了解谷歌AlphaGo是怎樣煉成的?

            【E課堂】一文帶你了解谷歌AlphaGo是怎樣煉成的?

            作者: 時間:2017-04-11 來源:網(wǎng)易智能 收藏

              李世石對戰(zhàn)慘敗之后,期待中國選手柯潔為人類圍棋而戰(zhàn)的呼聲就越來越高,從未停止!

            本文引用地址:http://www.biyoush.com/article/201704/346432.htm

              如今,柯潔終于來到舞臺中央,將于5月23日-27日在中國烏鎮(zhèn)圍棋峰會與一戰(zhàn)高下!屆時,與世界排名第一的柯潔將完成三番棋對弈,此次比賽除了AlphaGo與柯潔的世紀(jì)對戰(zhàn)之外,還會采用團隊賽、配對賽的多種形式,中國圍棋代表隊其他成員也將參與。那么,AlphaGo究竟是什么?它是如何煉成的?網(wǎng)易智能帶您一一解讀。

              歡迎參與投票對于這次人機大戰(zhàn),你看好柯潔還是AlphaGo

              毫無懸念!AlphaGo穩(wěn)贏。

              柯潔水平高超,我認(rèn)為柯潔贏。

              一半一半吧,我還沒想好。 查看結(jié)果起止時間:2017-04-10 至 2017-04-17

              AlphaGo是什么?

              AlphaGo是第一個擊敗人類職業(yè)圍棋選手,第一個戰(zhàn)勝世界冠軍的程序,是圍棋史上最具實力的選手之一。2016年3月,在全世界超過一億觀眾的關(guān)注下,Alpha Go經(jīng)過3局對弈,最終以4比1的總比分戰(zhàn)勝了圍棋世界冠軍李世石,這場比賽成為了人工智能領(lǐng)域的一個重要里程碑。

              

            一文帶你了解谷歌AlphaGo是怎樣煉成的?

             

              過去曾有專家預(yù)測人工智能需要十年的時間才有可能戰(zhàn)勝人類職業(yè)選手,在這場比賽之后,AlphaGo憑借其"充滿創(chuàng)意而又機智"的下法,躋身圍棋界最高職業(yè)稱號——職業(yè)九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。近期,AlphaGo的升級版本以“Master/Magister”的稱謂與世界頂級的圍棋選手進(jìn)行60場線上快棋賽,并取得了全勝的出色戰(zhàn)績。

              AlphaGo是如何進(jìn)行訓(xùn)練的?

              一直以來,圍棋就被認(rèn)為是傳統(tǒng)游戲中,對人工智能而言最具挑戰(zhàn)性的項目,這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對于落子位置的評估難度已遠(yuǎn)運超過了簡単的啟發(fā)式算法。為了應(yīng)對圍棋的巨大復(fù)雜性,AlphaGo采用了一種新穎的機器學(xué)習(xí)技術(shù),結(jié)合了監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)的優(yōu)勢,通過訓(xùn)練形成一個策略網(wǎng)絡(luò)(policy network),將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。

              

            一文帶你了解谷歌AlphaGo是怎樣煉成的?

             

              然后,訓(xùn)練出一個價值網(wǎng)絡(luò)(value network)對自我對弈進(jìn)行預(yù)測,以-1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標(biāo)準(zhǔn),預(yù)測所有可行落子位置的結(jié)果。這兩個網(wǎng)絡(luò)自身都十分強大,而AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索(NCTS)中,實現(xiàn)了它真正的優(yōu)勢。最后,新版的AlphaGo產(chǎn)生大量自我對弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過程循環(huán)往復(fù)。

              

            一文帶你了解谷歌AlphaGo是怎樣煉成的?

             

              注意!此過程循環(huán)往復(fù),我們?nèi)祟愋枰燥埿菹ⅲ@個比你聰明的選手還比你勤奮!

              Alpha Go如何決定落子?

              

            一文帶你了解谷歌AlphaGo是怎樣煉成的?

             

              

            一文帶你了解谷歌AlphaGo是怎樣煉成的?

             

              在獲取棋局信息后,Alpha Go會根據(jù)策略網(wǎng)絡(luò)(policy network)探索哪個位置同時具備高潛在價值和高可能性,進(jìn)而決定最佳落子位置。在分配的搜索時間結(jié)束時,模擬過程中被系統(tǒng)最頻繁考察的位置將成為Alpha Go的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后,Alpha Go的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。



            關(guān)鍵詞: 谷歌 AlphaGo

            評論


            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉