從人機(jī)大戰(zhàn)歷史看,柯潔對(duì)戰(zhàn)AlphaGo勝算幾何?

來源:網(wǎng)絡(luò) 時(shí)間:2017-05-22 16:20:53

從人機(jī)大戰(zhàn)歷史看,柯潔對(duì)戰(zhàn)AlphaGo勝算幾何?

【AI世代編者按】 眾所周知,由DeepMind公司研發(fā)的圍棋人工智能AlphaGo去年3月同韓國(guó)棋手李世石展開了五輪驚世較量。最終這場(chǎng)人機(jī)大戰(zhàn)總比分定格在1:4,AlphaGo獲得比賽勝利。

今年初,AlphaGo化身Master后創(chuàng)造了連續(xù)60場(chǎng)對(duì)人類不敗的恐怖戰(zhàn)績(jī),因此圍棋界都希望能夠有一名大神站出來打敗AlphaGo,以證明人類的實(shí)力。

5月23日-27日,AlphaGo將與柯潔等為代表的中國(guó)頂尖棋手進(jìn)行圍棋對(duì)弈。且與去年AlphaGo與李世石對(duì)戰(zhàn)時(shí)采用的五局三勝制度不同,本次柯潔與AlphaGo的對(duì)決將通過三局兩勝來定出勝負(fù)。

下面不妨讓我們通過回顧人機(jī)大戰(zhàn)的以往交手歷史簡(jiǎn)單判斷一下柯潔大戰(zhàn)AlphaGo能有幾成勝算:

1996年

深藍(lán)與棋王

深藍(lán)是美國(guó)IBM公司生產(chǎn)的一臺(tái)超級(jí)國(guó)際象棋電腦,重1270公斤,有32個(gè)微處理器,每秒鐘可以計(jì)算2億步。IBM表示,研究團(tuán)隊(duì)總共為深藍(lán)輸入了一百多年來優(yōu)秀棋手的兩百多萬局對(duì)局情況。

憑借深藍(lán)超強(qiáng)的計(jì)算能力,它在1996年與國(guó)際象棋的世界冠軍加里-卡斯帕羅夫(Garry Kasparov)進(jìn)行了一場(chǎng)世界矚目的對(duì)決。

國(guó)際象棋界公認(rèn)的棋王卡斯帕羅夫,從小師從國(guó)際象棋世界冠軍鮑特維尼克,13歲起參加國(guó)際比賽,獲得在法國(guó)舉行的第三屆青年世界杯賽第三名。1979年,參加了南斯拉夫舉辦的一場(chǎng)國(guó)際賽事,并奪取金牌。21歲時(shí)卡斯帕羅夫挑戰(zhàn)第12屆世錦賽冠軍卡爾波夫,并于次年將其挑于馬下首次獲得世界冠軍。后來,他又連續(xù)12年一直保持著世界冠軍的頭銜

在1996年深藍(lán)與卡斯帕羅夫的對(duì)決中,深藍(lán)以2:4落敗。其后研究小組將深藍(lán)加以改良,運(yùn)行速度提升一倍,達(dá)到了兩億次每秒,可以搜尋和預(yù)測(cè)其后的12步棋,并在時(shí)隔一年后卷土重來。

賽前,卡斯巴羅對(duì)于這位“手下敗將”的再次挑戰(zhàn)表示:“這場(chǎng)比賽關(guān)系到在純智力領(lǐng)域人類是否優(yōu)越于機(jī)器,關(guān)系到捍衛(wèi)人類的尊嚴(yán)”。

1997年5月11日,在人與計(jì)算機(jī)之間挑戰(zhàn)賽的歷史上可以說是歷史性的一天。計(jì)算機(jī)在正常時(shí)限的比賽中首次擊敗了等級(jí)分排名世界第一的棋手,卡斯帕羅夫以2.5比3.5(1勝2負(fù)3平)輸給了IBM的計(jì)算機(jī)程序“深藍(lán)”。IBM在比賽后宣布深藍(lán)退役,但此役的勝利標(biāo)志著國(guó)際象棋歷史進(jìn)入了新時(shí)代,此戰(zhàn)也成為人機(jī)大戰(zhàn)史畫上了濃墨重彩的一筆。

2006年

浪潮天梭象棋大戰(zhàn)

說到棋類的人機(jī)大戰(zhàn),除了國(guó)際象棋深藍(lán)與卡斯帕羅夫的世紀(jì)之戰(zhàn)外,中國(guó)象棋有一場(chǎng)人機(jī)大戰(zhàn)不得不提,那就是2006年的浪潮天梭超級(jí)計(jì)算機(jī)挑戰(zhàn)人類象棋大師一役,在最終的巔峰對(duì)決中,許銀川與浪潮天梭兩戰(zhàn)皆和。

2006年是“人工智能誕生50周年”,從事超級(jí)計(jì)算機(jī)領(lǐng)域的浪潮公司舉行了浪潮杯象棋人機(jī)大戰(zhàn)終極對(duì)決,代表電腦方出戰(zhàn)的是浪潮天梭,這一超級(jí)電腦每秒最多可計(jì)算42億步棋,最多可支持上千節(jié)點(diǎn)/數(shù)千顆處理器。比賽用時(shí)對(duì)人類來說有些不利,上下午各進(jìn)行一局,由于電腦超強(qiáng)的計(jì)算能力,所以用時(shí)越短對(duì)電腦更加有利。

人類一方則分為兩隊(duì),第一隊(duì)是徐天紅、卜鳳波、柳大華、張強(qiáng)、汪洋五位象棋大師。經(jīng)過兩輪緊張激烈的酣戰(zhàn),最終超級(jí)電腦浪潮天梭以兩回合10盤棋共3勝5和2負(fù),取得了勝利。人類方第二隊(duì)則是通過網(wǎng)絡(luò)選拔產(chǎn)生的棋手,從近7萬人的網(wǎng)絡(luò)海選中脫穎而出的25名網(wǎng)絡(luò)高手被分為五個(gè)小組,與浪潮天梭展開了殊死搏斗,最終以5負(fù)5和的比分告負(fù)。

兩場(chǎng)人機(jī)大戰(zhàn)人類皆不敵電腦,當(dāng)時(shí)的中國(guó)象棋第一人許銀川挺身而出,單獨(dú)約戰(zhàn)浪潮天梭,上演了一場(chǎng)巔峰對(duì)決。首局許銀川后手,在劣勢(shì)的情況下頂和電腦。第二局,許銀川借先行之利發(fā)動(dòng)攻勢(shì),但浪潮天梭防守滴水不漏,雙方最終兩戰(zhàn)皆和,戰(zhàn)成平手。

賽后許銀川表示:“人在劣勢(shì)的局面下心理壓力會(huì)非常大,所以面對(duì)進(jìn)攻很多時(shí)候會(huì)心理潰敗導(dǎo)致對(duì)局的失敗。電腦卻沒有心理壓力,而且由于它的計(jì)算能力強(qiáng)大,所以反彈能力也非常強(qiáng),會(huì)在劣勢(shì)的局面下反彈出來,這一點(diǎn)非常的可怕?!?/p>

這場(chǎng)人機(jī)大戰(zhàn)沒有輸家,浪潮天梭也向世人證明了自己超強(qiáng)的運(yùn)算能力。從此象棋界也開始正視電腦的輔助能力,后來在不少年輕棋手的成長(zhǎng)歷程中,電腦都起到了不可或缺的陪練作用。

2011年

Watson與《危險(xiǎn)邊緣》

2011年,“深藍(lán)”的同門師弟IBM人工智能系統(tǒng)“沃森”在美國(guó)老牌智力問答節(jié)目《危險(xiǎn)邊緣》(Jeopardy)中挑戰(zhàn)兩位人類冠軍。

《危險(xiǎn)邊緣》是美國(guó)哥倫比亞廣播公司益智問答游戲節(jié)目,于1964年首次登陸美國(guó)熒屏,通過涉及地理、政治、歷史、體育和娛樂等領(lǐng)域的一系列問題考驗(yàn)選手的知識(shí)面。與傳統(tǒng)游戲設(shè)置有所不同的是,選手面對(duì)的是答案,需要給出與這個(gè)答案相對(duì)應(yīng)的問題。參賽者通常需要掌握大量歷史、文學(xué)、政治、科學(xué)及流行文化知識(shí),還需要解析隱晦含義和謎語(yǔ)等。

雖然比賽時(shí)不能接入互聯(lián)網(wǎng)搜索,但“沃森”存儲(chǔ)了2億頁(yè)的數(shù)據(jù),包括各種百科全書、詞典、新聞、甚至維基百科的全部?jī)?nèi)容。因此“沃森”可以在3秒內(nèi)檢索數(shù)百萬條信息并以人類語(yǔ)言輸出答案,還能分析題目線索中的微妙含義、諷刺口吻及謎語(yǔ)等?!拔稚边€能根據(jù)比賽獎(jiǎng)金的數(shù)額、自己比對(duì)手落后或領(lǐng)先的情況、自己擅長(zhǎng)的題目領(lǐng)域來選擇是否要搶答某一個(gè)問題。

最終,“沃森”輕松戰(zhàn)勝兩位人類冠軍。對(duì)此,IBM沃森業(yè)務(wù)實(shí)施部副總裁艾德-哈勃(Ed Harbour)就表示:“沃森代表了IBM未來的另—種可能,更代表了人類計(jì)算模式演進(jìn)的下一階段?!?/p>

2016年

AlphaGo對(duì)戰(zhàn)李世石

賽前,圍棋界和科學(xué)界的很多人都對(duì)這場(chǎng)比賽做了預(yù)測(cè)。谷歌(微博)對(duì)自己開發(fā)的機(jī)器人信心很足,聲稱根據(jù)電腦計(jì)算的結(jié)果,李世石打敗“阿爾法狗”的概率為0。而圍棋界則多數(shù)站在李世石這一邊,中國(guó)棋圣聶衛(wèi)平認(rèn)為李世石敗北是不可能的事情。

最終,比賽以1:4李世石輸給AlphaGo結(jié)束(值得一提的是,李世石雖然以0:3宣告失敗,但仍需要和AlphaGo下完剩余兩場(chǎng)。)。賽后,AlphaGo戰(zhàn)勝傳奇圍棋選手李世石的消息立刻成了全世界各家媒體的頭條。同時(shí),這也是人工智能歷史上最重要的時(shí)刻之一。

“我非常吃驚,我沒想到會(huì)輸,AlphaGo的實(shí)力居然如此強(qiáng)悍?!崩钍朗惡笳f道。

事實(shí)上,在跟李世石下棋之前,AlphaGo已經(jīng)集中學(xué)習(xí)了半年,比如谷歌為其輸入了3000萬步人類圍棋大師的走法,讓其自我對(duì)弈3000萬局,積累勝負(fù)經(jīng)驗(yàn),同時(shí)它還要在自我對(duì)弈的訓(xùn)練中形成全局觀,并對(duì)局面作出評(píng)估。經(jīng)過上述深度學(xué)習(xí)后,AlphaGo展示出了強(qiáng)大的選擇能力。當(dāng)然更可怕的是,隨著訓(xùn)練時(shí)間的增加,AlphaGo還在不斷進(jìn)步之中。

不過不管最終的結(jié)果是什么樣,就像谷歌所說的那樣“這場(chǎng)人機(jī)圍棋大戰(zhàn)的最大贏家還是人類”。(綜合/湯姆)

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。