做好網(wǎng)站內(nèi)部優(yōu)化讓樞紐詞快速進(jìn)入首頁

發(fā)布時(shí)間：2016-02-08 文章來源：瀏覽次數(shù)：2546

決戰(zhàn)之日即將到來。

下周，韓國九段頂尖中國圍棋高手李世石（Lee Se-dol）將與谷歌人工智能項(xiàng)目AlphaGo在首爾四季酒店展開對決，整個(gè)比賽分五輪進(jìn)行（這是你要了解的第一件事）。

賽程：3月9日、3月10日、3月12日、3月13日、3月15日。

規(guī)則：貼目7.5目（向后下棋的選手貼目7.5目）。每位棋手各有兩個(gè)小時(shí)的布局時(shí)間，3次60秒的讀秒。

獎(jiǎng)金：100萬美元；谷歌已經(jīng)表示，假如AlphaGo獲勝，獎(jiǎng)金將捐贈給聯(lián)合國兒童基金會（UNICEF）、STEM教育及圍棋慈善機(jī)構(gòu)（Go Charity）。

P.S. 貼目是圍棋術(shù)語。指黑方因?yàn)橄仁�，在布局上�?jù)有一定的上風(fēng)，為了公平起見，在最后計(jì)算雙方所占地的多少時(shí)，黑棋必需扣減一定的目數(shù)或子數(shù)。中國采用的是7.5目的大貼目規(guī)則，日本、韓國則為6.5目。

雙方都撂狠話：我們必勝！

第二件事是，到目前為止，雙方都深信自己將贏得勝利。

2月22日，李世石在首爾韓國棋院接受賽前采訪時(shí)說：“誠實(shí)講，Pan Hui和AlphaGo的比賽水準(zhǔn)沒有達(dá)到我與AlphaGo比賽的水平。我聽說AlphaGo一直在進(jìn)級，就在我們談話時(shí)它還在繼承提高，所以說，比擬于10月的比賽，我所面對的挑戰(zhàn)會更大。盡管如斯，我占據(jù)上風(fēng)的事實(shí)是不會改變的。對我而言勝利是一定的，現(xiàn)在只剩下贏得完美不完美的題目了。”

谷歌DeepMind卻表示，人工智能程序有自動(dòng)學(xué)習(xí)的能力。

DeepMind工程總裁Demis Hassabis在2月初曾表示：“實(shí)際上整個(gè)比賽就是我們的Deep Blue時(shí)刻。” Hassabis還說，大多的圍棋玩家都以為李世石將擊敗AlphaGo，Hassabis增補(bǔ)道：“他們以為我們獲勝的機(jī)率只有5%……但我們的系統(tǒng)提高很快，這點(diǎn)是他們沒有意識到的。就在我們談話時(shí)，它正在提高。”

對于Hassabis而言，AlphaGo項(xiàng)目的意義并不僅僅只是打敗世界級的圍棋選手。開發(fā)AlphaGo程序的方法可以應(yīng)用在其它人工智能項(xiàng)目中，包括無人駕駛汽車、類人虛擬助手。“我們以為人工智能正在為這些題目提前解決一個(gè)元題目。”Hassabis說。

AlphaGo怎么運(yùn)行的？

這是第三件事。

很多人很好奇，到底是什么讓AlphaGo變得如斯成功？豈非其它人工智能就失敗了嗎？

“傳統(tǒng)搜索樹會考慮所有可能性，但它用在圍棋上行不通。” Hassabis說。正因如斯，谷歌DeepMind團(tuán)隊(duì)才用兩套神經(jīng)網(wǎng)絡(luò)為AlphaGo開發(fā)了一個(gè)全新的系統(tǒng)。我們可以將圍棋視為一個(gè)包涵所有可能性的樹，它能夠無窮延伸。AlphaGo要做的就是利用兩套神經(jīng)網(wǎng)絡(luò)來縮小可能性。它會利用策略網(wǎng)絡(luò)來判定什么行為可能性最高，系統(tǒng)應(yīng)該考慮怎么走好下一步。AlphaGo會將搜索樹的寬度變窄。還有一個(gè)就是價(jià)值網(wǎng)絡(luò)，它告訴AlphaGo怎么移動(dòng)對白子和黑子都更好，這樣就可以降低可能性的深度。

在步履之前，Deep Blue超級電腦要考慮大約200萬步，AlphaGo卻只需要考慮10萬步。機(jī)器比人類專業(yè)選手考慮得遠(yuǎn)，人類只能向前看1000步。DeepMind分別對兩套神經(jīng)網(wǎng)絡(luò)進(jìn)行練習(xí)。

策略網(wǎng)絡(luò)可以模仿職業(yè)圍棋選手下棋，然后讓電腦下棋1300萬次來改進(jìn)系統(tǒng)。終極。DeepMind會從每一個(gè)集合中挑選黑子或者白子的一邊，從而組建一個(gè)新的數(shù)據(jù)集。接下來價(jià)值網(wǎng)絡(luò)上場，DeepMind會利用好數(shù)據(jù)集，讓它來決定棋局中每一個(gè)位置上誰會獲勝。由此開始，DeepMind團(tuán)隊(duì)會將兩個(gè)網(wǎng)絡(luò)結(jié)合，用Monte Carlo樹搜索來搭建終極的AlphaGo。“AlphaGo就是一個(gè)系統(tǒng)，它可以自己學(xué)習(xí)，然后將學(xué)到的東西寫成算法。事實(shí)上，它跟人類學(xué)習(xí)和下圍棋很接近。”Hassabis解釋說。

有些高深莫測？實(shí)在，你可以以為AlphaGo就是一個(gè)實(shí)驗(yàn)，它不是編程程序，事實(shí)上連AlphaGo和它的自己創(chuàng)造者都無法解釋其是如何下棋的，但它卻是擁有了這種能力——或許這是一種直覺，通過不自覺的推理得到知識——到現(xiàn)在為止，我們普遍以為這是屬于人類的特權(quán)，就如牛頓在其《天然哲學(xué)的數(shù)學(xué)原理》第二版中序言中所寫到，“我不做假設(shè)，我只是知道。”

P.P.S. 關(guān)于AlphaGo的演示視頻我們沒找到，但我們找到了一個(gè)Facebook類似項(xiàng)目的。盡管沒有谷歌的NB，但憑借11萬次的運(yùn)算，其在聞名的籠蓋全球的網(wǎng)絡(luò)圍棋社區(qū)KGS的年度比賽中拿到了第三名。

人工智能下棋，大概就是以下這個(gè)視頻中展示的樣子：

是博弈也是試驗(yàn)

我們需要思索的更多一些，這是第四件事情。

人工智能是否能夠擊敗人類大腦？這個(gè)題目已經(jīng)爭論良久了，不論圍棋大戰(zhàn)誰勝誰負(fù)，它都將為題目的謎底奠定基礎(chǔ)。

假如李世石獲勝，某些人可以輕松地長舒一口吻了，由于他們之前曾擔(dān)心人工智能會入侵到人類占據(jù)統(tǒng)治地位的一些領(lǐng)域中去。假如AlphaGo獲勝會怎么樣呢？它可能會向我們描繪出一個(gè)反烏托邦的未來，在那里人類可憐無助，像牽線木偶一樣被機(jī)器人大腦控制著，正如科幻片子《機(jī)械公敵》描述的一樣。

開發(fā)AlphaGo的是谷歌DeepMind，它原本是一家英國公司，2014年時(shí)被谷歌收購。DeepMind以為電腦會進(jìn)入到一些需要進(jìn)行創(chuàng)造性思索的領(lǐng)域，這預(yù)兆著未來人類和人工智能的關(guān)系會變得更緊張。

很多專家以為要想知道人工智能是否真的具有創(chuàng)造性思維，圍棋是最好的測試工具，由于它依靠直覺、非常復(fù)雜。在其它領(lǐng)域人工智能已經(jīng)超過了人類，包括國際象棋——1997年，IBM的超級計(jì)算機(jī)“深藍(lán)”便打敗了當(dāng)時(shí)國際象棋的世界冠軍卡斯帕羅夫。但在圍棋中，棋子可能的位置數(shù)比宇宙中的原子數(shù)還要多，并且遠(yuǎn)遠(yuǎn)超過國際象棋棋子可能的位置數(shù)——這一領(lǐng)域，仍舊被人類所支配著。

最后一件事情是，你這回可以切身見證這個(gè)歷史時(shí)刻。

據(jù)悉，這次谷歌AlphaGo與李世石的對決將通過YouTube進(jìn)行直播（在DeepMind的官方頻道，其已經(jīng)上傳了與歐洲圍棋冠軍Pan Hui的比賽視頻），據(jù)傳在海內(nèi)也會通過視頻網(wǎng)站和電視進(jìn)行直播。英語解說將由邁克爾·雷德蒙（Michael Redmond）來擔(dān)當(dāng)，其是西方世界唯逐一位達(dá)到最高級別專業(yè)9段的圍棋選手。而韓語解說則為張赫宇（Chang-hyeok Yu），目前其是韓國圍棋國家隊(duì)的主教練。

上一條：如何與高權(quán)重網(wǎng)站進(jìn)行互動(dòng)...

下一條：如何進(jìn)步企業(yè)門戶網(wǎng)站建設(shè)...

做好網(wǎng)站內(nèi)部優(yōu)化讓樞紐詞快速進(jìn)入首頁

雙方都撂狠話：我們必勝！

AlphaGo怎么運(yùn)行的？

是博弈也是試驗(yàn)

雙方都撂狠話：我們必勝！