做好網(wǎng)站內(nèi)部優(yōu)化讓樞紐詞快速進(jìn)入首頁 |
發(fā)布時(shí)間:2016-02-08 文章來源: 瀏覽次數(shù):2546 |
決戰(zhàn)之日即將到來。 下周,韓國九段頂尖中國圍棋高手李世石(Lee Se-dol)將與谷歌人工智能項(xiàng)目AlphaGo在首爾四季酒店展開對決,整個(gè)比賽分五輪進(jìn)行(這是你要了解的第一件事)。 賽程:3月9日、3月10日、3月12日、3月13日、3月15日。 規(guī)則:貼目7.5目(向后下棋的選手貼目7.5目)。每位棋手各有兩個(gè)小時(shí)的布局時(shí)間,3次60秒的讀秒。 獎(jiǎng)金:100萬美元;谷歌已經(jīng)表示,假如AlphaGo獲勝,獎(jiǎng)金將捐贈給聯(lián)合國兒童基金會(UNICEF)、STEM教育及圍棋慈善機(jī)構(gòu)(Go Charity)。 P.S. 貼目是圍棋術(shù)語。指黑方因?yàn)橄仁,在布局上?jù)有一定的上風(fēng),為了公平起見,在最后計(jì)算雙方所占地的多少時(shí),黑棋必需扣減一定的目數(shù)或子數(shù)。中國采用的是7.5目的大貼目規(guī)則,日本、韓國則為6.5目。 雙方都撂狠話:我們必勝!第二件事是,到目前為止,雙方都深信自己將贏得勝利。 2月22日,李世石在首爾韓國棋院接受賽前采訪時(shí)說:“誠實(shí)講,Pan Hui和AlphaGo的比賽水準(zhǔn)沒有達(dá)到我與AlphaGo比賽的水平。我聽說AlphaGo一直在進(jìn)級,就在我們談話時(shí)它還在繼承提高,所以說,比擬于10月的比賽,我所面對的挑戰(zhàn)會更大。盡管如斯,我占據(jù)上風(fēng)的事實(shí)是不會改變的。對我而言勝利是一定的,現(xiàn)在只剩下贏得完美不完美的題目了。” 谷歌DeepMind卻表示,人工智能程序有自動(dòng)學(xué)習(xí)的能力。 DeepMind工程總裁Demis Hassabis在2月初曾表示:“實(shí)際上整個(gè)比賽就是我們的Deep Blue時(shí)刻。” Hassabis還說,大多的圍棋玩家都以為李世石將擊敗AlphaGo,Hassabis增補(bǔ)道:“他們以為我們獲勝的機(jī)率只有5%……但我們的系統(tǒng)提高很快,這點(diǎn)是他們沒有意識到的。就在我們談話時(shí),它正在提高。” 對于Hassabis而言,AlphaGo項(xiàng)目的意義并不僅僅只是打敗世界級的圍棋選手。開發(fā)AlphaGo程序的方法可以應(yīng)用在其它人工智能項(xiàng)目中,包括無人駕駛汽車、類人虛擬助手。“我們以為人工智能正在為這些題目提前解決一個(gè)元題目。”Hassabis說。 AlphaGo怎么運(yùn)行的?這是第三件事。 很多人很好奇,到底是什么讓AlphaGo變得如斯成功?豈非其它人工智能就失敗了嗎? “傳統(tǒng)搜索樹會考慮所有可能性,但它用在圍棋上行不通。” Hassabis說。正因如斯,谷歌DeepMind團(tuán)隊(duì)才用兩套神經(jīng)網(wǎng)絡(luò)為AlphaGo開發(fā)了一個(gè)全新的系統(tǒng)。我們可以將圍棋視為一個(gè)包涵所有可能性的樹,它能夠無窮延伸。AlphaGo要做的就是利用兩套神經(jīng)網(wǎng)絡(luò)來縮小可能性。它會利用策略網(wǎng)絡(luò)來判定什么行為可能性最高,系統(tǒng)應(yīng)該考慮怎么走好下一步。AlphaGo會將搜索樹的寬度變窄。還有一個(gè)就是價(jià)值網(wǎng)絡(luò),它告訴AlphaGo怎么移動(dòng)對白子和黑子都更好,這樣就可以降低可能性的深度。 在步履之前,Deep Blue超級電腦要考慮大約200萬步,AlphaGo卻只需要考慮10萬步。機(jī)器比人類專業(yè)選手考慮得遠(yuǎn),人類只能向前看1000步。DeepMind分別對兩套神經(jīng)網(wǎng)絡(luò)進(jìn)行練習(xí)。 策略網(wǎng)絡(luò)可以模仿職業(yè)圍棋選手下棋,然后讓電腦下棋1300萬次來改進(jìn)系統(tǒng)。終極。DeepMind會從每一個(gè)集合中挑選黑子或者白子的一邊,從而組建一個(gè)新的數(shù)據(jù)集。接下來價(jià)值網(wǎng)絡(luò)上場,DeepMind會利用好數(shù)據(jù)集,讓它來決定棋局中每一個(gè)位置上誰會獲勝。由此開始,DeepMind團(tuán)隊(duì)會將兩個(gè)網(wǎng)絡(luò)結(jié)合,用Monte Carlo樹搜索來搭建終極的AlphaGo。“AlphaGo就是一個(gè)系統(tǒng),它可以自己學(xué)習(xí),然后將學(xué)到的東西寫成算法。事實(shí)上,它跟人類學(xué)習(xí)和下圍棋很接近。”Hassabis解釋說。 有些高深莫測?實(shí)在,你可以以為AlphaGo就是一個(gè)實(shí)驗(yàn),它不是編程程序,事實(shí)上連AlphaGo和它的自己創(chuàng)造者都無法解釋其是如何下棋的,但它卻是擁有了這種能力——或許這是一種直覺,通過不自覺的推理得到知識——到現(xiàn)在為止,我們普遍以為這是屬于人類的特權(quán),就如牛頓在其《天然哲學(xué)的數(shù)學(xué)原理》第二版中序言中所寫到,“我不做假設(shè),我只是知道。” P.P.S. 關(guān)于AlphaGo的演示視頻我們沒找到,但我們找到了一個(gè)Facebook類似項(xiàng)目的。盡管沒有谷歌的NB,但憑借11萬次的運(yùn)算,其在聞名的籠蓋全球的網(wǎng)絡(luò)圍棋社區(qū)KGS的年度比賽中拿到了第三名。 人工智能下棋,大概就是以下這個(gè)視頻中展示的樣子: 是博弈也是試驗(yàn)我們需要思索的更多一些,這是第四件事情。 人工智能是否能夠擊敗人類大腦?這個(gè)題目已經(jīng)爭論良久了,不論圍棋大戰(zhàn)誰勝誰負(fù),它都將為題目的謎底奠定基礎(chǔ)。 假如李世石獲勝,某些人可以輕松地長舒一口吻了,由于他們之前曾擔(dān)心人工智能會入侵到人類占據(jù)統(tǒng)治地位的一些領(lǐng)域中去。假如AlphaGo獲勝會怎么樣呢?它可能會向我們描繪出一個(gè)反烏托邦的未來,在那里人類可憐無助,像牽線木偶一樣被機(jī)器人大腦控制著,正如科幻片子《機(jī)械公敵》描述的一樣。 開發(fā)AlphaGo的是谷歌DeepMind,它原本是一家英國公司,2014年時(shí)被谷歌收購。DeepMind以為電腦會進(jìn)入到一些需要進(jìn)行創(chuàng)造性思索的領(lǐng)域,這預(yù)兆著未來人類和人工智能的關(guān)系會變得更緊張。 很多專家以為要想知道人工智能是否真的具有創(chuàng)造性思維,圍棋是最好的測試工具,由于它依靠直覺、非常復(fù)雜。在其它領(lǐng)域人工智能已經(jīng)超過了人類,包括國際象棋——1997年,IBM的超級計(jì)算機(jī)“深藍(lán)”便打敗了當(dāng)時(shí)國際象棋的世界冠軍卡斯帕羅夫。但在圍棋中,棋子可能的位置數(shù)比宇宙中的原子數(shù)還要多,并且遠(yuǎn)遠(yuǎn)超過國際象棋棋子可能的位置數(shù)——這一領(lǐng)域,仍舊被人類所支配著。 最后一件事情是,你這回可以切身見證這個(gè)歷史時(shí)刻。 據(jù)悉,這次谷歌AlphaGo與李世石的對決將通過YouTube進(jìn)行直播(在DeepMind的官方頻道,其已經(jīng)上傳了與歐洲圍棋冠軍Pan Hui的比賽視頻),據(jù)傳在海內(nèi)也會通過視頻網(wǎng)站和電視進(jìn)行直播。英語解說將由邁克爾·雷德蒙(Michael Redmond)來擔(dān)當(dāng),其是西方世界唯逐一位達(dá)到最高級別專業(yè)9段的圍棋選手。而韓語解說則為張赫宇(Chang-hyeok Yu),目前其是韓國圍棋國家隊(duì)的主教練。 |
|