除了AlphaGo以4∶1戰(zhàn)勝了李世石,近年來(lái),類似的例子還有不少。例如,IBM公司的Watson程序在問(wèn)答比賽中戰(zhàn)勝了人類冠軍、計(jì)算機(jī)會(huì)寫新聞稿和賦詩(shī)、自動(dòng)駕駛、所謂用意念控制無(wú)人機(jī)等。由此似乎可以得出結(jié)論,人工智能的時(shí)代真的開始了,世界將面臨被機(jī)器接管的風(fēng)險(xiǎn)。
我們?cè)诮邮苓@些突破之前有必要探究一下隱藏在背后的技術(shù)實(shí)質(zhì)。例如,Watson是基于文本匹配的檢索,沒有多少推理的成分;賦詩(shī)程序是效仿標(biāo)注格式的充填,需要人工篩選結(jié)果;自動(dòng)駕駛所依賴的附加設(shè)備價(jià)值超過(guò)車輛本身好幾倍,且對(duì)環(huán)境敏感;所謂意念只不過(guò)是分離出來(lái)的腦電信號(hào),對(duì)它的分類結(jié)果在可靠性、穩(wěn)定性和可重復(fù)性上都很差。
AlphaGo下棋程序在人工智能領(lǐng)域?qū)儆谟?jì)算機(jī)博弈這一研究分支,那么,它究竟難不難實(shí)現(xiàn)呢?雙人博弈下棋游戲開展得非常早,屬于人工智能少數(shù)幾個(gè)鼻祖級(jí)的研究對(duì)象之一。例如,上??萍拣^有一個(gè)下五子棋的機(jī)器;1997年IBM公司開發(fā)出了國(guó)際象棋程序;2008年的西洋跳棋程序更是達(dá)到了人不犯錯(cuò)就只能與它下平手的水平??梢姡斯ぶ悄軐W(xué)者在這一領(lǐng)域已經(jīng)深耕了很多年。
所有這些雙人博弈游戲都有三個(gè)共同特點(diǎn):第一,游戲規(guī)則非常明確;第二,棋局布局很清晰且很規(guī)整;第三,棋盤空間很有限。這些看似不重要的特點(diǎn)對(duì)計(jì)算機(jī)程序、對(duì)人工智能來(lái)說(shuō)卻是極端重要的利好。因?yàn)檎沁@些規(guī)則性、規(guī)范性和有限性,使得看似復(fù)雜的下棋問(wèn)題在計(jì)算機(jī)上變得非常可行,如此明確的計(jì)算對(duì)象恰是計(jì)算機(jī)編程能夠如魚得水的理想環(huán)境。所以,計(jì)算機(jī)下棋不但不是挑戰(zhàn),反而遠(yuǎn)比自然語(yǔ)言理解、場(chǎng)景理解、不確定性推理等任務(wù)要容易研究得多,否則它就不會(huì)在人工智能誕生的一開始(20世紀(jì)50年代)就成為我們的研究對(duì)象之一。
在技術(shù)實(shí)現(xiàn)上,人工智能下棋程序通常使用一種被稱之為“狀態(tài)空間搜索”的方法,其核心思想是:第一,把棋局的演化過(guò)程看成一個(gè)個(gè)狀態(tài),用某種數(shù)學(xué)形式進(jìn)行記錄;第二,由下棋法則規(guī)定的走步方法可以把這些狀態(tài)串聯(lián)起來(lái),形成一張非常龐大的狀態(tài)演化網(wǎng)絡(luò);第三,用搜索的辦法在網(wǎng)絡(luò)中找出對(duì)自己有利的走步策略。這種方法由于形式化程度高,因此非常適合在計(jì)算機(jī)上編程實(shí)現(xiàn)。當(dāng)然,這也帶來(lái)了存儲(chǔ)空間和搜索效率的問(wèn)題。實(shí)際上,我們往往會(huì)利用一些有價(jià)值的信息來(lái)引導(dǎo)搜索的方向,如我們“歧路尋羊”時(shí)會(huì)利用羊留在路上的蹄印或留在草上的牙印來(lái)篩選跟蹤路徑。這次AlphaGo下圍棋同樣會(huì)面臨這樣的問(wèn)題。它利用機(jī)器學(xué)習(xí)技術(shù),從大量現(xiàn)成的對(duì)弈中學(xué)到了兩樣至關(guān)重要的東西,一是如何由當(dāng)前的棋局映射出若干應(yīng)子對(duì)策,二是如何對(duì)應(yīng)子后的布局進(jìn)行利己性打分。前者使它能夠快速找到應(yīng)對(duì)走步,后者使它能夠快速對(duì)不同走步的好壞進(jìn)行判斷。這樣就避免了它在龐大到超乎想象的圍棋狀態(tài)空間(理論上總共有3361個(gè)狀態(tài))中進(jìn)行窮舉搜索,只需進(jìn)行小范圍的有限搜索即可,其中所謂機(jī)器學(xué)習(xí)過(guò)程就是從大量以往的對(duì)弈棋譜中建立當(dāng)前布局與下一步走步之間的對(duì)應(yīng)關(guān)系。AlphaGo所基于的搜索技術(shù)和機(jī)器學(xué)習(xí)技術(shù)其實(shí)都是現(xiàn)成的,但它在對(duì)棋局模式的刻畫方式和如何對(duì)棋局好壞進(jìn)行評(píng)價(jià)方面還是有創(chuàng)新性的。尤其是它對(duì)圍棋布局的數(shù)學(xué)化表征方式,這直接影響到機(jī)器學(xué)習(xí)的效率和能否最終找出布局與走步之間的關(guān)聯(lián)關(guān)系。
AlphaGo的成功更像是人工智能領(lǐng)域中基于實(shí)例的推理研究,也就是針對(duì)當(dāng)前面臨的問(wèn)題去尋找以往經(jīng)歷過(guò)的一個(gè)或幾個(gè)類似的問(wèn)題,把當(dāng)時(shí)的解決方案拿來(lái)做一點(diǎn)適應(yīng)性修改后應(yīng)用到新問(wèn)題上去。當(dāng)套用到下圍棋這個(gè)需求上時(shí),這個(gè)基于實(shí)例的推理過(guò)程就可以簡(jiǎn)化為當(dāng)前棋局布局與以往某個(gè)布局間的相似性匹配和走步方法類推。因此,我們可以說(shuō)谷歌公司用一種非常恰當(dāng)?shù)募夹g(shù)解決了一個(gè)非常有顯示度的問(wèn)題。但是據(jù)此說(shuō)這個(gè)圍棋程序能夠“學(xué)習(xí)”和“創(chuàng)新”還是值得商榷的,因?yàn)樗鼘?shí)現(xiàn)的實(shí)質(zhì)上是同一范疇下的類比。它進(jìn)行走步?jīng)Q策時(shí)完全不理解人類棋手那些“金角銀邊草肚皮”之類的下棋原則,也不需要懂什么叫“實(shí)地”,只是把下圍棋當(dāng)作了一個(gè)由一種布局模式推演到另一種布局模式的過(guò)程,只知其然而不知其所以然。我們甚至不能認(rèn)為這是一種智力,充其量是一種強(qiáng)悍的細(xì)分記憶力。
人類圍棋下輸了,那么人類智能就此崩塌了嗎?其實(shí)人類智能的強(qiáng)項(xiàng)可能不在下圍棋這種只有極少數(shù)人才能達(dá)到高水平的項(xiàng)目上,而在那些應(yīng)付不可預(yù)期的能力上面。例如下圖,它顯示了一種包裝雞蛋的方式。
已有0人發(fā)表了評(píng)論