專(zhuān)業(yè)醬油男 發(fā)表于 2016-3-15 11:58
人腦的運(yùn)算能力和分析能力目前情況下是遠(yuǎn)遠(yuǎn)比不過(guò)電腦滴,打個(gè)比方,人類(lèi)可以算到后50步棋,而電腦可以很輕 ...
計(jì)算圍棋是個(gè)極其復(fù)雜的問(wèn)題,比國(guó)際象棋要困難得多。圍棋最大有3361 種局面,大致的體量是10170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才1080。國(guó)際象棋最大只有2155種局面,稱(chēng)為香農(nóng)數(shù),大致是1047。
面對(duì)任何棋類(lèi),一種直觀又偷懶的思路是暴力列舉所有能贏的方案,這些方案會(huì)形成一個(gè)樹(shù)形地圖。AI只要根據(jù)這個(gè)地圖下棋就能永遠(yuǎn)勝利。然而,圍棋一盤(pán)大約要下150步,每一步有250種可選的下法,所以粗略來(lái)說(shuō),要是AI用暴力列舉所有情況的方式,圍棋需要計(jì)算250150種情況,大致是10360。相對(duì)的,國(guó)際象棋每盤(pán)大約80步,每一步有35種可選下法,所以只要算3580種情況,大概是10124。無(wú)論如何,枚舉所有情況的方法不可行。
如何實(shí)現(xiàn)深度學(xué)習(xí)?百度深度研究院資深專(zhuān)家介紹,AlphaGo構(gòu) 建了“兩個(gè)大腦”,一個(gè)是輸入了3000萬(wàn)盤(pán)人類(lèi)頂級(jí)棋手對(duì)弈數(shù)據(jù),通過(guò)“自我對(duì)戰(zhàn)”來(lái)進(jìn)行增強(qiáng)學(xué)習(xí),改善此前的決策網(wǎng)絡(luò),另一個(gè)則是通過(guò)價(jià)值網(wǎng)絡(luò)來(lái)進(jìn)行 整體局面判斷,以決策網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)來(lái)協(xié)作決定落子位置。
也就是說(shuō),AlphaGo的技術(shù)架構(gòu)采用的是模仿人類(lèi)大腦神經(jīng)模式,而不再單單依靠機(jī)器的蠻力“強(qiáng)記”,通過(guò)深度學(xué)習(xí)把人工神經(jīng)網(wǎng)絡(luò)的層級(jí)大大增加,提升了計(jì)算能力。
第四場(chǎng)比賽結(jié)束后,DeepMind創(chuàng)始人哈薩比斯(Demis Hassabis)指出,在李世石白78“神之一手”后,AlphaGo79誤以為勝率達(dá)到70%,直到第87手才反應(yīng)過(guò)來(lái)。"歡迎光臨 機(jī)械社區(qū) (http://www.whclglass.com.cn/) | Powered by Discuz! X3.5 |