專屬客服號
微信訂閱號
全面提升數據價值
賦能業務提質增效
【產業鏈圖譜 | 人工智能產業鏈圖譜_人工智能產業鏈全景圖】
人工智能的產品已經滲透到了生活的方方面面,現在的人工智能已經不同于最初的電腦,在海量的數據處理和分析數據方面都有了新突破。人工智能戰勝圍棋就是一個很好的說明。
在福建福州舉行的第一屆“吳清源杯”世界女子圍棋賽暨“貝瑞基因”杯2018年世界人工智能大賽上,柯潔與國產星陣圍棋的第三次“人機大戰”再次吸引大眾眼球。結果不是大家期待的反轉,柯潔最后還是敗下陣來,145手選擇投子認輸。
星陣圍棋與AlphaGo一樣有著可怕的戰績,與柯潔對戰前,從16日開始星陣便與職業棋手進行了讓先三十番棋。在總共30次的交鋒中,星陣取得了28勝2負的戰績,勝率為93.3%。
人工智能和圍棋比賽具有代表性
因為規則是固定的,每步棋子可能性是有限的,下棋的能力有分數可以評估,還有人類的對手可以和程序對壘,所以研究人工智能的先鋒們總是把棋牌游戲當做是人工智能測試的最完美方式。
圍棋盤由19條橫線和19條豎線組成,共有19×19=361個交叉點。此外,也有13×13、9×9的小棋盤。圍棋子分為黑白兩色,對弈雙方各執一種顏色的棋子,輪流將一枚棋子下在交叉點上。終局時,占領(圍起)的“地盤”(即其中的交叉點個數)多的一方獲勝。
空白的交叉點稱為“目”,圍到的地盤又稱為“空”。對弈過程中,棋手經常會“數目”,也就是計算雙方目前所圍的“空”的大小,以此判斷形勢優劣。
對弈雙方的水平差距較大時,常會采用讓子棋的方式,也就是水平較弱的一方先在棋盤的固定位置放上1~9個子(分別稱為讓先、讓二子、讓三子……),然后雙方再輪流落子。
因此圍棋被看作是對計算機最有挑戰的一種比賽。
人工智能為什么可以戰勝圍棋
1,人工智能之前的下棋方法
其實在人工智能以前,電腦下棋的方式其實很簡單,就是利用強大的計算能力,在規定的時間內盡可能多的窮舉接下來可能的下法,并對每種下法的局面進行評估,然后選擇對自己最有利的方式。據說當年的深藍能準確計算12步以內的走法,而卡斯帕羅夫只能預測10步。
上面的描述雖然看起來簡單,但是實際上也需要很多的專業方法來解決問題,比如:
A*(A-star)算法:在所有的下法中,搜索最好的下法的方法;
價值評估函數:量化局面好壞的方法,也就是說給棋盤形勢打分;
AlphaBeta剪枝:根據打分,減少搜索空間可能性的方法。
“暴力”下棋方法對國際象棋是有效的,可是對圍棋就無能為力了。這是因為國際象棋平均每步有35種走法,最終局面有10^46種,而圍棋平均每步有120種,最終局面有10^172種。圍棋的變化數目遠遠多于國際象棋的變化數目,而且國際象棋存在在“很多情況”下可以既快速又相對準確地對盤面進行靜態評估的方法,但是在圍棋中并不存在。因此在窮舉所有可能的情況下,計算機在國際象棋中會比較容易的判斷出哪個局面是優勢明顯的,而在圍棋中卻幾乎不可能。
2,人工智能獨特的下棋方式
為什么人工智能能夠在圍棋對弈中取得突破呢?因為它另辟蹊徑,采用了與“暴力”下棋不同的方式。人工智能采用的是深度學習的技術。
人工智能通過兩個全聯接的13層神經網絡合作來下棋:一個是策略網絡(Policy Network),一個是價值網絡。
策略網絡負責選擇下一步的走法,價值網絡負責評估盤面的優劣。策略網絡能夠學習人類高手的棋局(目前已經學習了上百萬盤KGS上人類高手之間的對弈),這種學習是為了習得人類高手對棋局的判斷能力,即在不同情況下,人類高手是如何選擇下一步的。策略網絡還能夠通過強化學習的方式,自我海量下棋,不斷優化修正習得的人類棋法。為了加快下棋速度,人工智能還能夠學習在不觀察整體局面的情況下,從局部選擇最佳落子點的方式。
價值網絡則是通過兩個最強的策略網絡之間的海量對局,學習出如何評估當前局勢的好壞。
在對弈的時候,策略網絡選擇出所有可能的落子點,然后利用蒙特卡洛樹搜索方法展開對弈并評估哪種下法更加值得深入探索。接著價值網絡會評估每種走法的形勢并對策略網絡進行建議。最后由兩個網絡共同確定最終的落子位置。
不可否認,人機大戰對人工智能的發展起到了很大推動作用。李開復認為AlphaGo運用的最新深度學習算法,是人工智能領域特別大的突破。雖然圍棋的復雜度非常高,但畢竟是理論上有解的問題。當計算變成了開放性問題,不是非黑即白的輸贏問題,才會是人工智能的真正挑戰。以汽車行業為例,當無人駕駛中面對天氣、路面突發狀況等問題時,計算會變得無比復雜。
人工智能戰勝圍棋是科技的一大進步,這代表著先進科技能夠學習一些人類的思考方式,而在人工智能戰勝圍棋這件事情背后,人工智能的發展方向也會得到更多人的重視。
本文由五度數科整理,轉載請標明出處,違者必究!
請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務
評論