相對於計算機在國際象棋中的勝利,中國象棋的智能程序進展一直落後。
這倒不是中國象棋要比國際象棋難之類的原因,而是因為棋類智能對於大公司來說畢竟隻是一種公關手段,沒有實際上的營收價值。
“深藍”取得國際象棋的勝利之後,許多人都認為計算機下棋這事已經差不多到頭了,
繼續去搞難度差不多的中國象棋費力不討好,ib也解散了“深藍”團隊。
唯有圍棋確實難度上要高很多,並且很具有挑戰性。
一般人們都認為,計算機要在圍棋中取勝比在國際象棋等遊戲中取勝要困難得多,因為圍棋的棋盤太大,下棋點極多,分支因子遠多於其他遊戲。
並且每次落子對情勢的好壞飄忽不定,天堂地獄就在一瞬之間,技術很成熟之後,人們經常可以觀察到那種一手棋下掉ai係統百分之六七十勝率的情況。
可以說是“一著不慎滿盤皆輸”的最好演繹了。
諸如暴力搜索法、alphabeta剪枝、啟發式搜索的傳統人工智能方法在圍棋中很難奏效。
不過圍棋在西方沒什麼受眾,主要熱度還是在東亞三國,因此很長一段時間內沒有太多人願意花時間在這件事情上,這十幾年的發展速度中規中矩。
deepd投入在這件事情上,很大程度也是機緣巧合。
一方麵許多高層都熱愛棋類,另一方麵可能更加關鍵,deepd的核心成員,兩位首席科學家之一的黃士傑在圍棋智能上有著很深的積澱和情懷。
黃士傑的碩士論文是《計算機圍棋的打劫策略》,博士論文是《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。
相比孟繁岐這種畢業了連本科專業知識都全忘了的人,黃博士可以說專業是非常對口了。
“其實現在的圍棋智能已經有了一定的競爭力。”黃博士為孟繁岐介紹了一下現階段圍棋智能的棋力“差不多最高才在業餘五段左右的水平,如果不讓子的話,和真正的職業選手對弈,毫無勝算。”
基本的圍棋棋力劃分孟繁岐還是大概清楚的,業餘六段大約可以與職業初段水平相比擬。
黃士傑博士本人就是寶島業餘六段,算得上是職業水準守門員了。
倘若自己造出的智能程式能夠穩定占據上風,自己完全下不過的話,基本上象征著圍棋智能來到了真的職業水準。
而不是隻能通過受讓34子這樣的方式擊敗職業棋手。
並且,如果造出來的智能下不過自己,這件事情屬實沒什麼意思。
“你們目前的想法和策略大概是什麼樣的。”大概聊了一些情況之後,孟繁岐將話題切入了具體的算法部分。
從理論上來說,圍棋問題的輸入和孟繁岐非常擅長的圖像類其實很像。
彩色圖片在計算機中的形式就是多通道矩陣,通常為3通道,代表三原色。
比如,一張分辨率為224x224的圖片,就是以三個[224,224]矩陣的形式進行存儲。
一般來說,每個位置的取值在0~255之間。
對於圍棋這個情況來說,它的輸入就像是一個19x19的單通道圖片。
19x19表示棋盤上所有的落子地點,而每個地點的取值就隻有三種狀態,黑,白,無子。
可以用[1,0,1]三個數字來指代。
而圍棋智能的目標,所謂的下棋。
如果不考慮其中原理的話,它的外在反饋其實就是給定這樣一個[19,19]的棋盤,希望程序可以在上麵僅改變一個無子的數字0到給定的棋子類型數字1或者1,同時使得該方獲勝的概率儘可能地變大。