第39章 深海藏金(2)_女神股市搞錢傳_思兔 
思兔 > 都市言情 > 女神股市搞錢傳 > 第39章 深海藏金(2)

第39章 深海藏金(2)(1 / 2)

然後遊戲規定:吃到豆子得10分,移動位置分數不變,執行吃豆的動作,但是格子裡沒有豆子,減1分,撞牆了減5分。限製吃豆人總共能做101novel.com0次動作。理論上最高得分就是在不扣分的情況下把豆子全部吃掉,有50個豆子,最高得分就是500分。

吃豆人能觀察到的,是前後左右和自己所在格子的狀態。所以一共是5個格,每個格子有三種狀態,總的狀態數就是3的5次方,就是243種狀態,然後再除去一些地圖中不存在的狀態;如三麵是牆,左右是牆,最後共剩下128種狀態。

那麼在這個遊戲中,我們怎樣才能獲得最高分呢?

如果采取最傳統的方法,就是每種狀態都試試,用窮舉法列出所有可能性,然後再進行對比,找出得分最高的一組策略模式。

但是,如果要采取這種傳統方法,那麼總共要涉及到7128種策略組合,如果把每個生成的策略組合都去試試看得分多少的話,把這些策略都執行完,至少需要159億年,這和宇宙大爆炸到現在的時間幾乎差不多。

所以這是個計算量遠遠超過全球算力加和的計算任務。所以想要通過窮舉法去計算,這個問題是無解的;

那麼能不能用神經網絡的算法來進行計算呢?當然可以,但是問題和使用窮舉法一樣,算力需要遠遠大於全球算力。

另外,由於豆子的出現是隨機的,每一局豆子出現的位置並不是固定的,所以他們之間的關係是非線性的。

而神經網絡模型卻很難處理這樣的非線性問題。比如模型用曆史數據學習了很久,終於發現了一些規律,然後新的遊戲開局,模型用這些規律去玩遊戲,但卻發現新的遊戲中,這些規律變了。過去學習總結出的規律,幾乎派不上太多用場了。對於這種尷尬的問題,基於神經網絡隻能用概率的猜測進行決策。

而這樣的效果往往並不是很理想,甚至在最開始的階段,其概率比人為主觀判斷低了很多很多。

……

但是遺傳進化算法可以從另一個思路解決這個問題。

這種算法直接從策略規則自身開始入手;比如人為的設計甚至是隨機生成100個策略,讓每種策略都進行1000場吃豆挑戰賽。

每場比賽讓吃豆人行動101novel.com0次,在1000場挑戰賽中,每場比賽的50個豆子都是隨機撒下的。最後評估在這1000場挑戰賽中,平均每走101novel.com0步,得到的分數是多少;

根據得分的高低從101novel.com0個策略裡隨機選出2個策略,得分越高被選中的概率越高。然後用所選中的2個策略,生成出一個新的策略,新的策略的每一列有一半概率使用第一個策略的對應列,一半概率使用第二個策略的對應列。在生成新策略的過程中,會有小概率產生策略的變異;

用這種優勝劣汰、自然選擇的方法不斷生成新策略;用新生成的策略進行比賽,再按照分數再生成下一代的策略;

把每條吃豆策略進行數學編碼後,可以將這些策略看成基因一樣,重組生成下一代的過程,其實就是編碼的一部分相互交叉替代,就有點像染色體的分裂和組合。

第一代成績較高的吃豆人,就有更高的幾率留下後代,後代還遺傳了上一代的策略。得分低的也有幾率生成後代,隻是沒有得分高的概率高。在生成下一代的過程中,下一代的策略還有非常低的幾率產生遺傳變異,有的策略位會隨機變成其他數。

這就是遺傳算法的基本原理,直接對原始的隨機策略進行編碼,然後讓特定區域的編碼來回交叉迭代,產生新一代的策略,然後再繼續進行編碼的交叉與變異迭代……下一代遺傳了上一代的優點,也變異出了新一代的特點……就這樣一代一代的進行下去;直到獲得最高的分數。

……

在這個遊戲中,計算機大約進來了1000多次迭代的時候,遊戲分數達到了497分,這離滿分500分僅僅差了三分,而且之後的遊戲中,計算機的得分幾乎穩定在了493——497分的區間。

而作為對照組,很多數學家、計算機專家、遊戲高手也在靠著自己的經驗與邏輯去玩這個遊戲,大約1000個玩遊戲的高手與高智商的人類,每人玩了大約101novel.com0局,最終最高得分為431分,而且僅有一次;人類的精英代表平均得分僅為351分。

……

計算機利用遺傳算法得到的策略,是人類所不能比擬的。尤其是在非線性的複雜係統中,遺傳算法最後執行的很多策略,人們怎麼也看不懂,邏輯上完全無法理解。但就是這樣看上去很詭異的策略,卻在最終變成了神來之筆,在遊戲終止後,人們才恍然大悟。

而且從計算機得分的軌跡來看,更加的平滑,更加的連續…而人類對照組在遊戲中的得分軌跡,則呈現出明顯的波動性與隨機性。

這個就是用計算機來模擬進化過程的研究,它逐漸掀起了進化論的主流觀點的改變,這種遺傳算法將突變式的進化用計算機模擬出來了。

小主,這個章節後麵還有哦,請點擊下一頁繼續後麵更精彩!



最新小说: 東周列國誌注釋白話文 絕色美人眼一紅,海島軍區全慌了 今天感化反派成功了嗎 我在永不磨滅的番號當政委 重生1958:發家致富從南鑼鼓巷開始秦大寶陸秀娥 逆流龍魂 快穿:為了任務 開局,楊過之女名思芙 重生:求前妻換個人霍霍吧! 當十八號女配放棄算命之後