作為非常基本非常基礎的身體單元,蛋白質的結構不同,自然就會使得它的功能不同。
而這種解析,可從來都不是什麼容易的事情。
什麼非常高大上的x射線晶體衍射,冷凍電鏡一起上,需要海量的時間和金錢不說,解析的效率也不高。
幾十年過去了,目前解析出來的比例大約也隻在三分之一左右。
想要這樣把人類的蛋白質全解析完,那可要了老命了。
到底為什麼這個難題如此困難如此棘手,主要是因為,人們需要去預測的是蛋白質的空間結構。
這東西它是3d的。
讓人工智能協助分析成為可能的,是蛋白質的一種特性,那就是六十年前的一個發現,也就是安芬森法則蛋白質的一級結構會決定他的三維空間結構。
這讓蛋白質結構的分析問題成為了一個人工智能非常擅長的任務,就是從一種蛋白質的氨基酸序列去猜測這種蛋白質的空間結構長什麼樣子。
小主,這個章節後麵還有哦,請點擊下一頁繼續後麵更精彩!
也就是所謂的蛋白質折疊問題。
這下聽起來就容易了不少,因為人類的蛋白質氨基酸排列我們已經全部知曉了,那就開推唄!
但進入三維結構,百來個氨基酸至少能有10的三百次方可能,這個問題比圍棋的可能性稍微好點,但也夠要命的。
因為圍棋你隻要贏了對麵的臭棋簍子就行,窮不窮舉不是目的。
但現在,你可是要找出那個唯一結構的,這個可必須找對了才有意義。
這個問題從安芬森法則提出以來,四十年都沒什麼大的突破,因而從1994年開始,就有人在舉辦一個名叫casp的蛋白質結構預測比賽,兩年一屆。
今年14年是第十一屆了。
比賽開始前,主辦方會收集百個左右最新實驗測定成功的新蛋白質,這些內容外界基本上絕無可能知曉分毫。
把這些新內容作為比賽的內容,交給參賽者們去預測。
最後,根據預測的結果和實驗測得的相似度,看誰的預測更加貼近真實實驗觀測到的。
這個相似分數要到達90以上,這種預測才稱得上是像樣的答案。
可目前,這個賽事的最好結果普遍還在60左右。
而阿爾法fold和阿爾法fold2的結果則高達70多與恐怖的92左右。
相似度超過92,意味著與原本實驗室測定的誤差可能也就隻有一兩個原子的區彆了。
屬於是測定誤差的範圍之內,這種情況下,究竟誰才是正確的,都沒有人可以確定。
這樣偉大的研究前世被開源,孟繁岐也仔細研讀過。主要結構沒有那麼複雜,做出來問題不大。
如今他唯一的擔憂隻是自己的複現結果距離92會有多少的差距,畢竟現在的數據差了六七年,這是個不小的劣勢。
喜歡重生之ai教父請大家收藏101novel.com重生之ai教父101novel.com更新速度全網最快。