在其中最為炫酷的一個名稱,就是相關學科背景當中的這個所謂【人類基因組計劃】,一聽就非常不得了。
這是一項跨國跨學科的科學探索工程,為了測定組成人類染色體中所包含的30億個堿基對組成的核苷酸序列,從而繪製人類基因組圖譜,並且辨識其載有的基因及其序列,達到破譯人類遺傳信息的最終目的。
單說這個工程,普通人的感觸可能還不夠直觀,但若是提到與其並列三大科學計劃的其他兩個,曼哈頓原子彈計劃和阿波羅登月計劃
對比一下造原子彈,以及登上月球這兩件更加直觀的超級大事件。
其價值、地位和對人類的重要意義就不言而喻了。
“從1985年至101novel.com03年,接近二十年的時間,這一項三十億美元預算的人類基因測序計劃基本完成。從化學的角度去簡單理解,蛋白質也不過是根據基因編碼而成的肽鏈,是一串或幾串氨基酸殘基而已。”
“但是問題就出在這個地方,知道蛋白質的化學信息並不能告訴我們它的生物學功能到底是什麼,它到底象征什麼功能,我們又應當如何去應對?這幾件事之間還有著很大的鴻溝。也就是說,雖然已經測定了化學信息,但我們對於這些基因在生理上到底會有什麼功能其實仍舊一無所知。”
“這是因為蛋白質的肽鏈會折疊,在空間中形成奇異的結構。人類基因組計劃測序的時候,不論測量什麼基因,其本質是差不多相同的任務類型。但在蛋白質當中,目前並沒有什麼發現什麼辦法能夠適用於大部分蛋白質,麵對不同的蛋白質很可能需要更換方法,這也是為什麼我們人類的蛋白質數據庫每年增長的速度大約隻有一萬左右的主要原因。”
一是方法並不通用,二是有用這些方法也不是特彆的方便,所需的設備和操作手法有很高的門檻,並且非常耗時。
“但現在,我們有了阿爾法fold,這個數據庫涵蓋了整個蛋白質宇宙,我們已經邁入數字生物學的全新時代!在未來,預測蛋白質結構就如同使用搜索引擎一樣簡單,它將幾乎涵蓋了地球上所有已進行過基因組測序的生物體。”
阿爾法fold與圍棋這種一下子就能夠被理解的事情區彆不小,節目當中主持人花費了不少的時間和精力在介紹這個任務的背景、難點還有意義。
不過在結尾處的總結和吹捧稍微有些用力過猛,孟繁岐不得不切入進來稍微解釋一下。
“人工智能畢竟還是數據驅動的一種新技術,目前阿爾法fold是基於已有的十幾萬測定結果去構造人工智能模型,我們已經對二十多種模式的生物進行了嘗試。”
“由於ai技術是從已知的數據當中學習規律,所以針對從未出現過的結構和現象,那可能阿爾法fold是沒有辦法預測的。就像是在加減法的題目上學出來的ai很難自己掌握乘除法一樣。ai或許可以總結出一些新的東西,但絕不可能總結出所有未出現的知識內容,那樣的難度實在太高了。”
“我們計劃在今年年底公布人類的全蛋白質結構,這個大概是百萬千萬的級彆。未來的兩到三年之內,我們公布2億多條全生物預測結果,所有曾經被人類測序的蛋白質,我們都會去一一做預測。根據目前的統計結果,大約有百分之35左右會是高度準確的。”
孟繁岐實話實說,基於人類已有的十七八萬去預測兩個億,當然不可能做到基本全部準確。
這裡他說的高準確度,是指基本上超過百分之999的符合程度。唯有這個級彆的預測結果,才能夠如同大家所想的那樣,完全取代目前的測量方式。
餘下的,多多少少還是會有一些誤差,能用,但需要科研人員自己謹慎判斷。
不過,百分之35已經是非常優秀的高精確度比例了。這意味著兩個多億當中,至少能有七千多萬條結果是和實際情況基本上沒有差彆的。
相比現在人類已經掌握的數量,十幾萬來說,這仍舊是幾百上千倍的進步。
“孟,你實在是太謙虛了,即便是三成左右的高精確度比例,人類按目前的速度也得需要七千年才能得到這些結果。可現在,兩三年之內我們就能做到。”
孟繁岐的解釋並沒有讓主持人和現場的聽眾失去熱情,這兩個數字實在是天差地彆。
幾十年下來,全人類才積攢下來不到二十萬條高質量的蛋白質結構。
現在你兩三年就能預測出七八千萬,結果還嫌這準確率太低?
本小章還未完,請點擊下一頁後麵精彩內容!
“也不能說是謙虛,我隻是希望大家可以知曉事實吧。畢竟人工智能的能力一旦被高估其實也是相當危險的一件事情。我不希望大家認為阿爾法fold已經可以精確地解決一切,它目前仍舊還是被極大的限製了。”
“目前呢,我們已經和歐洲分子生物學實驗室合作,公開了人類蛋白質組內的全部能預測的蛋白質結構,並免費開放給了學術界。一直以來,我的目標都是將人工智能作為工具,以加速科學的發現,進而增加人類對世界的理解。”
“阿爾法fold之所以登陸上了《自然》雜誌的封麵,便是因為我們獲得了一副迄今最全、最準的人類蛋白質組的圖像。我們相信這是目前為止人工智能對促進科學進步做出的最重要的貢獻,極好地展示了人工智能將如何造福社會。”
孟繁岐這番話沒有貶低此前的其他人工智能成果,也沒有刻意去抬高阿爾法fold的意義。
而是事實的確如此,光是對比一下點評發聲的那些人物就能夠明白了。
此前,往往是人工智能界,或者計算機領域的學者做出的點評為主,成果所涉及的學科領域為輔。
此次,ai領域的不少大佬想說話都已經有點插不上嘴了。
因為生物和化學方麵的大佬們站出來講話的實在太多,咖位上實在差了不少。彆的不說,光是諾獎得主就有四五個。
比如保羅,101novel.com01年諾貝爾生理學醫學獎得主“計算方法正在改變科學研究,為有益於公共利益的發現和應用開辟新的可能性。了解蛋白質的功能對於提高我們對生命的認識至關重要,並將最終導致醫療保健、糧食可持續性、新技術等等方麵的改進。孟繁岐主導開放了免費的阿爾法fold數據庫,這是生物學的一個重大飛躍。孟繁岐的慷慨開創了人工智能生物的新紀元。”
比如文卡特拉曼,101novel.com09年諾貝爾化學獎得主,英國皇家科學會主席“蛋白質折疊問題是生物學50年來的重大挑戰,這項計算工作代表了對該問題研究的驚人進展。這個巨大的難題被孟繁岐以這樣的方式解決,實在出乎了我們許多業內人士的預料。不過看到阿爾法fold從根本上改變了生物學的研究,我們感到十分振奮。”
再比如伊麗莎白,101novel.com09年諾貝爾生理學醫學獎得主“孟繁岐和ebl給了世界絕佳的資源,徹底改變了我們進行結構生物學的方式。這些預測展示了機器學習的力量,並服務於全世界的科學機構。這是一個開創性的例證21世紀應該如何開展科學研究。”
多個諾獎得主級彆的學者大加讚賞,令孟繁岐一時間風頭無兩,畢竟這些學界泰鬥平日裡一般人見都見不到半個。
“被你這麼一說,我大概明白《自然》雜誌封麵的含義了!”主持人此前還在疑惑,為何自然雜誌要用化學物質,一堆鏈條一樣的東西組成一個人形的圖案作為封麵。
孟繁岐這麼一說他才明白,原來這篇文章被選做《自然》封麵的主要原因,便是因為阿爾法fold已經完成了人類絕大多數蛋白質結構的分析工作。
封麵的設計思路也源自於此。
喜歡重生之ai教父請大家收藏101novel.com重生之ai教父101novel.com更新速度全網最快。