宋河順手開了一個新程序,按伊雷馬實驗室數據,同步複現藥物預測流程。
彆人做的成果,他不敢全盤接收,還是親自上手驗證一下穩妥!
首先是經典的ddis預測,即藥物藥物相互作用,探討病人短時間服用多種藥物後,產生的複合效應。
當初在京海大學實驗室,呂承恩講過中藥預測五原則,相反為製、相畏為製、相喜為製、相資為製、相惡為製,也是藥物和藥物相互作用的原理,隻不過現代的ddis預測深入到分子層麵了。
之前宋河看相關論文時,見過基於圖卷積神經網絡的ddis預測,以及基於平衡理論的預測。
前者太片麵,隻考慮鄰接矩陣元素。而後者則太絕對,總結起來就是“朋友的朋友是朋友”、“朋友的朋友是敵人”,但實際的藥物研發中,關係遠比平衡理論要錯綜複雜。
電腦屏幕上,伊雷馬實驗室居然兩種方法都棄之不用,赫然使用了新方法進行ddis預測!
宋河研讀許久,基本明白了思路……大數據庫推導!
伊雷馬實驗室嘗試將海量化合物進行拓展,梳理出親戚關係,畫出一個壯觀的樹狀圖,每個枝丫都連接一種相似的化合物。
之後,再通過已經確定的化合物藥用特性,大膽猜測未知化合物的藥效。
這感覺好比,知道丈夫是生物學家,知道妻子是短跑運動員,於是便猜測這對夫妻將來的孫子能夠……一邊短跑衝刺一邊手拿顯微鏡觀察細菌……
本質上還是瞎猜藥物,但在瞎猜中多了一絲絲牽強附會的推理。
“好難!”宋河吐槽。
他在帖子裡尋找伊雷馬實驗室用的大數據庫。
找了半天……沒找到?
“怪不得呢!原來公布的隻是邊緣數據,最核心的沒公布啊!”宋河搖頭失笑。
沒辦法,他隻得嘗試自己搜集數據庫。
他先在網上尋找,用過相似工作方式的科研團隊。
花了許久,總共找到兩個。
一個是千度公司合作的研發團隊,通過大量食管癌病人的數據,尋找到22個顯著突變基因,隨後預測關聯出可行的藥物信息。
一個是sk癌症中心,開發了一個體細胞突變相關的知識庫,收錄了大量靶向藥。
“都是做癌症的數據庫,用不上啊!”宋河撓頭。
思前想後,他掏出手機,找相曉桐老師場外求助。
“老師,我需要一個安眠藥相關的大數據庫,做藥物預測用,您知道從哪能弄到嗎?學生萬謝!”
剛發消息,宋河馬上後悔,大半夜的,會不會打擾老師休息?
沒想到過了幾秒,回複便來了。
相曉桐:“我知道譚西教授的團隊自建了一個安眠藥數據庫,但譚西那人小心眼,斷不可能提供給你。”
相曉桐:“這樣吧,我團隊裡有黑客,幫你上網抓一些相關數據下來,能抓多少不確定,你做個參考。”
宋河連忙回複,“謝謝老師!學生簡直不知道該怎麼感謝您好了!”
相曉桐:“回頭跟著我學腦的時候,好好乾活就行。”
一小時後,相曉桐一股腦扔來大堆數據文件。
宋河打開看,每一份文件均為龐然大物!
海量的數據,雜亂不堪,有他想要的化合物分析,有奇奇怪怪的廢數據,大部分來自世界各地醫藥組織的數據庫,千奇百怪的語言齊聚一堂,光是機翻都要很久。
如果自己單獨乾,僅僅梳理完這些數據,恐怕都得拖到過年!
宋河幽幽長歎一聲,看來這次做短眠藥,必須雇傭實驗團隊了!
和軍用的環形山炸藥不同,短眠藥這東西主要是商業價值,無需過於水泄不通的保密措施,招些可靠的人手來乾活,注意分工即可。
宋河在反間諜教材上,學過一種行之有效的保密方法,盲人摸象法。