對於普通人來說,輻射場這個詞有些陌生難懂,可其實人眼中的色彩,很大一部分是通過輻射而來的。
人眼會接收到光,而光就是電磁輻射,或者說是振蕩的電磁場。光的兩大主要屬性是光強和頻率,其中光的顏色就是由頻率決定的。
小學二年級的時候我們曾經學過,大多數光是不可見的,僅有的很窄的一段人眼可見的光譜稱為可見光譜,對應的頻率就是我們認為的某種顏色。
由此可以得出,三維重建的時候,輻射光就是對應的顏色,而神經輻射場則是一種在其中求解光各種指標近似值的方法。
一旦求解成功,幾張圖片就可以確定三維物體在空間中各個位置的輻射情況,進而做到重構三維物體,使得原本相片中平麵的內容立體起來,物體的各個角度都可以做到旋轉觀看。
神經輻射場是ai與圖形學結合的一大重要突破,不過作為方法發起人的孟繁岐卻對傳統的三維世界重建辦法了解很少。
這便是ai技術的厲害之處了,它能夠從海量的數據當中學到非常複雜的表達,而不需要技術作者本身對這種表達擁有足夠的理解。
最著名的一個例子,就是學出圍棋神明阿爾法零不需要技術作者會下圍棋,甚至也不需要機器懂得人類的圍棋招法。
克萊爾麵對這個情況,心中五味雜陳,有三分驚喜三分無奈三分感歎。
這一次圖形學取得了大突破,隻是畫風卻跟她想象的完全不一樣。
並不是通過非常嚴密的理論推導,又或者是妙到極致的算法實現了突破。
而是由一個非圖形學領域的研究者,通過神經網絡直接硬學了一個高維度的表達形式。
大力出奇跡,將這個棘手的問題給解決了。
這特麼誰能想得到啊!
這就像是大家看拳擊賽,都在期待你能夠變身魔鬼筋肉人,一拳打暈對方。
結果你掏出一把機槍,直接把對方爆頭了。
贏是贏了,隻是不管哪裡都有點怪怪的。
克萊爾與韓辭遵循孟繁岐的思路和大方向做黎曼和的形式推導已經有不短的時間了,兩人各自想出了不同的思路,不過從結果看來,還是數理功底紮實許多的韓辭進展更快。
“假設我們將射線最近最遠之間的部分劃分為n個區間,那麼第i個區間的積分則可以寫作如下形式。函數中,密度和顏色的情況交由ai模型的輸出來預測決定。對於剩下的部分,則可以進一步做簡化,然後在區間上求和得到最終的黎曼和形式。”
韓辭的草稿有十幾頁紙,最後整理出來的過程也有整整大半張a4紙之多。
隨著她的逐行講解,孟繁岐眼睜睜地看著最上麵那個長達三行的原始式子,不知怎麼地就逐步精簡,最後化作了一個簡短求和形式。
整個式子的長度縮減了十幾倍,寫成代碼自然也就方便了太多。
雖然不寫一行代碼,但數理能力對孟繁岐的幫助卻勝過數千數萬行普通代碼。
“神經輻射場隻是一個開始,以後還有flo辦法和擴散係列模型的優化需要借助數理的力量。”目前這些技術在比較保密的階段,借助少數幾個人就已經足夠。
等到孟繁岐的幾個拳頭營收項目成熟之後,這方麵的人才可以多養一些。
“畢竟23年之後的技術就得指望他們了!”孟繁岐已經在心中給自己定下了退休計劃,等到技術差不多發完了,就跑路享清福去。
前世做打工人想退休,如今做了老板也想退休。
神經輻射場的初步搭建,使得孟繁岐的這個核心小團隊分為了兩個派係,一方專攻圖形學方向,主要是克萊爾和韓辭在做。另一方則開始調研,應該如何將該技術與自動駕駛相結合。
說得直白點,就是一批人去針對英偉達,一批人去針對特斯拉。