台下的諸多學生當中,隻有路易斯和韓辭能夠跟上他的節奏,這還是因為兩人都提前對這些內容有了了解。
並且韓辭根本就不是斯坦福計算機院的,雖然走了李飛飛的邀請,但她來讀的仍舊是應用數學。這丫頭隻是來蹭課的。
“注意力函數可以描述為將一個查詢和一組鍵值對映射到輸出的操作,其中查詢、鍵、值和輸出均為向量,輸出被計算為值的加權和。其中每一個值的權重是由一個注意力函數來計算的,該函數以查詢向量和鍵向量作為輸入。”
“而我提出的縮放點積注意力,如書的287頁所示。輸入由三部分組成,維度為dk的查詢向量和鍵向量,以及維度為dv的值向量。我們將單個查詢值和所有的鍵一起計算內積,然後大小縮放根號dk,最後對內積結果做ftax函數以獲得值的權重。”
“”
這一係列操作是t方法的基礎,自然也是gpt和bert方法的基本構成部分。
如果想要理解這幾個月發生的一切,什麼ai潛伏,ai醫生,就必須要理解許多這樣的操作。此乃是ai生成內容,ai大模型時代最為重要的核心原理,當然要著重講解。
隻是同學們卻不知曉,聽得那是頭昏腦漲,生不如死。
按這種講解方式,即便是羅德教授,也難以在短時間內將內容消化。
他最開始還時不時地在手邊的白紙上做些記錄和演算,但很快就感覺有些不對勁了。
不少同學在下麵開始用手機拍攝板書,但仔細看了一會卻發覺似乎意義不大。
絕大部分的內容其實這本新教材上已經有了。
現在的問題並不是這群高材生無法理解推導的過程,而是他們對各個步驟的意義知之甚少。
不理解為什麼這裡要做類似的操作和變換,即便能夠理解式子推導的過程,幾輪下來也被枯燥的數理給淹沒了。
說白了就是沒有一個主線,沒有清晰的目的性。
“式二經過演化得到式三,這個我好像看明白了。e後麵怎麼又有一長串推導,式六我好像理解了。等下,剛剛的式二是什麼來著?”
雖然能夠理解,卻不知道為什麼要理解,直觀感覺上都是無意義的高密度信息。
幾十分鐘下來,人就徹底暈了。
“好了好了,講課的確是一門學問,不能由著你這樣來。”不得已,羅德教授及時叫停,再繼續下去,今天這節課的時間就算是浪費了。
“您看,我就說我沒法講吧。”見羅德教授發聲叫停,孟繁岐喜出望外,他也感覺不大自在。
“誰說沒法講,我是說不能由著你隨便講。今天你既然已經站上了這個講台,那就必須講出對得起這個講台的課!”羅德教授怎可能善罷甘休,他懷疑這小子是故意把內容搞得這麼難的。
講得這麼快作甚?趕著投胎啊?羅德教授今天是要吃定這小子了,要麼他負責講後麵的這些內容,要麼這小子乘早彆來這堂課。
“現在開始,我來安排章節內容,你來負責講述,不得超出我的指定範圍。什麼時候讓台下的同學們都聽明白了,我們再進入下一個章節。”羅德教授坐在講台的側邊,扶了扶眼鏡,迅速把書往回翻了幾十頁。
“我們今天彆的都不管了,就先把殘差這個概念徹底搞清楚。”
“太好了!”同學們歡欣雀躍,說實話,最開始他們也懷疑過聽不懂到底是不是自己的問題。
現在看羅德教授的表情,怕是他也沒有搞明白。
既然連教授都聽不明白,那大家都一臉懵就合理了,誰也彆說誰。
“同學們都記一下,從現在開始,孟同學講的所有ai新時代內容,期末都重點考察。”同學們高興了還沒有三秒鐘,羅德教授就笑著圖窮匕見了。
這些內容我講是不講了,但是考試卻都是重點哦!
教室裡瞬間從剛才的歡欣雀躍變成一片哀嚎。