第224章 範式一統_重生之AI教父_思兔 
思兔 > 都市言情 > 重生之AI教父 > 第224章 範式一統

第224章 範式一統(1 / 1)

“我之前所說的驚喜,一是一款新的模型結構,它將會終結目前序列相關的問題領域的混亂現象。另一個我們放到最後再揭曉。”孟繁岐開門見山,這是寫論文摘要的習慣,先說領域有什麼不足有什麼問題,自己通過了什麼辦法解決了什麼難題。

這樣有助於受眾快速理解三要素,缺陷,方法和結果。

“序列問題,這個詞可能對不少人來說,顯得稍微有些晦澀。我把事情說得直白一點,在這裡主要指的就是像自然語言和語音聲音那一係列問題,當然了,如同基因序列這樣一維的問題也可以歸在其中。”

“最近一年多的時間,深度學習在圖像領域一枝獨秀,爆發性地突破了很多任務的極限水平。但在自然語言領域,目前的局麵仍舊顯得比較混亂。”

孟繁岐說到這裡,不少稍微懂得一些領域內幕的人心中免不了有些腹誹,“什麼叫深度學習在圖像領域一枝獨秀,整個兒就是你一個人在秀。”

“在目前的序列問題領域,傳統的語言技術,效果也還不錯,有著不少的應用。基於深度學習的卷積網絡和循環網絡,相互之間各有千秋。我個人的感覺是,我們學界總體還是非常迷茫,不知道未來應該主要發展哪個方向,不知道哪個方向才是正確的。”

“對於這個現象,這個問題,我給出的答案是,它們都是不夠好的。目前序列問題發展的最好方向既不是卷積網絡,也不是循環網絡,而應該是注意力機製。”

“基於這種機製,我們放棄了卷積和循環的模式,了一種全新的建模方式,它的名字叫做transforr,t方法。”

孟繁岐說到這裡,就沒有再繼續詳細解釋t方法的結構和原理了,這一次的宣布,主要目的還是為了流量和關注度,大部分民眾,以及現在現場的人員,都是不大可能能夠理解其中原理的。

繼續往下說,隻會是對牛彈琴,多說無益。

隻有少部分在現場的人懂得這個新範式的意義,比如deepd的同事們。

不過他們早就已經接觸到代碼了,此刻並不會感到驚訝,也不需要孟繁岐過多的解釋。

“具體的原理和推導,我們很快會有論文公布出來,在這裡就不耽誤大家的時間了。”孟繁岐非常清楚,這次最核心的地方還是要展現這種方法在海量問題和數據上的強大能力,應該抓著實驗結果多吹一吹,如果儘量能用普通人可以感受到的方式,那就更好了。

“transforr模型是一種先進的深度學習模型,既可以用於語音處理任務,也可以用於自然語言處理任務。我們已經在諸多領域使用它取得了巨大的進展,我在這裡借用大家幾分鐘,做一個快速的展示。”

所有的觀眾們剛剛消化了阿爾法圍棋這個圍棋神明的事實,正是對人工智能有濾鏡的時候。

“首先,機器翻譯。我大量采用了注意力機製來捕獲輸入句子和輸出句子之間的關聯,從而使翻譯質量得到了很大的提升。”

說著,孟繁岐的背後顯示出了一個表格,旁邊是不同大小的t方法對傳統最佳辦法的對比柱狀圖圖。

列舉了幾種常見語言之間,翻譯效果的指標。

有了這種直觀的圖表,即便不理解其中技術原理的人,也能夠直觀地對比不同方法性能之間的差距。

“然後,是語音識彆,t方法可將音頻頻譜轉換為文本形式。”孟繁岐點擊了一下幻燈片上預設好的按鈕,然後拿起麥克風說了一長串話“語音識彆的精確程度固然驚豔,但大家將會大為震撼的,其實是t方法在下一個任務上的能力。”

非常迅速地,t方法將該段音聲轉換成了文本。由於孟繁岐刻意控製了語速和發音質量,吐字比較清晰,因而這一次語音的轉換分毫不差。

在場的人們雖然前麵翻譯的部分聽得是雲裡霧裡的,但在這裡還是看得明白的,紛紛鼓掌致意。

“接下來,我剛才所說的驚豔能力,便是語音合成能力,它同樣可以反過來根據輸入的文本生成相應的語音內容。”

孟繁岐說著,直接把剛剛t方法識彆出來的文本複製了一下,直接交由t方法去生成。

很快,一個知性地女聲響起,若不是這個句子太長,在幾個地方發音仍有一些瑕疵,人們幾乎不敢相信這是由電腦合成出來的聲音。

雖然t方法在諸多任務上均取得了不小的提升,但是那些大都是在表格上對比展示,大家其實也看不懂一個點兩個點意味著什麼。

沒辦法理解其中的技術含量和突破的難度。

但這一次語音和文本的來回轉換,則直觀了太多。

“臥槽,他的意思是剛剛那個聲音是假的?是合成出來的?”戰鷹的嘴再次因驚訝而成一個o型,她最開始沒有想到這一點,後知後覺,半晌才回過神來。

“我以前聽到的那種機器語音,都是冷冰冰一個調的,一開口就知道是老機器人了。孟繁岐這個效果完全不一樣啊,語音語調都有,語速、停頓的特性都和人類像了很多。要不是偶有一點雜聲,我都快分辨不出來了。”

本小章還未完,請點擊下一頁後麵精彩內容!

語音合成這裡,孟繁岐專門對網絡做了許多的改動調整,專門設置了一些音高音準的調節器結構,為得就是語音生成出來可以更像是人類在說話。

此外,還專門做了一個全新的聲碼器,用來匹配新辦法。在一係列任務中,屬於是下了較多功夫的,效果自然非常驚豔。

其實這個領域,一直以來也沒有一個特彆好的指標來評價合成出來的語音到底效果和質量怎麼樣。

通常都是使用一個指標叫做os,其實就是人類的平均打分。我找二三十個誌願者,然後讓他們盲聽一下真實的語音和幾個生成出來的版本,讓誌願者打分。

沒想到吧,在這個深度學習飛速發展的時代,竟然還是有少數領域采用的是如此古老且不好控製均值方差的打分辦法。

“這也導致語音合成領域後來不少論文中,幾個方法的效果到底誰更好沒有一個定論。”語音類型的會議也收圖像類論文,並且好投中一點,所以孟繁岐也關注過這方麵的一些內容。

這種比較主觀草率的評分,就使得操作空間變得格外之大。

試想,隻要你通過暗示等手段,甚至加入一些乾擾,就能輕鬆使得誌願者對其他方法的評價變差。如此一來,便能夠凸顯你自己的辦法效果絕佳。

不少人都沒能抵擋住這個誘惑。

當然,這也隻是一方麵,不同的方法在不同的句子上,效果本就有出入。

研究者甚至不需要作假,隻需要針對性地進行篩選,就能夠達成自己的目的了。

“holyshit。這小子加入了穀歌之後,真是離譜到家了。”燕京,李彥弘也在關注這件事“我想過他有了資源之後能做出更大的成績,卻怎麼也沒有想到他的野心如此之大。”

孟繁岐作為核心貢獻者做出阿爾法圍棋,李彥弘是可以理解的,他認為以孟繁岐的實力,終結圍棋智能這樣特定的領域,是完全可以預見的。

但看今天這架勢,孟繁岐已經不滿足於某個方向了。

這小子是一個都不打算放過啊

李彥弘看了一眼ppt,這東西二三十頁,現在才翻到五六頁呢,鬼知道後麵還有多少東西。

喜歡重生之ai教父請大家收藏101novel.com重生之ai教父101novel.com更新速度全網最快。



最新小说: 兩界之門 小師妹明明超強卻過分沙雕 豪門作精破產後,上門老公成金主 契約者與樂園與緯度 重返二十歲的惡劣雄蟲又被迷暈了 鳳族女帝穿越成豪門少奶奶後,總裁傻眼了 我和隱婚妻子是心靈伴侶 截教:悟性逆天!拾取詞條證混元 您有一封來自鬼校的錄取通知書 誘寵玫瑰