第287章 與張一名話推薦_重生之AI教父_思兔 
思兔 > 都市言情 > 重生之AI教父 > 第287章 與張一名話推薦

第287章 與張一名話推薦(2 / 2)

雖然的確有p會惡意使用權限監聽,但這樣做的成本是很高的,容易得不償失。更大的可能其實還是你被協同過濾推薦了。

伱的朋友發現了一些好東西,剛跟你聊了幾句推薦了一下;但與此同時,他的購買和瀏覽情況也被統計,作為好友圈中的人,你被協同過濾推薦了。

再加上現在好多個平台之間數據都有所串通,經常會有跨平台推薦的事情發生,就會顯得有些推薦結果格外讓人背後一涼。

比如你在值乎等地方看了大量耳機相關的測評和推薦,反過來阿狸係的p裡就開始給你推同價位的耳機讓你消費。

便利了生活的同時,也會很容易讓人有被窺視的感覺,覺得自己的隱私被泄露,感到非常不爽。

理性一點去看待,現在人們每天產生的數據量仍在飛速增長,個人是肯定沒有那個精力去細究具體到某一個人的隱私內容的。

不過由於許多公司管理自己數據庫的方式非常不規範不安全,導致被人拖庫的事情時有發生。整個數據庫直接被黑客取走,用戶的一切敏感信息都被獲取,作為商品被反複倒賣。

數次大型信息泄露事件過後,也導致了【人肉】彆人變得越發容易,網友們相互開盒,不亦樂乎。

不過這些問題,卻也不是孟繁岐現在有什麼辦法可以改變的了。

至於第三種混合推薦方式,則是將之前兩大類通過一些方法綜合考量,融合起來。

畢竟單獨考慮內容和協同過濾都是不夠周全的,前者可以避免冷啟動問題,也就是如果用戶沒有跟一個種類的視頻互動過,那麼這類視頻就會很難被推薦到。不過基於內容的推薦很可能會陷入重複套娃當中,點多了之後就不會推彆的內容給用戶。看幾個萌寵視頻就掉進貓窩出不來了。

後者根據用戶互動數量的增加,可以非常好地把握用戶的喜好。隻是如果用戶從未看到某些類型的話,係統也難以判斷,在初期會遭遇上述的冷啟動問題,不知道該不該推某些類彆。

當然了,這是非常籠統論述,實際的操作更加複雜。

“現在國內在這方麵大部分都是模仿你在穀歌為油管設計的那一套辦法。”張一名此前剛剛自學了一套傳統辦法,結果推薦係統就被ai革新了一輪。

孟繁岐在穀歌的中前期,為了擴大自己的分成比例,做了一些推薦搜索方麵的優化,其中就包括替油管準備的一套方法。

針對網頁和推薦廣告的那部分,穀歌是不可能放出來的,畢竟那是穀歌8成收入來源的一個重大提升。

而油管這方麵,雖是世界級的視頻網站,但在營收方麵占比還是拉胯了一點,加上孟繁岐的做法也比較糙,因而遲些時候穀歌還是選擇了公布。

“其實我在那個工作裡沒有投入太多精力,就隻是率先把深度網絡的那一套給搬進去了,做了一些專項的適配。”孟繁岐著實也不是謙虛,那段時間太忙了,油管這邊屬於營收小頭,孟繁岐沒有當成主要任務在做,各方麵都不夠細致。

“你這話說得,傳出去能把人氣死。油管怎麼說也是十幾億用戶的頭部長視頻平台,哪有你說得那麼好做?”張一名是內行人,他知道以油管的規模,是有幾個巨大挑戰的。

“油管體量大,我自己測試很多推薦算法,小規模問題都做得非常好,但體量上到千萬、億級彆就很容易出問題,更彆提油管的十億級彆了。”張一名在頭條上推薦的東西測得很多,其中的難點知曉得很清楚。

小主,這個章節後麵還有哦,請點擊下一頁繼續後麵更精彩!

“用戶多了,每秒的新內容上傳數量也很龐大,係統不僅要處理好原本十億級彆的視頻,還得對最新上傳的內容及時更新建模。”張一名搖了搖頭,以他自學推薦方法的經曆,一時間根本想象不到這個難題得怎麼去解決。

“油管當時是用了十億級彆的參數,用了千億的訓練樣本。主要是用了兩個神經網絡,一個生成視頻候選,一個用於排序重要性。”穀歌雖然公布了這部分內容,但是多少有點語焉不詳,自然不如算法主導人孟繁岐介紹得簡明清楚。

“主要是從用戶的曆史行為獲取輸入,從視頻庫檢索數百個視頻,儘量通過粗粒度的特征去篩選,因為規模上去之後噪聲的為是相當誇張的。對於檢索出來的百餘視頻,再根據細粒度特征用排序網絡區分召回,分析相對的重要性,最終構成最佳推薦列表。”

這種粗排,精排,深度網絡替代傳統辦法和樹方法的模式,已經在國內外廣泛流行了起來,可以說孟繁岐年初時分在穀歌做的這一套模式,如今已經成為了視頻推薦的基本範式。

隻不過孟繁岐自己早已經鳥槍換炮。

“我們現在穩定的一個版本也是遵循這個粗排候選生成,精排最後視頻結果的模式,不過我注意到其實大部分廠商標注出來的數據是有很大的係統偏差的。有時候用戶點了排在前麵的視頻,並不是因為喜歡,而是因為他們隻看到了最上麵的那些,根本沒有去看餘下的部分。”

“如果不關注這種偏差的話,那麼它就會形成閉環回路,反饋回來的結果隻會讓模型越來越自信於自己的推薦,然而實際上用戶的體驗已經是一團糟了。”

孟繁岐前世對推薦係統的了解沒有本職圖像和大模型那麼多,但是對於許多重要更新的要點和思路還是記得清楚的。

隻消與一些公司內專業的核心技術人士溝通個幾次會議,算法就能基本成型。

與張一名再聊了一些細節,時間越久,張一名越覺得思路開闊,視野漸寬。內心之中不由得深深佩服,這家夥怎麼就能做到多個主流領域的ai相關領域個個精通的呢?

老板自己就是第一線的技術人員,怕是他們公司的程序員乾活都壓力要大上不少啊!

“明天我就去尚海那邊了,有個ai峰會,你去不去?”與張一名達成了協議,孟繁岐來到燕京的主要任務算是完成了。

孟繁岐未敢忘記正事,明日便啟程尚海,準備參加三天後的ai峰會。

“我聽說,現在國內的互聯網三巨頭,馬芸,小馬哥還有李彥弘,都會出席?那還是ai峰會嗎?不是變互聯網峰會了!”張一名也大概了解ai峰會的情況,畢竟ai這個圈子,說到底其實是大半個互聯網圈子。

“我就不去了,他們幾個都是去看投資機會的,我這還是被投的公司,暫時分不出那個精力。不過我有個關係不錯的朋友,王星估計會在那邊,你也知道,這兩天搞美團搞得風生水起的那位。”

喜歡重生之ai教父請大家收藏101novel.com重生之ai教父101novel.com更新速度全網最快。



最新小说: 自編文學醒世恒言 寶寶,你是我的星辰 都首富了,你讓我去擺攤賣烤腸? 為什麼要結婚呢? 十天一天賦,成為吸血鬼的我太BUG了 開局滿級橫練,我橫推江湖 崩壞:破曉之黎明 天道酬勤之車站風雲 囚籠裡的休者 誘爾為臣