聽過許亮傑的話,周不器又叫來首席技術官程秉皓,也詳實溝通了一下搜索的事。
新浪的愛問搜索,就是他帶隊做出來的。
如果他去年不離開新浪,說不定憑借此功勞,就能晉升為新浪的cto了。
不過,他現在是紫微星的cto,也一點不差。
程秉皓的看法跟許亮傑差不多,而且更加地本土化。
“百度為什麼做內容?因為在國內做搜索,做內容是唯一能夠生存下去的方式。”
程秉皓的看法更加的銳利直接。
在國內做搜索,跟矽穀不一樣,要根據法律法規,要移除和屏蔽一些內容。以及要貼心的為用戶考慮,通過一些深度算法,幫助用戶移除一些深度的專業化內容。
因為越專業越小眾,越庸俗越大眾。
要想獲取最多的大眾用戶的喜愛,不能提供太專業的內容,而是要提供一些淺白易懂、不那麼複雜的搜索結果。
比如百度那邊已經在做機器學習,也就是最早期的人工智能。即通過用戶搜索結果以及對搜索結果的反饋,來讓機器學習。從而在未來搜索的時候,讓機器幫忙推薦更符合大眾口味的最優解。
這就又產生了一個好處,可以進一步的縮小檢索範圍。
百度的搜索技術比不上穀歌,差距之大遠遠超出想象。其實也不止百度了,雅虎、微軟也一樣。
穀歌能在最短的時間內,在海量的互聯網數據中搜索出相關內容,然後根據算法排列,呈現在用戶電腦前。
可其他的搜索引擎不行。
要想給用戶提供最快的響應速度,怎麼辦?
最簡單的方法,就是縮小檢索目標。
穀歌檢索10億條信息,百度就檢索1億條信息。
信息來源少了,搜不出想要的答案,也就不奇怪了。
所以,百度要想坐穩國內第一的寶座,就一定、隻能、必須做內容。通過自產的內容,來彌補檢索技術方麵的弱項。
這種方法,沒法滿足高端用戶的需求,卻可以滿足全社會中80的用戶需求了,這就夠了。
可以說,百度的李總通過正麵退怯、背後遊擊的方式,完成了對穀歌在搜索領域霸權的挑戰,並且成功了。單從這一點來說,可比微軟、雅虎等巨頭強了不少,那夥人還在苦哈哈的想跟穀歌玩技術呢。
玩個屁啊,根本不是一個量級的。
在大數據處理的領域,全球科技公司都要依靠一個叫hadoop的開源核心架構。這個架構來源,就是穀歌對自身算法理論的公開,卻沒有公開算法細節。所以雅虎和阿帕奇就牽頭合作,召集了一大批頂尖科學家,根據穀歌的算法理論,做出了這個大數據處理係統。
可問題很多,距離穀歌公布的一些關鍵指標存在數倍的差距,苦苦沒法解決,隻能咬牙接受。包括微軟、亞馬遜、阿裡、華為、臉書、雅虎、百度等巨頭,都要使用這個開源係統。
隻有穀歌不用。
不僅不用,他們還在2010年完成了係統的更新把原來的理論推翻,上線了一個更先進更高端的大數據管理係統。
也就是說,全世界科技巨頭們使用的大數據管理係統的底層架構,比穀歌淘汰的那個舊版本,還要落後幾倍的效率。
巨頭們當然也抗爭,想做出超越hadoop的東西。
國內的代表就是百度。
在07年的時候,百度股價一路飛起,上下振奮。李彥紅決定代表華夏,做一個世界級的開創性項目出來,起名“金字塔”計劃。
抽調了百度最精英的核心技術人員,又從外麵招來了一個專家團隊,帶頭人赫然就是現在紫微星研發中心的負責人楊振坤!
這個大計劃,不用java、python,甚至連c都不用,直接用c語言寫代碼。
可謂是雄心壯誌。
當時,百度從最高層到一線開發人員,都充滿激情,畢竟這是一次叫板矽穀的大事,做成了足以揚我國威。
項目組瘋狂加班,百度大廈12層西側的燈每天晚上都亮一宿。
做了兩年,項目成功了!
可是,最後百度還是回歸到了hadoop的陣營中。
為什麼?
因為有一個小項目組,拿來hadoop的代碼簡單包裝,重寫了api,然後拿過去跟百度耗時兩年、斥巨資打造的金字塔係統比較性能。
結果,小項目組以微弱的優勢取勝了!
李彥紅看到這個結果,頓時心灰意冷,如同被潑了一盆涼水。
hadoop是開源項目,是全世界的開發者們一起去更新、促進,潛力巨大。原創的如果沒有巨大優勢,再加上職場政治,就隻能是朝開源的方向走了
阿裡雲的初期,曾遇到過巨大困難,被業內深深質疑。因為最早期的時候,王建博士判斷錯了,也要搞一個類似hadoop的大數據係統,半抄半改,還是糊了。後來看到亞馬遜雲成功了,才恍然大悟,趕緊調頭改變方向,這才取得了成功。
企鵝、盛大、新浪、華為、金山等科技公司看到阿裡在前麵趟地雷,還真是趟出來了一條道。這個時候,大家也就不說什麼“新瓶裝舊酒”、“阿凡達時代才能誕生”的風涼話了,趕緊跟進,也都很順利的做出了自己的雲計算平台。
這背後都要依托著開源項目hadoop。
程秉皓道:“我在新浪時,就意識到了內容的重要性,開始對愛問搜索補充內容來源,比如愛問知識人,比百度知道還早一年。可是公司給的支持有限。我99年最早做搜索時,整個搜索部就我一個人。到了去年,也才120多人的團隊,彆說跟百度比了,連搜狗都不如。”