孟繁岐決定創業的兩個方向,人臉識彆和醫療ai,其中還是有緩急之分的。
人臉識彆是一項已經應用了很久的技術,各方麵都比較成熟,隻是之前的方法比較傳統落後。
一旦孟繁岐做出一些突破之後,可以很快切入進戰場,展開收割,快速盈利。
而醫療ai還處於比較早期的階段,其中最麻煩的問題是這些醫療數據與病人隱私方麵的倫理問題。
在最最基層的數據問題上,就有不小的阻礙,各方麵的手續章程繁瑣。
雖然尚海公共衛生中心主動與自己聯絡了,不過這方麵的事情恐怕不會推進得太快,需要徐徐圖之。
應當先行著手處理的是人臉識彆算法方麵的事情,並且既然已經決定創業,自然要從商業的視角去考慮,而非是之前的學術角度。
孟繁岐了解這個時期最先進的人臉識彆算法,比如臉書的deepface,原本是基於阿裡克斯網絡做特征提取,加入了分段仿射變換,使用了3d人臉建模來重現臉部特征,對齊麵部要素。
臉書在14年的這個方法是深度學習時代人臉識彆算法的奠基之作,影響力很強。
不過在孟繁岐看來,這個方法極其臃腫,參數多達上億個,雖然在一個大型人類數據集lf上性能為9735,接近人類水準。
但對孟繁岐來說,將這個性能繼續提升到996往上是十拿九穩的事情。
不過,從數據上可以明顯看到,這個指標剩餘的提升空間其實已經很小了,沒法很顯著地拉開差距。
從學術的角度去思考這個問題,自然是不要緊的,隻要突破了世界紀錄,自然就是值得發表的研究。
可在工業界,思維卻不能這麼簡單。
性能相差無幾的情況下,還有太多其他因素需要考慮進來。
比如速度快慢,商業用途,對速度都有硬指標的要求,這一點孟繁岐非常有信息;再比如算法的算子是否比較常見?有些複雜的學術操作,在商業使用的時候並不方便,硬件設備可能不支持,這點有可能會出問題。
其他諸如價格,使用難度,用戶界麵的美觀程度,甚至於宣發的ppt做得唬不唬人,都很有可能成為外行人做出商業判斷的依據之一。
因此,孟繁岐覺得在人臉這個已經被比較成熟的問題上,單純隻是自己這2個多點的技術突破隻是較大的優勢,還不足以建立起絕對的優勢。
既然是創業的第一槍,不僅要成功,還必須大勝。
孟繁岐計劃要在這個領域構建起足夠強大的技術壁壘,至少要讓其他所有的科技巨頭們在大幾個月,甚至接近一年多的時間內退避三舍。
現在的人臉識彆太簡單?老辦法就能做到9697?
哥們給你上點強度,看看你到底能不能受得住!
孟繁岐的策略基於他最先公開的一篇論文,生成式對抗技術之上。
他計劃將基於殘差網絡的對抗式生成網絡做一些針對性調整,並拿現在業界最大的幾個人臉圖像數據去訓練它們。
其最終目的,就是為了生成看上去栩栩如生,實際上根本就不存在的人臉圖像。
等到這個生成模型成功訓練之後,孟繁岐便可以用它去對現在世麵上的先進人臉識彆算法發起針對性的挑戰。