騰訊全球新總部于 11 月 28 日正式啟用。這棟位于深圳濱海大廈的新大樓,在門禁上采用了騰訊優(yōu)圖的人臉識(shí)別技術(shù)。到目前為止,試運(yùn)行的
騰訊全球新總部于 11 月 28 日正式啟用。這棟位于深圳濱海大廈的新大樓,在門禁上采用了騰訊優(yōu)圖的人臉識(shí)別技術(shù)。到目前為止,試運(yùn)行的反饋算得上「非常良好」。
也就是說(shuō),騰訊上萬(wàn)名員工出入這棟大樓,都要通過騰訊優(yōu)圖在極短時(shí)間內(nèi)的「檢視」;而反過來(lái),騰訊優(yōu)圖的產(chǎn)品每天也在接受著全體員工的把關(guān):在五萬(wàn)人規(guī)模的人臉識(shí)別檢測(cè)系統(tǒng)中,騰訊優(yōu)圖將錯(cuò)誤率降到了千分之一以下。這一系統(tǒng)一方面要保證安全,即不在名單簿的人都無(wú)法順利通過;另一方面則要保證應(yīng)用,所有在名單庫(kù)里的人都能夠非常方便、不作任何停留地進(jìn)出大樓。
騰訊優(yōu)圖實(shí)驗(yàn)室總監(jiān)黃飛躍博士在與雷鋒網(wǎng) AI 科技評(píng)論交流的過程中兩次提及了這一成果,不難感覺到,他對(duì)這一「作品」還是頗為滿意的。在黃飛躍的理解中,這是「業(yè)界真正首家大規(guī)模的人臉識(shí)別應(yīng)用」。
而騰訊新總部的人臉識(shí)別技術(shù)只是騰訊優(yōu)圖 2017 年的成就之一?;乜打v訊優(yōu)圖的 2017,在黃飛躍的理解里,騰訊優(yōu)圖年初所定下的三個(gè)目標(biāo)都已經(jīng)順利開展并且得到實(shí)現(xiàn)。他告訴雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))AI 科技評(píng)論,如果滿分是 100 分的話,2017 年「也許可以給優(yōu)圖打到 80 分」。
而他說(shuō)出這一段話的背景,則是騰訊優(yōu)圖已經(jīng)憑借人臉識(shí)別技術(shù)及相關(guān)應(yīng)用,拿下了 2017 騰訊重大業(yè)務(wù)突破獎(jiǎng)。這種謙遜而務(wù)實(shí)的風(fēng)格或許也影響著這個(gè)實(shí)驗(yàn)室研究規(guī)劃的節(jié)奏?!复蠖鄶?shù)時(shí)候,團(tuán)隊(duì)所定的年初目標(biāo)都是比較『接地氣』的,因此在我看來(lái),不管是 2017 年還是其它時(shí)候,我們給自己定的絕大多數(shù)目標(biāo),最終都能夠比較好地按照預(yù)期來(lái)實(shí)現(xiàn)?!裹S飛躍如是告訴 AI 科技評(píng)論。
乘風(fēng)破浪
不論大環(huán)境如何變化,算法研究始終是騰訊優(yōu)圖的根基。黃飛躍也深知「時(shí)勢(shì)造英雄」的作用,得益于 AI 在業(yè)界受到越來(lái)越高的關(guān)注,騰訊優(yōu)圖從 2012 年創(chuàng)立至今,逐步地通過自身的積累獲得了公司內(nèi)外的技術(shù)需求及認(rèn)可。
專注計(jì)算機(jī)視覺,希望研究領(lǐng)域處于業(yè)界領(lǐng)先水平。
而這也是優(yōu)圖在 2017 年伊始為自己定的第一個(gè)小目標(biāo):「乘風(fēng)破浪」,這是黃飛躍對(duì)騰訊優(yōu)圖 2017 的第一個(gè)概括。
在人臉識(shí)別領(lǐng)域,2017 年 3 月,騰訊優(yōu)圖憑借 99.80% 的識(shí)別準(zhǔn)確率,刷新了團(tuán)隊(duì)在 LFW 人臉數(shù)據(jù)集的準(zhǔn)確率紀(jì)錄,并在一個(gè)月后,又以 83.290% 的成績(jī)登上 MegaFace 在 100 萬(wàn)級(jí)別人臉識(shí)別測(cè)試的冠軍寶座。
而以 87.76% 的成績(jī)刷新 CV 算法評(píng)測(cè)平臺(tái) KITTI 數(shù)據(jù)集里車輛追蹤準(zhǔn)確率的紀(jì)錄,則是騰訊優(yōu)圖從 2016 年開始著手關(guān)注智能交通領(lǐng)域而取得的重要成果。據(jù)優(yōu)圖團(tuán)隊(duì)的介紹,一方面他們以多尺度深度學(xué)習(xí)模型直接完成端到端訓(xùn)練檢測(cè)目標(biāo)和追蹤軌跡的關(guān)聯(lián)矩陣,強(qiáng)化多檢測(cè)目標(biāo)和多追蹤軌跡之間的相關(guān)性。另一方面,優(yōu)圖提出基于視覺關(guān)聯(lián)矩陣和運(yùn)動(dòng)關(guān)聯(lián)矩陣融合決策的多目標(biāo)追蹤方案,能夠在復(fù)雜場(chǎng)景下完成車輛追蹤任務(wù)。
只要是從事計(jì)算機(jī)視覺相關(guān)的企業(yè),多多少少都會(huì)嘗試在不同的數(shù)據(jù)集上「刷新紀(jì)錄」,這也普遍被視為企業(yè)宣傳自身技術(shù)實(shí)力的一種方式。雖然算法在數(shù)據(jù)集上的表現(xiàn)并不能夠直接與應(yīng)用能力的強(qiáng)弱劃上等號(hào),但不可否認(rèn)的是,在數(shù)據(jù)集上取得優(yōu)秀成績(jī)的算法在實(shí)際應(yīng)用上的效果往往也呈正相關(guān)。
對(duì)于騰訊優(yōu)圖而言,黃飛躍更愿意把在數(shù)據(jù)集上的取得的成績(jī)當(dāng)作是一種結(jié)果而非目的?!肝覀?cè)?2016 年開始著手做智能交通相關(guān)的準(zhǔn)備和研發(fā),在這個(gè)過程中,我們也會(huì)根據(jù)自己的技術(shù)水平去參加相關(guān)的數(shù)據(jù)集比賽,但這并不意味著我們需要一個(gè)專門的團(tuán)隊(duì)進(jìn)行『刷榜』?!?/p>
而回歸人臉識(shí)別,騰訊優(yōu)圖也在 1:1 人臉驗(yàn)證與活體檢測(cè)技術(shù)上取得了突破。騰訊優(yōu)圖通過「唇語(yǔ)+人臉場(chǎng)景分析」的解決方案,從閱讀隨機(jī)詞語(yǔ)排除照片與錄制視頻的可能性,并從合成視頻與邊框、像素紋理等蛛絲馬跡甄別不必要的安全攻擊。比如在微眾銀行上正式應(yīng)用的極光守衛(wèi),正是活體檢測(cè)技術(shù)的進(jìn)一步升級(jí)。系統(tǒng)通過屏幕發(fā)射不同顏色和強(qiáng)度的光線,借助攝像頭接收反射到人臉的信號(hào),通過卷積神經(jīng)網(wǎng)絡(luò)的算法處理,分析活體判斷所需的人臉 3D 與質(zhì)感信息。利用這一技術(shù),用戶可以在遠(yuǎn)程開戶、修改密碼等多種業(yè)務(wù)下瞬間完成刷臉驗(yàn)證。
憑借著在計(jì)算機(jī)視覺的積累,騰訊優(yōu)圖在全球頂級(jí)會(huì)議 ICCV 2017 上有 12 篇錄用論文,其中有 3 篇被錄用為口頭報(bào)告,占總投稿數(shù)的 2.1%,黃飛躍博士也用了「水到渠成」這樣的詞來(lái)形容今年學(xué)術(shù)會(huì)議的的豐收。
值得一提的是,據(jù)雷鋒網(wǎng) AI 科技評(píng)論的了解,目前企業(yè)對(duì)待學(xué)術(shù)論文的態(tài)度呈現(xiàn)兩級(jí)分化的傾向:部分企業(yè)以產(chǎn)品落地和變現(xiàn)為主要目的,對(duì)學(xué)術(shù)會(huì)議及相關(guān)論文投遞并不關(guān)注;而也有企業(yè)非常歡迎論文的發(fā)表,認(rèn)為這能從側(cè)面為企業(yè)的學(xué)術(shù)水平增添含金量。
黃飛躍表示,在他看來(lái),大部分企業(yè)還是歡迎論文的,而這也和公司當(dāng)下所處的階段不無(wú)關(guān)系,「如果能發(fā)表一些論文提升團(tuán)隊(duì)的影響力,在自我價(jià)值的體現(xiàn)與實(shí)現(xiàn)上誠(chéng)然會(huì)起到一定的作用,但它并不是唯一和必須的途徑?!挂?ICCV 2017 為例,騰訊優(yōu)圖會(huì)鼓勵(lì)研究員在學(xué)術(shù)會(huì)議上發(fā)表論文,但并不會(huì)做強(qiáng)制性的約束。
而在 ICCV 2017 其中一篇口頭報(bào)告論文《Makeup-Go: Blind Reversion of Portrait Edit》中,團(tuán)隊(duì)提出了一個(gè)名為「成分回歸網(wǎng)絡(luò)(component regression network)」的深度網(wǎng)絡(luò)結(jié)構(gòu),對(duì)全局美化操作進(jìn)行盲復(fù)原。這篇「一鍵卸妝」的論文也在當(dāng)時(shí)引發(fā)了眾多關(guān)注及期待。
那么這又帶來(lái)了一個(gè)新的問題:眾所周知,企業(yè)研究院的算法研究與落地應(yīng)用往往緊密相連,甚至達(dá)到了一種微妙的共生關(guān)系:技術(shù)積淀多半會(huì)嘗試向落地應(yīng)用轉(zhuǎn)化,而產(chǎn)品在 AI 浪潮下的「智能」需求也可能推動(dòng)著算法研發(fā)的步伐。
如果騰訊優(yōu)圖的研究成果并不一定會(huì)直接轉(zhuǎn)化為產(chǎn)品應(yīng)用,那么作為一個(gè)企業(yè)實(shí)驗(yàn)室,它在研究?jī)?nèi)容的選擇上能擁有多大的自由度,又是如何協(xié)調(diào)算法研究與產(chǎn)品落地之間的關(guān)系的?
厚積薄發(fā)
優(yōu)圖的圖片壓縮與人臉識(shí)別是 2012 年起家時(shí)最核心的兩項(xiàng)技術(shù)。前者最早可追溯到 2011 年下半年,鑒于當(dāng)時(shí)騰訊內(nèi)部的眾多業(yè)務(wù)都有圖像存儲(chǔ)與傳輸?shù)男枨螅瑑?yōu)圖團(tuán)隊(duì)開始研究如何對(duì)圖片做二次壓縮實(shí)現(xiàn)有效存儲(chǔ),間接減少存儲(chǔ)需求,以實(shí)現(xiàn)節(jié)約帶寬與成本的目的。這一項(xiàng)目在作為黃飛躍看來(lái)屬于「相對(duì)比較短期的研究」,用于解決企業(yè)當(dāng)下的實(shí)際需求。
而人臉識(shí)別這一技術(shù)在 2012 年的大環(huán)境下則并未成為熱門,相關(guān)的研究與落地還存在很長(zhǎng)的一段距離。但盡管如此,騰訊優(yōu)圖一方面在持續(xù)研發(fā)壓縮技術(shù)的同時(shí),在 2012 年下半年還是將研究重心轉(zhuǎn)移到了人臉識(shí)別檢測(cè)方向,并開始進(jìn)行相關(guān)的技術(shù)研發(fā)與儲(chǔ)備。「囿于環(huán)境的限制,優(yōu)圖當(dāng)時(shí)把人臉識(shí)別當(dāng)作一個(gè)中長(zhǎng)期的項(xiàng)目在布局,畢竟當(dāng)時(shí)大家未必也看得清(未來(lái)的走向)?!?/p>
而隨著團(tuán)隊(duì)調(diào)整到 SNG 麾下,優(yōu)圖也慢慢地從原本的純技術(shù)研發(fā)出發(fā),開始更多地關(guān)注和從事與產(chǎn)品業(yè)務(wù)相關(guān)的內(nèi)容。技術(shù)人員會(huì)結(jié)合自己的能力尋找產(chǎn)品應(yīng)用的落腳點(diǎn),或是關(guān)注一些新技術(shù)的創(chuàng)新探索,并在其中找尋價(jià)值實(shí)現(xiàn)的空間。而反過來(lái),產(chǎn)品人員在業(yè)務(wù)落地之時(shí)會(huì)遇到一些實(shí)際問題,提出技術(shù)人員可能原本沒有考慮過的需求,
「這可能可以歸因于兩個(gè)方面,一是團(tuán)隊(duì)的每一個(gè)人都相信,自己所做的研究終究會(huì)產(chǎn)生價(jià)值,因此愿意潛心去做一些中長(zhǎng)期的研究;另一個(gè)方面是企業(yè)給予了比較大的寬容度,給予團(tuán)隊(duì)一定的選擇權(quán)。這兩者是相互推動(dòng)和促進(jìn)的,不會(huì)做直接的管控。」
提供大量行業(yè)解決方案并推動(dòng)研究成果落地。
在 2017 年,優(yōu)圖定下的第二個(gè)小目標(biāo)便在于此:有了完備的算法做為基礎(chǔ),騰訊優(yōu)圖在政務(wù)、公益、醫(yī)療、廣告及旅游等多個(gè)場(chǎng)景打造了成功的行業(yè)方案。
不論是公司內(nèi)部的業(yè)務(wù),或是外部政企的合作,騰訊優(yōu)圖在 2017 年也收獲了非常多的成功案例。據(jù) AI 科技評(píng)論不完全統(tǒng)計(jì),僅在今年,優(yōu)圖在微信服務(wù)號(hào)上的公開合作案例就超過 30 個(gè)。
2017 年 7 月被李克強(qiáng)總理點(diǎn)贊的「微信辦證」服務(wù)就借助了騰訊優(yōu)圖的 FaceIn 人臉核身技術(shù),進(jìn)行遠(yuǎn)程核驗(yàn)就可完成原本繁瑣的政務(wù)流程。此外,用戶在企業(yè)微信上傳營(yíng)業(yè)執(zhí)照時(shí),優(yōu)圖所提供支持的 OCR 識(shí)別技術(shù)便能對(duì)公司名稱等相關(guān)字段進(jìn)行自動(dòng)識(shí)別,進(jìn)一步省卻了用戶輸入及系統(tǒng)審核的時(shí)間。除了在陜西省工商進(jìn)行合作外,依托優(yōu)圖的實(shí)名核身,深圳人社也與騰訊互聯(lián)網(wǎng)+合作事業(yè)部合作推出了「刷臉」完成養(yǎng)老金領(lǐng)取資格認(rèn)證的功能,旨在「讓群眾不跑腿就能辦事」。
而騰訊優(yōu)圖的觸角也正在更多地向零售、旅游及廣告等更多領(lǐng)域進(jìn)軍。
通過與騰訊社交廣告、微信支付及綾致時(shí)裝達(dá)成合作,騰訊優(yōu)圖首次在全國(guó)推出人臉智慧時(shí)尚店,用戶只需要在智慧試衣間屏幕前「刷臉」,就能成為商家會(huì)員,并開啟微信免密支付。在結(jié)賬之時(shí),只需要在人臉識(shí)別收銀臺(tái)直接「刷臉」識(shí)別身份即可完成付款流程。
與此同時(shí),借助人臉識(shí)別的技術(shù)優(yōu)勢(shì),騰訊優(yōu)圖在今年協(xié)助龍門石窟、武漢等多個(gè)地方落地了「刷臉入園」的系統(tǒng),讓便民利民的應(yīng)用進(jìn)一步造福群眾。
去年 9 月,國(guó)家工商總局也接入了騰訊優(yōu)圖的廣告圖像識(shí)別技術(shù),能對(duì)互聯(lián)網(wǎng)廣告中的違法廣告及相關(guān)人物、事件進(jìn)行監(jiān)管,這也成為人工智能技術(shù)在廣告監(jiān)管中的首次應(yīng)用。
可以說(shuō),2017 年是團(tuán)隊(duì)在算法沉淀后在應(yīng)用領(lǐng)域百花齊放的一個(gè)重要階段,黃飛躍也在采訪中用「厚積薄發(fā)」形容了優(yōu)圖剛剛過去的這一年。
任重道遠(yuǎn)
黃飛躍曾經(jīng)在雷鋒網(wǎng)的采訪中提及優(yōu)圖實(shí)驗(yàn)室在發(fā)展過程中擁有較高的「自主性和自由度」,這一點(diǎn) AI 科技評(píng)論也再次得到了他的確認(rèn)。騰訊優(yōu)圖的工作方向、研究?jī)?nèi)容的選擇并不直接與產(chǎn)業(yè)化落地相連,也沒有卡得非常嚴(yán)苛的 deadline. 在黃飛躍看來(lái),這些選擇有兩個(gè)重要的標(biāo)準(zhǔn)和考量。
第一個(gè)是算法,這也與優(yōu)圖 2017 所立下的第一個(gè)目標(biāo)相呼應(yīng):技術(shù)的好壞是一個(gè)比較科學(xué)與客觀的評(píng)判體系,相對(duì)也容易判斷。
讓優(yōu)圖的 AI 技術(shù)更具社會(huì)價(jià)值。
而另一個(gè)標(biāo)準(zhǔn)就是業(yè)務(wù)。首先從質(zhì)和量?jī)蓚€(gè)維度,優(yōu)圖對(duì)于產(chǎn)品和業(yè)務(wù)做了多少有價(jià)值、有影響力的案例?其次,又有多少項(xiàng)目能夠順利落地?有了學(xué)術(shù)基礎(chǔ)與落地應(yīng)用,騰訊優(yōu)圖的第三個(gè)目標(biāo)便變得更加自然而順暢:
作為一個(gè)專注計(jì)算機(jī)視覺的研究部門,騰訊優(yōu)圖希望能夠通過 AI 領(lǐng)域的技術(shù)優(yōu)勢(shì),為社會(huì)帶來(lái)積極且有益的貢獻(xiàn)。不論是通過醫(yī)學(xué)影像技術(shù)幫助醫(yī)生診療篩查,及時(shí)挽救病人生命;或是采用人臉尋親協(xié)助公安部門找回走失人員,讓失散的親人重聚團(tuán)圓;又或是通過開放平臺(tái)和開源項(xiàng)目惠及開發(fā)者,實(shí)現(xiàn)更多的技術(shù)輸出,都是騰訊優(yōu)圖社會(huì)價(jià)值的體現(xiàn)。
騰訊優(yōu)圖在醫(yī)療領(lǐng)域取得的突破和進(jìn)步是 2017 年濃墨重彩的一筆,賈佳亞博士在 TSAIC 上也多次提及了騰訊優(yōu)圖未來(lái)對(duì)醫(yī)療應(yīng)用的投入。騰訊所推出的首個(gè) AI 醫(yī)學(xué)影像產(chǎn)品「騰訊覓影」,其中一大核心技術(shù)支持方正是騰訊優(yōu)圖。這一產(chǎn)品在肺癌和糖網(wǎng)早篩領(lǐng)域取得了顯著的效果,并已經(jīng)分別與廣東省人民醫(yī)院肺癌研究所、西安市第四醫(yī)院和南山醫(yī)院等多家大型醫(yī)院落地應(yīng)用。
在 11 月 15 日,科技部召開「新一代人工智能發(fā)展規(guī)劃暨重大科技項(xiàng)目」啟動(dòng)會(huì),明確依靠騰訊公司建設(shè)醫(yī)療影像國(guó)家人工智能開放創(chuàng)新平臺(tái)。騰訊優(yōu)圖入選 AI「國(guó)家隊(duì)」,既是國(guó)家對(duì)其醫(yī)療影像技術(shù)的一種肯定,也反映了國(guó)家對(duì)人工智能與醫(yī)學(xué)跨界融合的信心。而隨著醫(yī)療 AI 科學(xué)家鄭冶楓博士于近期加入騰訊優(yōu)圖,相信我們將會(huì)看到騰訊優(yōu)圖在醫(yī)療領(lǐng)域的更多嘗試與突破。
而通過與蘇州、福建、上海等地的公安部門進(jìn)行合作,騰訊優(yōu)圖在社會(huì)價(jià)值所做的貢獻(xiàn)也有目共睹。不論是在福建省公安廳上線「牽掛你」防走失平臺(tái)尋親,或是 QQ 全城助力增加跨年齡識(shí)別等人臉尋親應(yīng)用,騰訊優(yōu)圖的技術(shù)都在發(fā)揮著實(shí)際作用,讓走失的親人在闊別多年后仍能重新團(tuán)聚。據(jù)福建省公安廳提供的數(shù)據(jù),從去年 3 月至 11 月,「牽掛你」防走失平臺(tái)已經(jīng)幫助尋回 545 名走失人員。
而作為一個(gè)更加開放的平臺(tái),除了面向開發(fā)者提供更多的接入渠道外,騰訊優(yōu)圖也在開源項(xiàng)目上邁出了堅(jiān)實(shí)的一步。針對(duì)移動(dòng)端深度學(xué)習(xí),騰訊優(yōu)圖在 2017 年 7 月發(fā)布了首個(gè)深度學(xué)習(xí)開源項(xiàng)目 ncnn,這個(gè)神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架能方便開發(fā)者將深度學(xué)習(xí)算法移植到手機(jī)端,開發(fā)人工智能的相關(guān) App。據(jù)介紹,目前 ncnn 已在騰訊多款應(yīng)用中使用,如 QQ、Qzone、微信及天天 P 圖等。
騰訊優(yōu)圖給自己的定位是「專注于人工智能、計(jì)算機(jī)視覺的技術(shù)研發(fā)與探索落地」,并且致力于「幫助」與「賦能」兩個(gè)層面。一方面,騰訊優(yōu)圖給內(nèi)部業(yè)務(wù)團(tuán)隊(duì)提供 AI 的技術(shù)與能力;另一方面,它也幫助其它企業(yè)的更多業(yè)務(wù)對(duì)外輸出優(yōu)圖的 AI 技術(shù)能力。
2018 年,黃飛躍對(duì)騰訊優(yōu)圖在商業(yè)化的發(fā)展也有了新的期待。「從算法研發(fā)和技術(shù)布局的角度上看,我們的發(fā)展基本上都是可以符合預(yù)期的,也基本上能夠做到對(duì)社會(huì)有一定的推動(dòng)力。當(dāng)然,也有一些事情難以做到盡善盡美,如商業(yè)化拓展的能力、整個(gè)業(yè)界影響力的提升以及市場(chǎng)布局上,仍然需要大量的投入?!?/p>
黃飛躍用「任重道遠(yuǎn)」這個(gè)成語(yǔ)作為優(yōu)圖 2017 年的第三個(gè)關(guān)鍵詞,在過去一年,騰訊優(yōu)圖在學(xué)術(shù)會(huì)議嶄露頭角、在世界級(jí)比賽中刷新成績(jī),讓更多的學(xué)者關(guān)注優(yōu)圖所取得的算法進(jìn)展;而在落地合作上,騰訊優(yōu)圖也嘗試涉足更多的應(yīng)用領(lǐng)域,為更多的企業(yè)提供賦能的能力與可能性。在未來(lái),騰訊優(yōu)圖希望深化技術(shù)研究,并進(jìn)一步推動(dòng)業(yè)務(wù)的落地,讓優(yōu)圖的 2018,走得更加穩(wěn)健與扎實(shí)。