研究人員對0歲-18歲的人臉的成長變化進行模擬建模,采用深度神經網絡算法來學習這些人臉在成長過程中的復雜變化。經過成千上萬次的模型訓練,終于訓練出了一個可以進行跨年齡人臉識別的深度神經網絡模型。
根據騰訊優(yōu)圖實驗室跨年齡人臉識別技術的圈定,警方進一步進行DNA親子鑒定,結果找到了4位走失大約10年的孩子。這在國內是第一次,的確是了不起的突破?!跋渤鐾?,甚至有點不敢相信。”作為騰訊守護者計劃的安全專家,李新曾有過8年從警經歷,這并不是他第一次參與尋親打拐案件,然而,這次使用人工智能(AI)尋親的經歷卻很不平凡。
當李新的同事收到尋親父母們寄來的孩子照片時,大家都沉默了。一張張照片被厚厚的油紙層層包裹,生怕有所污損。孩子基本都在3歲以下,有的孩子只有人生中唯一一張照片,有的甚至只是滿月照。四川省公安廳刑偵局打拐處處長蔣曉玲回憶,收集照片時很多父母都反復囑咐千萬別弄丟了照片,“對于父母而言,這是孩子留給他們的唯一寄托”。
這些照片里的孩子都與四川省公安廳打拐處一批積案相關。2008年至2010年,10名三歲左右的孩子在四川陸續(xù)被拐,“小耗子”就是其中一員?!靶『淖印钡母改甘呛比斯鸷暾驄D,為了討生活,在四川省武勝縣沿口鎮(zhèn)一個熱鬧的集市開了一間酒鋪。每當回憶起那個噩夢般的下午,桂宏正依然痛心疾首。
2014年,四川警方抓獲一名拐賣兒童的人販子,結合之前大量的調查和證據,確定了包括“小耗子”在內的10名被拐孩子被賣到了廣東,但是通過全國打拐DNA信息庫比對并沒有結果,僅憑一張兒時照片,找到分別多年的孩子無異于大海撈針。
她說,一些家長尋找孩子多年未果,他們會說:“我們也不奢望孩子們重新回到我們身邊,我們只是想知道他們在哪里,看他們一眼,知道他們過得好不好……”
過去10年,四川省公安廳打拐處和案發(fā)縣市的公安機關一直在積極尋找那10名被拐兒童的下落?!罢{查訪問、模擬畫像、網絡公告……能試的方法我們都試了,但是時間隔了這么久,而且沒有拐賣中間人提供線索,真的是太難了?!笔Y曉玲說。
轉機出現在2017年12月,公安部刑偵局副局長陳士渠去騰訊調研時,了解到了優(yōu)圖實驗室的跨年齡人臉識別技術,于是將這一技術介紹給了四川警方。
此前騰訊等公司利用人工智能協助尋親已有不少成功經驗。比如,截至2018年10月,接入優(yōu)圖技術的QQ全城助力累計找回600多人;截至目前,使用該技術的福建省公安廳“牽掛你”防走失平臺累計找回1000多人?!半y度很大?!崩钚抡f?!捌鋵嵁敃r大家心里沒底,但當大家看到那些層層包裹的照片時,就下定決心要努力一試?!?/p>
“小耗子”被拐時才3歲,到2017年底已經11歲多,而這段時間正是人一生中面部變化最為劇烈的階段,國際上當時還沒有成功跨越10年通過人臉識別技術找到失蹤兒童的先例。對于跨年齡人臉識別,優(yōu)圖人臉識別算法研究負責人李博士和同事們對0歲-18歲的人臉的成長變化進行模擬建模,生成大量可供學習的人臉樣本,然后采用深度神經網絡算法來學習這些人臉在成長過程中的復雜變化。
“難就難在當時跨年齡人臉識別沒有成熟的算法模型,加上數據樣本有限,實驗效果一開始一直不是很理想。”李博士說。李博士和同事們想到了“用機器教機器”的方法。經過成千上萬次的模型訓練,終于訓練出了一個可以進行跨年齡人臉識別的深度神經網絡模型。
“簡單來說,就好比我把成年人的人臉識別模型作為老師,讓兒童的人臉識別模型來學習其中的‘技巧’,盡量消除年齡變化對識別精度的消極影響?!崩畈┦空f。功夫不負有心人,經過近半年的努力,經過很多個挑燈夜戰(zhàn)的夜晚,終于有了突破性進展。這一名為分布式蒸餾學習法則的算法模型進行跨年齡人臉識別的準確率達到了96%以上。
不久,優(yōu)圖團隊利用他們的模型對警方提供的海量數據進行了第一次實際比對,警方圈定了與每個被拐孩子最像的排名前五的結果進行了最后線下確認。隨后便出現了文章開頭的那一幕。警方通過DNA檢測,第一批成功確認了4個被拐兒童,其中有3個是最高分命中。
結果出乎了李新、同事們和警方的意料?!拔覀円婚_始根本沒有預期那么多,找到一個也是好的啊?!崩钚抡f。令蔣曉玲印象最深的是,在第一批被找到的孩子中,有一個孩子僅僅有幾個月大時的照片。她不禁感嘆:“科技的力量太強大了!”