用AI技術(shù)一次找回4名走失10年的孩子
掃描二維碼
隨時(shí)隨地手機(jī)看文章
研究人員對(duì)0歲-18歲的人臉的成長(zhǎng)變化進(jìn)行模擬建模,采用深度神經(jīng)網(wǎng)絡(luò)算法來(lái)學(xué)習(xí)這些人臉在成長(zhǎng)過(guò)程中的復(fù)雜變化。經(jīng)過(guò)成千上萬(wàn)次的模型訓(xùn)練,終于訓(xùn)練出了一個(gè)可以進(jìn)行跨年齡人臉識(shí)別的深度神經(jīng)網(wǎng)絡(luò)模型。
根據(jù)騰訊優(yōu)圖實(shí)驗(yàn)室跨年齡人臉識(shí)別技術(shù)的圈定,警方進(jìn)一步進(jìn)行DNA親子鑒定,結(jié)果找到了4位走失大約10年的孩子。這在國(guó)內(nèi)是第一次,的確是了不起的突破?!跋渤鐾?,甚至有點(diǎn)不敢相信?!弊鳛轵v訊守護(hù)者計(jì)劃的安全專(zhuān)家,李新曾有過(guò)8年從警經(jīng)歷,這并不是他第一次參與尋親打拐案件,然而,這次使用人工智能(AI)尋親的經(jīng)歷卻很不平凡。
當(dāng)李新的同事收到尋親父母?jìng)兗膩?lái)的孩子照片時(shí),大家都沉默了。一張張照片被厚厚的油紙層層包裹,生怕有所污損。孩子基本都在3歲以下,有的孩子只有人生中唯一一張照片,有的甚至只是滿月照。四川省公安廳刑偵局打拐處處長(zhǎng)蔣曉玲回憶,收集照片時(shí)很多父母都反復(fù)囑咐千萬(wàn)別弄丟了照片,“對(duì)于父母而言,這是孩子留給他們的唯一寄托”。
這些照片里的孩子都與四川省公安廳打拐處一批積案相關(guān)。2008年至2010年,10名三歲左右的孩子在四川陸續(xù)被拐,“小耗子”就是其中一員?!靶『淖印钡母改甘呛比斯鸷暾驄D,為了討生活,在四川省武勝縣沿口鎮(zhèn)一個(gè)熱鬧的集市開(kāi)了一間酒鋪。每當(dāng)回憶起那個(gè)噩夢(mèng)般的下午,桂宏正依然痛心疾首。
2014年,四川警方抓獲一名拐賣(mài)兒童的人販子,結(jié)合之前大量的調(diào)查和證據(jù),確定了包括“小耗子”在內(nèi)的10名被拐孩子被賣(mài)到了廣東,但是通過(guò)全國(guó)打拐DNA信息庫(kù)比對(duì)并沒(méi)有結(jié)果,僅憑一張兒時(shí)照片,找到分別多年的孩子無(wú)異于大海撈針。
她說(shuō),一些家長(zhǎng)尋找孩子多年未果,他們會(huì)說(shuō):“我們也不奢望孩子們重新回到我們身邊,我們只是想知道他們?cè)谀睦?,看他們一眼,知道他們過(guò)得好不好……”
過(guò)去10年,四川省公安廳打拐處和案發(fā)縣市的公安機(jī)關(guān)一直在積極尋找那10名被拐兒童的下落?!罢{(diào)查訪問(wèn)、模擬畫(huà)像、網(wǎng)絡(luò)公告……能試的方法我們都試了,但是時(shí)間隔了這么久,而且沒(méi)有拐賣(mài)中間人提供線索,真的是太難了?!笔Y曉玲說(shuō)。
轉(zhuǎn)機(jī)出現(xiàn)在2017年12月,公安部刑偵局副局長(zhǎng)陳士渠去騰訊調(diào)研時(shí),了解到了優(yōu)圖實(shí)驗(yàn)室的跨年齡人臉識(shí)別技術(shù),于是將這一技術(shù)介紹給了四川警方。
此前騰訊等公司利用人工智能協(xié)助尋親已有不少成功經(jīng)驗(yàn)。比如,截至2018年10月,接入優(yōu)圖技術(shù)的QQ全城助力累計(jì)找回600多人;截至目前,使用該技術(shù)的福建省公安廳“牽掛你”防走失平臺(tái)累計(jì)找回1000多人?!半y度很大?!崩钚抡f(shuō)?!捌鋵?shí)當(dāng)時(shí)大家心里沒(méi)底,但當(dāng)大家看到那些層層包裹的照片時(shí),就下定決心要努力一試?!?/p>
“小耗子”被拐時(shí)才3歲,到2017年底已經(jīng)11歲多,而這段時(shí)間正是人一生中面部變化最為劇烈的階段,國(guó)際上當(dāng)時(shí)還沒(méi)有成功跨越10年通過(guò)人臉識(shí)別技術(shù)找到失蹤兒童的先例。對(duì)于跨年齡人臉識(shí)別,優(yōu)圖人臉識(shí)別算法研究負(fù)責(zé)人李博士和同事們對(duì)0歲-18歲的人臉的成長(zhǎng)變化進(jìn)行模擬建模,生成大量可供學(xué)習(xí)的人臉樣本,然后采用深度神經(jīng)網(wǎng)絡(luò)算法來(lái)學(xué)習(xí)這些人臉在成長(zhǎng)過(guò)程中的復(fù)雜變化。
“難就難在當(dāng)時(shí)跨年齡人臉識(shí)別沒(méi)有成熟的算法模型,加上數(shù)據(jù)樣本有限,實(shí)驗(yàn)效果一開(kāi)始一直不是很理想?!崩畈┦空f(shuō)。李博士和同事們想到了“用機(jī)器教機(jī)器”的方法。經(jīng)過(guò)成千上萬(wàn)次的模型訓(xùn)練,終于訓(xùn)練出了一個(gè)可以進(jìn)行跨年齡人臉識(shí)別的深度神經(jīng)網(wǎng)絡(luò)模型。
“簡(jiǎn)單來(lái)說(shuō),就好比我把成年人的人臉識(shí)別模型作為老師,讓兒童的人臉識(shí)別模型來(lái)學(xué)習(xí)其中的‘技巧’,盡量消除年齡變化對(duì)識(shí)別精度的消極影響?!崩畈┦空f(shuō)。功夫不負(fù)有心人,經(jīng)過(guò)近半年的努力,經(jīng)過(guò)很多個(gè)挑燈夜戰(zhàn)的夜晚,終于有了突破性進(jìn)展。這一名為分布式蒸餾學(xué)習(xí)法則的算法模型進(jìn)行跨年齡人臉識(shí)別的準(zhǔn)確率達(dá)到了96%以上。
不久,優(yōu)圖團(tuán)隊(duì)利用他們的模型對(duì)警方提供的海量數(shù)據(jù)進(jìn)行了第一次實(shí)際比對(duì),警方圈定了與每個(gè)被拐孩子最像的排名前五的結(jié)果進(jìn)行了最后線下確認(rèn)。隨后便出現(xiàn)了文章開(kāi)頭的那一幕。警方通過(guò)DNA檢測(cè),第一批成功確認(rèn)了4個(gè)被拐兒童,其中有3個(gè)是最高分命中。
結(jié)果出乎了李新、同事們和警方的意料?!拔覀円婚_(kāi)始根本沒(méi)有預(yù)期那么多,找到一個(gè)也是好的啊?!崩钚抡f(shuō)。令蔣曉玲印象最深的是,在第一批被找到的孩子中,有一個(gè)孩子僅僅有幾個(gè)月大時(shí)的照片。她不禁感嘆:“科技的力量太強(qiáng)大了!”