微軟在圖像識(shí)別挑戰(zhàn)賽中大獲全勝 百度遭淘汰
春運(yùn)奇葩的驗(yàn)證碼讓許多人頭疼不已,小編將小截圖在百度中識(shí)圖幾乎全部識(shí)別不了,然而谷歌大部分都能識(shí)別,技術(shù)差距啊
在第六屆ImageNet圖像識(shí)別大賽中,微軟研究院在多個(gè)類別的評(píng)比中都取得了優(yōu)勝。微軟的技術(shù)勝過了谷歌、英特爾、高通和騰訊,以及多家創(chuàng)業(yè)公司和學(xué)術(shù)機(jī)構(gòu)的系統(tǒng)。微軟此前通過幾款有趣的產(chǎn)品演示了這一技術(shù),例如根據(jù)照片猜年齡的應(yīng)用。此外,通過微軟研究院的Project Oxford項(xiàng)目,微軟正在推動(dòng)圖像識(shí)別技術(shù)的商用。
ImageNet圖像識(shí)別大賽中的iPod圖片
微軟多名研究員,包括何開明(Kaiming He,音)、張翔宇(Xiangyu Zhang,音)、任少慶(Shaoqing Ren,音),以及孫健(Jian Sun,音),開發(fā)了這一獲勝的系統(tǒng)。這一系統(tǒng)名為“面向圖像識(shí)別的深度駐留學(xué)習(xí)技術(shù)”。微軟在官方博客中表示,即將在一篇學(xué)術(shù)論文中公布系統(tǒng)的細(xì)節(jié)。
微軟這一系統(tǒng)具有很高的復(fù)雜度。該團(tuán)隊(duì)表示:“我們的神經(jīng)網(wǎng)絡(luò)深達(dá)150層。我們提出了‘深度駐留學(xué)習(xí)’架構(gòu),使深度網(wǎng)絡(luò)的優(yōu)化和匯聚變得更簡單。我們的‘深度駐留網(wǎng)絡(luò)’比以往系統(tǒng)有著更多的層數(shù),從而提高了準(zhǔn)確率。許多普通網(wǎng)絡(luò)在增加層數(shù)時(shí)也能看到類似的準(zhǔn)確率提高。”
科技公司目前紛紛加強(qiáng)這一領(lǐng)域的研究。這些公司正在優(yōu)化內(nèi)部系統(tǒng),以及面向用戶的產(chǎn)品。作為高性能網(wǎng)絡(luò)的核心,深度學(xué)習(xí)技術(shù)會(huì)利用大量數(shù)據(jù),例如圖片,去訓(xùn)練人工神經(jīng)網(wǎng)絡(luò),使神經(jīng)網(wǎng)絡(luò)在面對(duì)新數(shù)據(jù)時(shí)能做出正確的反應(yīng)。
微軟此前通過幾款有趣的產(chǎn)品演示了這一技術(shù),例如根據(jù)照片猜年齡的應(yīng)用。此外,通過微軟研究院的Project Oxford項(xiàng)目,微軟正在推動(dòng)圖像識(shí)別技術(shù)的商用。
在ImageNet挑戰(zhàn)中,參賽系統(tǒng)需要準(zhǔn)確定位來自Flickr和搜索引擎10萬張照片中的對(duì)象,并將其分類為1000個(gè)類型。微軟系統(tǒng)在分類中的錯(cuò)誤率為3.5%,而定位的錯(cuò)誤率為9%。
在前幾年的挑戰(zhàn)中,在分類錯(cuò)誤率方面,谷歌、創(chuàng)業(yè)公司Clarifai和NEC處于領(lǐng)先。
在今年的挑戰(zhàn)中,微軟的系統(tǒng)在對(duì)象探測方面也取得了領(lǐng)先。孫健表示:“我們自己也不相信,這一理念會(huì)如此重要。”
百度沒有出現(xiàn)在今年的排名中。百度的提交次數(shù)超過了允許的上限,該公司隨后對(duì)此表示道歉,并解雇了要求初級(jí)工程師這樣做的團(tuán)隊(duì)負(fù)責(zé)人。
在這項(xiàng)挑戰(zhàn)中,IBM通過SoftLayer公有云服務(wù)提供了來自英偉達(dá)的GPU(圖形處理單元),供參賽團(tuán)隊(duì)使用。