微軟在圖像識(shí)別挑戰(zhàn)賽中大獲全勝百度遭淘汰

時(shí)間：2015-12-11 16:54:08

關(guān)鍵字：圖像識(shí)別微軟 AN IMAGE

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]春運(yùn)奇葩的驗(yàn)證碼讓許多人頭疼不已，小編將小截圖在百度中識(shí)圖幾乎全部識(shí)別不了，然而谷歌大部分都能識(shí)別，技術(shù)差距啊在第六屆ImageNet圖像識(shí)別大賽中，微軟研究院在多個(gè)類別的評(píng)比中都取得了優(yōu)勝。微軟的技術(shù)勝過

春運(yùn)奇葩的驗(yàn)證碼讓許多人頭疼不已，小編將小截圖在百度中識(shí)圖幾乎全部識(shí)別不了，然而谷歌大部分都能識(shí)別，技術(shù)差距啊

在第六屆ImageNet圖像識(shí)別大賽中，微軟研究院在多個(gè)類別的評(píng)比中都取得了優(yōu)勝。微軟的技術(shù)勝過了谷歌、英特爾、高通和騰訊，以及多家創(chuàng)業(yè)公司和學(xué)術(shù)機(jī)構(gòu)的系統(tǒng)。微軟此前通過幾款有趣的產(chǎn)品演示了這一技術(shù)，例如根據(jù)照片猜年齡的應(yīng)用。此外，通過微軟研究院的Project Oxford項(xiàng)目，微軟正在推動(dòng)圖像識(shí)別技術(shù)的商用。

ImageNet圖像識(shí)別大賽中的iPod圖片

微軟多名研究員，包括何開明(Kaiming He，音)、張翔宇(Xiangyu Zhang，音)、任少慶(Shaoqing Ren，音)，以及孫健(Jian Sun，音)，開發(fā)了這一獲勝的系統(tǒng)。這一系統(tǒng)名為“面向圖像識(shí)別的深度駐留學(xué)習(xí)技術(shù)”。微軟在官方博客中表示，即將在一篇學(xué)術(shù)論文中公布系統(tǒng)的細(xì)節(jié)。

微軟這一系統(tǒng)具有很高的復(fù)雜度。該團(tuán)隊(duì)表示：“我們的神經(jīng)網(wǎng)絡(luò)深達(dá)150層。我們提出了‘深度駐留學(xué)習(xí)’架構(gòu)，使深度網(wǎng)絡(luò)的優(yōu)化和匯聚變得更簡單。我們的‘深度駐留網(wǎng)絡(luò)’比以往系統(tǒng)有著更多的層數(shù)，從而提高了準(zhǔn)確率。許多普通網(wǎng)絡(luò)在增加層數(shù)時(shí)也能看到類似的準(zhǔn)確率提高。”

科技公司目前紛紛加強(qiáng)這一領(lǐng)域的研究。這些公司正在優(yōu)化內(nèi)部系統(tǒng)，以及面向用戶的產(chǎn)品。作為高性能網(wǎng)絡(luò)的核心，深度學(xué)習(xí)技術(shù)會(huì)利用大量數(shù)據(jù)，例如圖片，去訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)，使神經(jīng)網(wǎng)絡(luò)在面對(duì)新數(shù)據(jù)時(shí)能做出正確的反應(yīng)。

微軟此前通過幾款有趣的產(chǎn)品演示了這一技術(shù)，例如根據(jù)照片猜年齡的應(yīng)用。此外，通過微軟研究院的Project Oxford項(xiàng)目，微軟正在推動(dòng)圖像識(shí)別技術(shù)的商用。

在ImageNet挑戰(zhàn)中，參賽系統(tǒng)需要準(zhǔn)確定位來自Flickr和搜索引擎10萬張照片中的對(duì)象，并將其分類為1000個(gè)類型。微軟系統(tǒng)在分類中的錯(cuò)誤率為3.5%，而定位的錯(cuò)誤率為9%。

在前幾年的挑戰(zhàn)中，在分類錯(cuò)誤率方面，谷歌、創(chuàng)業(yè)公司Clarifai和NEC處于領(lǐng)先。

在今年的挑戰(zhàn)中，微軟的系統(tǒng)在對(duì)象探測方面也取得了領(lǐng)先。孫健表示：“我們自己也不相信，這一理念會(huì)如此重要。”

百度沒有出現(xiàn)在今年的排名中。百度的提交次數(shù)超過了允許的上限，該公司隨后對(duì)此表示道歉，并解雇了要求初級(jí)工程師這樣做的團(tuán)隊(duì)負(fù)責(zé)人。

在這項(xiàng)挑戰(zhàn)中，IBM通過SoftLayer公有云服務(wù)提供了來自英偉達(dá)的GPU(圖形處理單元)，供參賽團(tuán)隊(duì)使用。