當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 你可能聽說過,在河南的農(nóng)村里,在非洲的城市中,每一個你想象不到的地方,有著大量的數(shù)據(jù)標(biāo)注員。 他們手動在圖片里把每一只花瓶和每一輛汽車框出來,并且標(biāo)上“花瓶”和“汽車”。一段時間后,這些

你可能聽說過,在河南的農(nóng)村里,在非洲的城市中,每一個你想象不到的地方,有著大量的數(shù)據(jù)標(biāo)注員。

他們手動在圖片里把每一只花瓶和每一輛汽車框出來,并且標(biāo)上“花瓶”和“汽車”。一段時間后,這些人把成千上萬張標(biāo)記好的圖片打包,發(fā)送給遠(yuǎn)在北京、上海甚至舊金山的 AI 公司。

GQ 將這些人稱為《那些給人工智能打工的人》。

人工智能發(fā)展迅速,大大小小的互聯(lián)網(wǎng)科技公司相繼開展研究,投入商用。然而訓(xùn)練一個可用的 AI,需要大量準(zhǔn)確標(biāo)記好的圖片、視頻等資料。

正因?yàn)榇?,市場對?shù)據(jù)標(biāo)注的需求如此之大,吸引“那些給 AI 打工的人”爭相加入,其中不乏原來找不到工作的閑散人員——畢竟這份工作只需要動動鼠標(biāo),用不上太多知識。

但是,恐怕不久后,這些人就將再次失業(yè)。

上周,來自約翰·霍普金斯大學(xué)、斯坦福大學(xué)和 Google 的專家聯(lián)合發(fā)布了一篇論文,介紹了他們使用神經(jīng)網(wǎng)絡(luò)來自動搜索神經(jīng)網(wǎng)絡(luò),將其投入圖像分割方面的研究,并且取得的重要進(jìn)展:

研究人員采用神經(jīng)架構(gòu)搜索 (Neural Architecture Seartch, NAS) 技術(shù)設(shè)計(jì)了一個神經(jīng)架構(gòu) (A),放任它去自動搜索/設(shè)計(jì)出新的神經(jīng)架構(gòu) (B),投入到圖像語義分割 (semantic image segmentaTIon) 的任務(wù)中。

研究人員發(fā)現(xiàn),這個被自動搜索出來的神經(jīng)架構(gòu) B,在主流的小規(guī)模圖像數(shù)據(jù)集上,未經(jīng)訓(xùn)練就直接使用,表現(xiàn)已經(jīng)超過了現(xiàn)有人類設(shè)計(jì)的、預(yù)先訓(xùn)練好的模型。

以往人們一直相信,設(shè)計(jì) AI 需要大量知識和經(jīng)驗(yàn),簡而言之就是需要人來設(shè)計(jì)。

但現(xiàn)在,AI 設(shè)計(jì)出的 AI,已經(jīng)比人設(shè)計(jì)出的 AI 更強(qiáng)。

論文的標(biāo)題叫做: Auto-DeepLab: Hierarchical Neural Architecture Search for SemanTIc Image SegmentaTIon

研究人員將這個能夠自動搜索(設(shè)計(jì))神經(jīng)架構(gòu)的技術(shù)命名為Auto-DeepLab。這個名字來自于 DeepLab,Google 人工開發(fā)的圖像語義分割技術(shù)。前面加上 Auto,意思是在 DeepLab 的基礎(chǔ)上,新的技術(shù)可以實(shí)現(xiàn)了很大程度的自動化。

論文署名作者當(dāng)中,兩人來自約翰·霍普金斯大學(xué),其中第一作者是 Chenxi Liu,曾在 Google 實(shí)習(xí);有四人來自 Google;剩下的一人來自斯坦福大學(xué),正是原 Google Cloud 首席科學(xué)家,在計(jì)算機(jī)視覺學(xué)術(shù)和業(yè)界知名的李飛飛教授。

“本著 AutoML(編者注:Google 主導(dǎo)的 AI 計(jì)劃,將算法選擇,模型的超參數(shù)調(diào)整,迭代建模和模型評估等工作自動化。)和人工智能普及化的精神,對于不依賴專家經(jīng)驗(yàn)知識,自動設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)架構(gòu),人們的興趣有了顯著提升?!弊髡咛岬健?/p>

在“AI 自動設(shè)計(jì) AI”這件事上,Auto-DeepLab 有幾個比較重要的新嘗試。

首先,神經(jīng)架構(gòu)搜索 NAS 技術(shù)是 AI 領(lǐng)域的新興物種,主要用于簡單的圖片分類。而在這篇論文里,研究者首次嘗試將 NAS 投入到高密度的圖片預(yù)測任務(wù)上(也就是對更復(fù)雜的高分辨率圖片進(jìn)行語義分割,比如 Cityscapes 城市街景數(shù)據(jù)集、PASCAL VOC 2012 和ADE20K 等數(shù)據(jù)集)。

其次,在計(jì)算機(jī)視覺領(lǐng)域內(nèi)的神經(jīng)網(wǎng)絡(luò)架構(gòu),通常分為內(nèi)層、外層的兩級架構(gòu),自動化的神經(jīng)架構(gòu)設(shè)計(jì)往往只能設(shè)計(jì)內(nèi)層,外層仍需要人來設(shè)計(jì)和手調(diào)。而 Auto-DeepLab 是第一個讓 AI 掌握外層設(shè)計(jì)和調(diào)參能力,并在圖像語義分割任務(wù)上得到優(yōu)異結(jié)果的嘗試。

“圖像語義分割”六個字聽上去有點(diǎn)拗口,其實(shí)很好理解:對于一張圖劃分幾個類別,然后將所有的像素點(diǎn)歸類。

圖像語義分割的任務(wù),就是判斷每一個像素點(diǎn)屬于人、自行車,還是背景。

需要明確的是,圖像語義分割的任務(wù)純粹是判斷像素點(diǎn)屬于哪個類別,它不能識別和區(qū)分獨(dú)立的物體。

不過圖像語義分割仍然有很重要的意義,比如在它可以用于手機(jī)拍照的“人像模式”。采用更優(yōu)秀的圖像語義分割技術(shù),手機(jī)能夠在更高精度的照片里確認(rèn)每一個像素點(diǎn),屬于人,亦或是背景。

目前 Google、小米等公司都在手機(jī)拍照上使用這一技術(shù)。理論上,未來的“人像模式”可以在毛發(fā)、衣物邊緣實(shí)現(xiàn)更好的效果。

以及在自動駕駛的場景里,神經(jīng)網(wǎng)絡(luò)需要判斷擋在前面的是車、行人還是建筑物,進(jìn)而采用不同策略進(jìn)行躲避,這同樣需要圖像語義分割來打基礎(chǔ)。

從該論文體現(xiàn)的效果來看,Auto-DeepLab 還可以被轉(zhuǎn)移到其他任務(wù)上。言外之意,讓 AI 自動設(shè)計(jì) AI 這件事,可能還會有很大的想象空間。

比如作者在論文最后提到,在目前的研究框架內(nèi),他們可以繼續(xù)在物體識別的方向進(jìn)行研究。

如果能夠取得類似的結(jié)果,大規(guī)模使用,沒準(zhǔn)有一天,在數(shù)據(jù)標(biāo)注(特別是圖像標(biāo)注)這件事上,人類標(biāo)注員的成本等優(yōu)勢可能也會消失。

如果人工智能可以給人工智能打工,打工效率比人還高……

“那些給人工智能打工的人”,會失去工作嗎?

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉