那些給人工智能打工的人，會失去工作嗎？

時間：2020-06-12 09:45:02

關(guān)鍵字：人工智能李飛飛

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 你可能聽說過，在河南的農(nóng)村里，在非洲的城市中，每一個你想象不到的地方，有著大量的數(shù)據(jù)標注員。他們手動在圖片里把每一只花瓶和每一輛汽車框出來，并且標上“花瓶”和“汽車”。一段時間后，這些

你可能聽說過，在河南的農(nóng)村里，在非洲的城市中，每一個你想象不到的地方，有著大量的數(shù)據(jù)標注員。

他們手動在圖片里把每一只花瓶和每一輛汽車框出來，并且標上“花瓶”和“汽車”。一段時間后，這些人把成千上萬張標記好的圖片打包，發(fā)送給遠在北京、上海甚至舊金山的 AI 公司。

GQ 將這些人稱為《那些給人工智能打工的人》。

人工智能發(fā)展迅速，大大小小的互聯(lián)網(wǎng)科技公司相繼開展研究，投入商用。然而訓(xùn)練一個可用的 AI，需要大量準確標記好的圖片、視頻等資料。

正因為此，市場對數(shù)據(jù)標注的需求如此之大，吸引“那些給 AI 打工的人”爭相加入，其中不乏原來找不到工作的閑散人員——畢竟這份工作只需要動動鼠標，用不上太多知識。

但是，恐怕不久后，這些人就將再次失業(yè)。

上周，來自約翰·霍普金斯大學(xué)、斯坦福大學(xué)和 Google 的專家聯(lián)合發(fā)布了一篇論文，介紹了他們使用神經(jīng)網(wǎng)絡(luò)來自動搜索神經(jīng)網(wǎng)絡(luò)，將其投入圖像分割方面的研究，并且取得的重要進展：

研究人員采用神經(jīng)架構(gòu)搜索 (Neural Architecture Seartch, NAS) 技術(shù)設(shè)計了一個神經(jīng)架構(gòu) (A)，放任它去自動搜索/設(shè)計出新的神經(jīng)架構(gòu) (B)，投入到圖像語義分割 (semantic image segmentaTIon) 的任務(wù)中。

研究人員發(fā)現(xiàn)，這個被自動搜索出來的神經(jīng)架構(gòu) B，在主流的小規(guī)模圖像數(shù)據(jù)集上，未經(jīng)訓(xùn)練就直接使用，表現(xiàn)已經(jīng)超過了現(xiàn)有人類設(shè)計的、預(yù)先訓(xùn)練好的模型。

以往人們一直相信，設(shè)計 AI 需要大量知識和經(jīng)驗，簡而言之就是需要人來設(shè)計。

但現(xiàn)在，AI 設(shè)計出的 AI，已經(jīng)比人設(shè)計出的 AI 更強。

論文的標題叫做： Auto-DeepLab: Hierarchical Neural Architecture Search for SemanTIc Image SegmentaTIon

研究人員將這個能夠自動搜索（設(shè)計）神經(jīng)架構(gòu)的技術(shù)命名為Auto-DeepLab。這個名字來自于 DeepLab，Google 人工開發(fā)的圖像語義分割技術(shù)。前面加上 Auto，意思是在 DeepLab 的基礎(chǔ)上，新的技術(shù)可以實現(xiàn)了很大程度的自動化。

論文署名作者當(dāng)中，兩人來自約翰·霍普金斯大學(xué)，其中第一作者是 Chenxi Liu，曾在 Google 實習(xí)；有四人來自 Google；剩下的一人來自斯坦福大學(xué)，正是原 Google Cloud 首席科學(xué)家，在計算機視覺學(xué)術(shù)和業(yè)界知名的李飛飛教授。

“本著 AutoML（編者注：Google 主導(dǎo)的 AI 計劃，將算法選擇，模型的超參數(shù)調(diào)整，迭代建模和模型評估等工作自動化。）和人工智能普及化的精神，對于不依賴專家經(jīng)驗知識，自動設(shè)計神經(jīng)網(wǎng)絡(luò)架構(gòu)，人們的興趣有了顯著提升?！弊髡咛岬?。

在“AI 自動設(shè)計 AI”這件事上，Auto-DeepLab 有幾個比較重要的新嘗試。

首先，神經(jīng)架構(gòu)搜索 NAS 技術(shù)是 AI 領(lǐng)域的新興物種，主要用于簡單的圖片分類。而在這篇論文里，研究者首次嘗試將 NAS 投入到高密度的圖片預(yù)測任務(wù)上（也就是對更復(fù)雜的高分辨率圖片進行語義分割，比如 Cityscapes 城市街景數(shù)據(jù)集、PASCAL VOC 2012 和ADE20K 等數(shù)據(jù)集）。

其次，在計算機視覺領(lǐng)域內(nèi)的神經(jīng)網(wǎng)絡(luò)架構(gòu)，通常分為內(nèi)層、外層的兩級架構(gòu)，自動化的神經(jīng)架構(gòu)設(shè)計往往只能設(shè)計內(nèi)層，外層仍需要人來設(shè)計和手調(diào)。而 Auto-DeepLab 是第一個讓 AI 掌握外層設(shè)計和調(diào)參能力，并在圖像語義分割任務(wù)上得到優(yōu)異結(jié)果的嘗試。

“圖像語義分割”六個字聽上去有點拗口，其實很好理解：對于一張圖劃分幾個類別，然后將所有的像素點歸類。

圖像語義分割的任務(wù)，就是判斷每一個像素點屬于人、自行車，還是背景。

需要明確的是，圖像語義分割的任務(wù)純粹是判斷像素點屬于哪個類別，它不能識別和區(qū)分獨立的物體。

不過圖像語義分割仍然有很重要的意義，比如在它可以用于手機拍照的“人像模式”。采用更優(yōu)秀的圖像語義分割技術(shù)，手機能夠在更高精度的照片里確認每一個像素點，屬于人，亦或是背景。

目前 Google、小米等公司都在手機拍照上使用這一技術(shù)。理論上，未來的“人像模式”可以在毛發(fā)、衣物邊緣實現(xiàn)更好的效果。

以及在自動駕駛的場景里，神經(jīng)網(wǎng)絡(luò)需要判斷擋在前面的是車、行人還是建筑物，進而采用不同策略進行躲避，這同樣需要圖像語義分割來打基礎(chǔ)。

從該論文體現(xiàn)的效果來看，Auto-DeepLab 還可以被轉(zhuǎn)移到其他任務(wù)上。言外之意，讓 AI 自動設(shè)計 AI 這件事，可能還會有很大的想象空間。

比如作者在論文最后提到，在目前的研究框架內(nèi)，他們可以繼續(xù)在物體識別的方向進行研究。

如果能夠取得類似的結(jié)果，大規(guī)模使用，沒準有一天，在數(shù)據(jù)標注（特別是圖像標注）這件事上，人類標注員的成本等優(yōu)勢可能也會消失。

如果人工智能可以給人工智能打工，打工效率比人還高……

“那些給人工智能打工的人”，會失去工作嗎？