毫無(wú)疑問(wèn),數(shù)據(jù)量的飆升是AI產(chǎn)業(yè)爆發(fā)的原因之一。很快我們可以發(fā)現(xiàn),將數(shù)據(jù)采集、整理、清洗、標(biāo)注再輸送給AI企業(yè)用作模型訓(xùn)練,已經(jīng)成為了一條運(yùn)行流暢的產(chǎn)業(yè)鏈。 很長(zhǎng)一段時(shí)間以來(lái),數(shù)據(jù)服務(wù)都處于一種粗放原始的狀態(tài)之中,甚至出現(xiàn)了一種“數(shù)據(jù)農(nóng)場(chǎng)”的說(shuō)法:數(shù)據(jù)服務(wù)從業(yè)者們從各種公開(kāi)數(shù)據(jù)集或移動(dòng)互聯(lián)網(wǎng)產(chǎn)品中獲取數(shù)據(jù),以幾乎零門(mén)檻的形式聘請(qǐng)大量廉價(jià)勞動(dòng)力進(jìn)行簡(jiǎn)單的清洗標(biāo)注工作,例如勾選出一張照片中哪里是天空哪里是大地。最后再將這些粗糙處理過(guò)的數(shù)據(jù)一股腦地投入神經(jīng)網(wǎng)絡(luò)的黑箱之中。