當(dāng)中國AI開始玩起了工業(yè)化...

時(shí)間：2021-05-07 09:33:30

關(guān)鍵字： AI 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]隨著產(chǎn)業(yè)化的推進(jìn)，公眾范圍對(duì)AI的探討也隨之收窄。如今，基本看不到營銷號(hào)那些關(guān)于AI的驚悚標(biāo)題，也很少有讓業(yè)界驚喜的底層算法突破。也許有人認(rèn)為AI泡沫正在破裂，AI寒冬又將到來。但在大眾狂歡消退之余，卻又能看到商用AI正在中國市場快速興起。到了2021年，大部分云計(jì)算和AI供應(yīng)商...

本文來源：腦極體

從2017年AI借助圍棋大規(guī)模出圈開始算起，我們經(jīng)歷了這么幾個(gè)階段的變化：

第一階段，全社會(huì)一起討論AI到底有什么用；

第二階段，相關(guān)產(chǎn)學(xué)政各方一起討論，AI應(yīng)該怎么用；

第三階段，負(fù)責(zé)出錢和收錢的雙方努力討論，AI怎么用才能便宜點(diǎn)？

隨著產(chǎn)業(yè)化的推進(jìn)，公眾范圍對(duì)AI的探討也隨之收窄。如今，基本看不到營銷號(hào)那些關(guān)于AI的驚悚標(biāo)題，也很少有讓業(yè)界驚喜的底層算法突破。也許有人認(rèn)為AI泡沫正在破裂，AI寒冬又將到來。但在大眾狂歡消退之余，卻又能看到商用AI正在中國市場快速興起。到了2021年，大部分云計(jì)算和AI供應(yīng)商似乎都無暇繼續(xù)討論AI的應(yīng)用場景和應(yīng)用可行性，而是專注于另一個(gè)關(guān)鍵詞：成本。

隨著AI開始變成企業(yè)服務(wù)的一種，部署成本過高開始變成業(yè)界最顯著的問題，而且在中國AI產(chǎn)業(yè)中尤甚。與其他企業(yè)IT技術(shù)不同，AI作為一種靈活多變的軟件形態(tài)，需要長期投入和專業(yè)人才。這導(dǎo)致AI在大型科技公司或者平臺(tái)型企業(yè)具有非常彈性的投資曲線，可以戰(zhàn)略性投入，從而靈活多變地解決各種問題。但對(duì)于傳統(tǒng)企業(yè)、中小型企業(yè)、缺乏信息化基礎(chǔ)的企業(yè)來說，應(yīng)用AI往往能在理論上解決非常重要的問題，卻缺乏直接、可操作且成本可控的執(zhí)行方案。

回到云計(jì)算和AI服務(wù)提供商這邊，雖然面向企業(yè)賣AI理論上潛力巨大。但現(xiàn)實(shí)是每家客戶都有大量需要定制解決的需求，往往要投入眾多行業(yè)專家、算法架構(gòu)師、軟硬件工程師來解決一些細(xì)小問題。這樣做出來的成果雖然可觀，但其實(shí)只具備案例性質(zhì)，缺乏推廣可能。

另一方面，疫情導(dǎo)致美國AI行業(yè)創(chuàng)新緩慢，頭部公司算法突破不理想。同時(shí)歐美的AI to B市場凈值較高，客戶數(shù)字化能力較強(qiáng)。谷歌云、微軟云的崛起雖然都與AI息息相關(guān)，但適配的更多是大規(guī)模、分散式的企業(yè)軟件市場。反而中國市場中的AI目標(biāo)用戶更多是政企、實(shí)體經(jīng)濟(jì)企業(yè)，需要一對(duì)一的AI能力與行業(yè)化的AI解決方案。

這種情況下，把AI技術(shù)推向高度工業(yè)化、標(biāo)準(zhǔn)化，就猛然間變成了中國科技界的獨(dú)立任務(wù)。雖然在2019年谷歌等頭部AI公司已經(jīng)開始推動(dòng)機(jī)器學(xué)習(xí)簡單化的相關(guān)技術(shù)，但其目標(biāo)更多集中在所謂“AI民主化”，而非今天中國云計(jì)算與AI廠商面向的大規(guī)模AI部署與工業(yè)級(jí)AI場景。

不夸張地說，低成本的AI工業(yè)化，已經(jīng)成為目前中國AI產(chǎn)業(yè)的主線任務(wù)，但相關(guān)分析卻并不充沛。本文希望討論一下中國AI工業(yè)化這條賽道的幾種產(chǎn)品邏輯，以及代表案例、商業(yè)模型。由于各家廠商的命名方案與產(chǎn)品標(biāo)準(zhǔn)并不統(tǒng)一，為免誤會(huì)這里選擇隱去具體的廠商與技術(shù)名稱。但將相關(guān)技術(shù)邏輯帶入到幾家大廠，不難發(fā)現(xiàn)聚焦程度已經(jīng)不低。

看過東野圭吾《神探伽利略》系列的朋友，可能對(duì)主角湯川學(xué)鐘愛速溶咖啡鐘愛印象深刻?？此屏畠r(jià)、低端的速溶咖啡，其實(shí)凝結(jié)了噴霧干燥等20世紀(jì)初人類科學(xué)與工業(yè)能力的精髓。也正是速溶咖啡的出現(xiàn)，才讓咖啡大規(guī)模生產(chǎn)、運(yùn)輸、存儲(chǔ)成為可能。

如果說，深度學(xué)習(xí)是人類發(fā)現(xiàn)了咖啡這種飲料；那么中國AI正在努力完成的，就是炮制出一杯進(jìn)擊的速溶咖啡。

真正的咖啡時(shí)代，或許更可能開啟于后者。

行業(yè)知識(shí)圖譜

對(duì)于大部分企業(yè)用戶來說，AI提供的都是機(jī)器視覺、NLP體系下的幾種固定能力?；谶@些能力衍生出企業(yè)的定制化變體復(fù)雜度很高。但有一種AI技術(shù)卻很容易與企業(yè)和行業(yè)的特殊需求進(jìn)行適配，那就是知識(shí)圖譜。

知識(shí)圖譜的技術(shù)邏輯是將一些知識(shí)進(jìn)行人為關(guān)聯(lián)，從而在調(diào)用A知識(shí)時(shí)驅(qū)動(dòng)B知識(shí)，從而達(dá)成近乎“智能”的效果。這并不是多么新穎的技術(shù)，甚至早已機(jī)器學(xué)習(xí)誕生前，知識(shí)圖譜已經(jīng)在很多領(lǐng)域有了廣泛應(yīng)用。今天在搜索引擎和電商產(chǎn)品中的相關(guān)推薦功能，很大一部分都依靠知識(shí)圖譜來完成。

在AI to B的應(yīng)用中，一個(gè)巨大問題在于企業(yè)處在特定行業(yè)里。每個(gè)行業(yè)不同的知識(shí)，或者說經(jīng)驗(yàn)，決定了應(yīng)用AI的需求不同、成本各異。比如說，安防場景需要的AI識(shí)別，就和質(zhì)檢場景大相徑庭。

因此一種新的AI產(chǎn)品服務(wù)模式，是技術(shù)供應(yīng)商上升為行業(yè)信息化服務(wù)商，主動(dòng)打造符合具體行業(yè)需求的知識(shí)圖譜產(chǎn)品。比如工業(yè)知識(shí)圖譜里可能包含分揀、質(zhì)檢、產(chǎn)品流程等方方面面，當(dāng)工業(yè)識(shí)別解決方案與之結(jié)合，AI就不僅能夠完成單點(diǎn)任務(wù)，還可以依據(jù)行業(yè)知識(shí)圖譜完成一定程度的復(fù)雜需求，比如知識(shí)推理、知識(shí)預(yù)測等等。

類似的行業(yè)知識(shí)圖譜擁有廣泛的應(yīng)用可能性，無論是在工業(yè)、能源這樣注重“經(jīng)驗(yàn)”的場景，還是金融、物流這樣看重“數(shù)據(jù)關(guān)系”的領(lǐng)域。另外，行業(yè)知識(shí)圖譜也可以幫助AI打入那些通識(shí)類算法難以奏效的行業(yè)，比如說油氣勘探、生物醫(yī)藥等等。最重要的是，如果云計(jì)算廠商提供有效的行業(yè)知識(shí)圖譜服務(wù)，那么就可以免除一個(gè)個(gè)訂單去給企業(yè)做知識(shí)、經(jīng)驗(yàn)適配，從而降低人工成本。

但行業(yè)知識(shí)圖譜的問題在于，行業(yè)知識(shí)是一個(gè)非常抽象、難以標(biāo)準(zhǔn)化的版圖。每個(gè)行業(yè)有多少知識(shí)可以取公約數(shù)也是個(gè)問題。因此市面上的類似服務(wù)，都大體集中在金融、能源、工業(yè)質(zhì)檢等幾個(gè)基礎(chǔ)板塊，難以細(xì)化到更具體、小眾的行業(yè)。并且行業(yè)知識(shí)圖譜已經(jīng)極大改變了云計(jì)算、AI供應(yīng)商的角色，使其從算法等基礎(chǔ)能力提供商變成了行業(yè)咨詢、行業(yè)數(shù)字化解決方案提供商，這對(duì)商業(yè)模式和行業(yè)認(rèn)可也提出了挑戰(zhàn)。

目前，與機(jī)器視覺、NLP等基礎(chǔ)能力適配的行業(yè)知識(shí)圖譜，還是中國AI界獨(dú)一份的產(chǎn)業(yè)板塊。它能走到多遠(yuǎn)，或許是接下來AI產(chǎn)業(yè)一個(gè)非常重要的發(fā)展指示物。

自動(dòng)機(jī)器學(xué)習(xí)

雖然蘇大強(qiáng)都知道手磨咖啡好喝，但讓每個(gè)人都去磨咖啡顯然不現(xiàn)實(shí)。速溶咖啡的價(jià)值也因此得到了確認(rèn)。

這就像AI雖好，但每家企業(yè)都高價(jià)聘用算法架構(gòu)師，花費(fèi)大量時(shí)間做數(shù)據(jù)調(diào)優(yōu)、分類、提取也很不現(xiàn)實(shí)。為了解決這個(gè)問題，谷歌早在2018年就推出了AutoML，也就是自動(dòng)機(jī)器學(xué)習(xí)的相關(guān)工具。這類工具的基礎(chǔ)邏輯在于，盡量讓普通開發(fā)者，甚至不會(huì)寫代碼的AI應(yīng)用者，都能通過按要求上傳圖片的方式生成固定的AI模型。這些模型雖然簡單，但勝在零門檻，低成本。大眾熟知的類似應(yīng)用，可能就是以給明星換臉而出圈的deepfake。當(dāng)這東西被全球集體封殺，或許也側(cè)面證明了自動(dòng)機(jī)器學(xué)習(xí)的威力。

隨著產(chǎn)業(yè)發(fā)展，自動(dòng)機(jī)器學(xué)習(xí)也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入，今天中國AI產(chǎn)業(yè)的自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)與工具，在能力的多元化與工業(yè)化上已經(jīng)遠(yuǎn)遠(yuǎn)超過了谷歌等美國公司。廣義來看，從數(shù)據(jù)處理到數(shù)據(jù)特征提取，再到數(shù)據(jù)調(diào)參和訓(xùn)練，幾乎每一個(gè)AI步驟都可以在今天找到一些辦法來進(jìn)行自動(dòng)或半自動(dòng)簡化。而國內(nèi)幾大相關(guān)廠商也推出了自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)的升級(jí)版，以此來提升復(fù)雜模型的開發(fā)效率，或者幫助進(jìn)行行業(yè)化的AI落地。

在產(chǎn)業(yè)端，自動(dòng)機(jī)器學(xué)習(xí)的最突出價(jià)值在于可以快速滲透那些缺乏AI，甚至缺乏信息化基礎(chǔ)，同時(shí)也無法進(jìn)行定制化服務(wù)的微型領(lǐng)域。比如說農(nóng)業(yè)、醫(yī)療，甚至校園場景。即使缺乏AI能力甚至編程能力的個(gè)人開發(fā)者，也可以依靠自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)很快完成一個(gè)簡單AI模型的開發(fā)，并且在手機(jī)、攝像頭等設(shè)備上完成部署。比如在一個(gè)案例中，農(nóng)村扶貧干部可以依靠類似平臺(tái)快速開發(fā)一個(gè)識(shí)別房屋、果樹、農(nóng)作物的軟件，從而加強(qiáng)扶貧工作標(biāo)準(zhǔn)化以及提升工作效率。

當(dāng)然了，自動(dòng)機(jī)器學(xué)習(xí)類軟件既然瞄準(zhǔn)的是低門檻，那么問題也隨之產(chǎn)生。這類平臺(tái)的自動(dòng)化能力，導(dǎo)致其往往難以處理復(fù)雜數(shù)據(jù)或者完成算法創(chuàng)新。而一旦給平臺(tái)加強(qiáng)更多技術(shù)能力，又容易變得更為專業(yè)復(fù)雜，不適配缺少技術(shù)能力的企業(yè)和開發(fā)者。其中的平衡點(diǎn)很難拿捏。

無論如何，近兩年我們?cè)诳吹皆絹碓蕉嗟墓I(yè)級(jí)AI項(xiàng)目開始基于自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)來搭建，AI開發(fā)的時(shí)間成本與人力成本也在極速下降。

這些真正面向解放生產(chǎn)力的升級(jí)，構(gòu)成了中國AI的最佳風(fēng)景。

大規(guī)模預(yù)訓(xùn)練模型

說到工業(yè)級(jí)AI，那么就不得不提AI應(yīng)用的另兩個(gè)核心問題：數(shù)據(jù)量和訓(xùn)練算力。

在工業(yè)、能源、金融、醫(yī)療這些行業(yè)中應(yīng)用的AI，需求特征是參數(shù)精度高、訓(xùn)練數(shù)據(jù)需求量大。但問題也來了，一家傳統(tǒng)企業(yè)去哪搞那么多數(shù)據(jù)，又哪來的算力進(jìn)行長時(shí)間、需要復(fù)雜調(diào)參優(yōu)化的模型訓(xùn)練呢？

面對(duì)這個(gè)問題，業(yè)界也有個(gè)辦法。就是平臺(tái)提供預(yù)訓(xùn)練模式，然而企業(yè)買回去進(jìn)行二次加工，從而生成自己想要的AI能力。這個(gè)邏輯很容易理解，有點(diǎn)像買熟食回家再二次烹飪一下。家里人還是會(huì)夸你手藝好，誰又在乎前面98%的步驟都是在餐廳完成的呢？

在AI領(lǐng)域，這個(gè)用半成品再加工的邏輯被叫做遷移學(xué)習(xí)。其在大數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型上再完成小數(shù)據(jù)的遷移，最終在企業(yè)用戶時(shí)間、人力成本的基礎(chǔ)上，保證了模型的精度和使用效果。

大規(guī)模預(yù)訓(xùn)練模型的邏輯很早就被提出，但近兩年在中國AI產(chǎn)業(yè)中開始不斷得到重視，形成了解決AI工業(yè)化的核心思路之一。一般來說，云計(jì)算企業(yè)會(huì)提供NLP、機(jī)器視覺等主要品類的AI預(yù)訓(xùn)練模型，或者重要行業(yè)、重要工作場景中的預(yù)訓(xùn)練模型，供企業(yè)下載部署。一方面以此帶動(dòng)企業(yè)用云量，另一方面還可以衍生出更多的智能化解決方案服務(wù)。

預(yù)訓(xùn)練模型這個(gè)領(lǐng)域的競爭主要集中在兩個(gè)方向，一是有效數(shù)據(jù)的參數(shù)規(guī)模和收斂精度，以此來決定模型在通用賽道上的能力指數(shù)；二是預(yù)訓(xùn)練模型的行業(yè)細(xì)分度，以此來決定與行業(yè)、任務(wù)場景的適配廣度。

最典型的預(yù)訓(xùn)練模型應(yīng)用場景，應(yīng)該是工業(yè)巡檢、質(zhì)檢等領(lǐng)域。這些領(lǐng)域的絕大部分?jǐn)?shù)據(jù)精度要求都是一樣的，就是識(shí)別能力的精準(zhǔn)度。這個(gè)可以在云計(jì)算廠商進(jìn)行大數(shù)據(jù)預(yù)訓(xùn)練。而廠商到底是要識(shí)別劃痕還是識(shí)別污垢，就可以回到廠里進(jìn)行遷移訓(xùn)練來搞定。

最后說說問題，預(yù)訓(xùn)練模型目前還更多屬于云計(jì)算廠商提供的附加產(chǎn)品，不像基礎(chǔ)AI算法一樣有穩(wěn)定的市場空間。究竟其前景如何還有待檢驗(yàn)。另外預(yù)訓(xùn)練模型雖然比較受企業(yè)用戶的歡迎，但商業(yè)模式還有待探索，給供應(yīng)商帶來的實(shí)際價(jià)值不太清晰。

結(jié)束語

當(dāng)中國AI走到2021，工業(yè)級(jí)、產(chǎn)業(yè)級(jí)成為了三句不離口的關(guān)鍵詞。但真正具備工業(yè)化特征的AI，其實(shí)就像齒輪、軸承、鋼筋一樣，是標(biāo)準(zhǔn)化、規(guī)?；?、低成本的產(chǎn)物，而不是某種美好的智能魔法。

中國AI開始大面積擁抱工業(yè)化、流程化、標(biāo)準(zhǔn)化，也許將構(gòu)成一個(gè)交叉點(diǎn)。這條賽道上的AI，不那么受資本關(guān)注，理論上更接近企業(yè)IT而非傳統(tǒng)意義上的AI生態(tài)，至少一點(diǎn)也不極客，不夠酷炫。

但這條路很重要，或者可以說是全球AI產(chǎn)業(yè)的一個(gè)拐點(diǎn)。尤其重要的是，中國AI的前景，不能一直被美國AI的上限所制約。行業(yè)知識(shí)圖譜、自動(dòng)機(jī)器學(xué)習(xí)這些東西其實(shí)都發(fā)源于美國，但在應(yīng)用化、平臺(tái)化和標(biāo)準(zhǔn)化上，美國AI并沒有中國業(yè)界來的干脆有力度。

至少在今天看來，沉默前行的AI工業(yè)化是一條孤獨(dú)的路。

前方一無所有，也因此給人安慰。

~END~