當(dāng)中國AI開始玩起了工業(yè)化...
本文來源:腦極體
從2017年AI借助圍棋大規(guī)模出圈開始算起,我們經(jīng)歷了這么幾個(gè)階段的變化:
第一階段,全社會(huì)一起討論AI到底有什么用;
第二階段,相關(guān)產(chǎn)學(xué)政各方一起討論,AI應(yīng)該怎么用;
第三階段,負(fù)責(zé)出錢和收錢的雙方努力討論,AI怎么用才能便宜點(diǎn)?
隨著產(chǎn)業(yè)化的推進(jìn),公眾范圍對(duì)AI的探討也隨之收窄。如今,基本看不到營銷號(hào)那些關(guān)于AI的驚悚標(biāo)題,也很少有讓業(yè)界驚喜的底層算法突破。也許有人認(rèn)為AI泡沫正在破裂,AI寒冬又將到來。但在大眾狂歡消退之余,卻又能看到商用AI正在中國市場快速興起。到了2021年,大部分云計(jì)算和AI供應(yīng)商似乎都無暇繼續(xù)討論AI的應(yīng)用場景和應(yīng)用可行性,而是專注于另一個(gè)關(guān)鍵詞:成本。
隨著AI開始變成企業(yè)服務(wù)的一種,部署成本過高開始變成業(yè)界最顯著的問題,而且在中國AI產(chǎn)業(yè)中尤甚。與其他企業(yè)IT技術(shù)不同,AI作為一種靈活多變的軟件形態(tài),需要長期投入和專業(yè)人才。這導(dǎo)致AI在大型科技公司或者平臺(tái)型企業(yè)具有非常彈性的投資曲線,可以戰(zhàn)略性投入,從而靈活多變地解決各種問題。但對(duì)于傳統(tǒng)企業(yè)、中小型企業(yè)、缺乏信息化基礎(chǔ)的企業(yè)來說,應(yīng)用AI往往能在理論上解決非常重要的問題,卻缺乏直接、可操作且成本可控的執(zhí)行方案。
回到云計(jì)算和AI服務(wù)提供商這邊,雖然面向企業(yè)賣AI理論上潛力巨大。但現(xiàn)實(shí)是每家客戶都有大量需要定制解決的需求,往往要投入眾多行業(yè)專家、算法架構(gòu)師、軟硬件工程師來解決一些細(xì)小問題。這樣做出來的成果雖然可觀,但其實(shí)只具備案例性質(zhì),缺乏推廣可能。
另一方面,疫情導(dǎo)致美國AI行業(yè)創(chuàng)新緩慢,頭部公司算法突破不理想。同時(shí)歐美的AI to B市場凈值較高,客戶數(shù)字化能力較強(qiáng)。谷歌云、微軟云的崛起雖然都與AI息息相關(guān),但適配的更多是大規(guī)模、分散式的企業(yè)軟件市場。反而中國市場中的AI目標(biāo)用戶更多是政企、實(shí)體經(jīng)濟(jì)企業(yè),需要一對(duì)一的AI能力與行業(yè)化的AI解決方案。
這種情況下,把AI技術(shù)推向高度工業(yè)化、標(biāo)準(zhǔn)化,就猛然間變成了中國科技界的獨(dú)立任務(wù)。雖然在2019年谷歌等頭部AI公司已經(jīng)開始推動(dòng)機(jī)器學(xué)習(xí)簡單化的相關(guān)技術(shù),但其目標(biāo)更多集中在所謂“AI民主化”,而非今天中國云計(jì)算與AI廠商面向的大規(guī)模AI部署與工業(yè)級(jí)AI場景。
不夸張地說,低成本的AI工業(yè)化,已經(jīng)成為目前中國AI產(chǎn)業(yè)的主線任務(wù),但相關(guān)分析卻并不充沛。本文希望討論一下中國AI工業(yè)化這條賽道的幾種產(chǎn)品邏輯,以及代表案例、商業(yè)模型。由于各家廠商的命名方案與產(chǎn)品標(biāo)準(zhǔn)并不統(tǒng)一,為免誤會(huì)這里選擇隱去具體的廠商與技術(shù)名稱。但將相關(guān)技術(shù)邏輯帶入到幾家大廠,不難發(fā)現(xiàn)聚焦程度已經(jīng)不低。
看過東野圭吾《神探伽利略》系列的朋友,可能對(duì)主角湯川學(xué)鐘愛速溶咖啡鐘愛印象深刻??此屏畠r(jià)、低端的速溶咖啡,其實(shí)凝結(jié)了噴霧干燥等20世紀(jì)初人類科學(xué)與工業(yè)能力的精髓。也正是速溶咖啡的出現(xiàn),才讓咖啡大規(guī)模生產(chǎn)、運(yùn)輸、存儲(chǔ)成為可能。
如果說,深度學(xué)習(xí)是人類發(fā)現(xiàn)了咖啡這種飲料;那么中國AI正在努力完成的,就是炮制出一杯進(jìn)擊的速溶咖啡。
真正的咖啡時(shí)代,或許更可能開啟于后者。
對(duì)于大部分企業(yè)用戶來說,AI提供的都是機(jī)器視覺、NLP體系下的幾種固定能力?;谶@些能力衍生出企業(yè)的定制化變體復(fù)雜度很高。但有一種AI技術(shù)卻很容易與企業(yè)和行業(yè)的特殊需求進(jìn)行適配,那就是知識(shí)圖譜。
知識(shí)圖譜的技術(shù)邏輯是將一些知識(shí)進(jìn)行人為關(guān)聯(lián),從而在調(diào)用A知識(shí)時(shí)驅(qū)動(dòng)B知識(shí),從而達(dá)成近乎“智能”的效果。這并不是多么新穎的技術(shù),甚至早已機(jī)器學(xué)習(xí)誕生前,知識(shí)圖譜已經(jīng)在很多領(lǐng)域有了廣泛應(yīng)用。今天在搜索引擎和電商產(chǎn)品中的相關(guān)推薦功能,很大一部分都依靠知識(shí)圖譜來完成。
在AI to B的應(yīng)用中,一個(gè)巨大問題在于企業(yè)處在特定行業(yè)里。每個(gè)行業(yè)不同的知識(shí),或者說經(jīng)驗(yàn),決定了應(yīng)用AI的需求不同、成本各異。比如說,安防場景需要的AI識(shí)別,就和質(zhì)檢場景大相徑庭。
因此一種新的AI產(chǎn)品服務(wù)模式,是技術(shù)供應(yīng)商上升為行業(yè)信息化服務(wù)商,主動(dòng)打造符合具體行業(yè)需求的知識(shí)圖譜產(chǎn)品。比如工業(yè)知識(shí)圖譜里可能包含分揀、質(zhì)檢、產(chǎn)品流程等方方面面,當(dāng)工業(yè)識(shí)別解決方案與之結(jié)合,AI就不僅能夠完成單點(diǎn)任務(wù),還可以依據(jù)行業(yè)知識(shí)圖譜完成一定程度的復(fù)雜需求,比如知識(shí)推理、知識(shí)預(yù)測等等。
類似的行業(yè)知識(shí)圖譜擁有廣泛的應(yīng)用可能性,無論是在工業(yè)、能源這樣注重“經(jīng)驗(yàn)”的場景,還是金融、物流這樣看重“數(shù)據(jù)關(guān)系”的領(lǐng)域。另外,行業(yè)知識(shí)圖譜也可以幫助AI打入那些通識(shí)類算法難以奏效的行業(yè),比如說油氣勘探、生物醫(yī)藥等等。最重要的是,如果云計(jì)算廠商提供有效的行業(yè)知識(shí)圖譜服務(wù),那么就可以免除一個(gè)個(gè)訂單去給企業(yè)做知識(shí)、經(jīng)驗(yàn)適配,從而降低人工成本。
但行業(yè)知識(shí)圖譜的問題在于,行業(yè)知識(shí)是一個(gè)非常抽象、難以標(biāo)準(zhǔn)化的版圖。每個(gè)行業(yè)有多少知識(shí)可以取公約數(shù)也是個(gè)問題。因此市面上的類似服務(wù),都大體集中在金融、能源、工業(yè)質(zhì)檢等幾個(gè)基礎(chǔ)板塊,難以細(xì)化到更具體、小眾的行業(yè)。并且行業(yè)知識(shí)圖譜已經(jīng)極大改變了云計(jì)算、AI供應(yīng)商的角色,使其從算法等基礎(chǔ)能力提供商變成了行業(yè)咨詢、行業(yè)數(shù)字化解決方案提供商,這對(duì)商業(yè)模式和行業(yè)認(rèn)可也提出了挑戰(zhàn)。
目前,與機(jī)器視覺、NLP等基礎(chǔ)能力適配的行業(yè)知識(shí)圖譜,還是中國AI界獨(dú)一份的產(chǎn)業(yè)板塊。它能走到多遠(yuǎn),或許是接下來AI產(chǎn)業(yè)一個(gè)非常重要的發(fā)展指示物。
雖然蘇大強(qiáng)都知道手磨咖啡好喝,但讓每個(gè)人都去磨咖啡顯然不現(xiàn)實(shí)。速溶咖啡的價(jià)值也因此得到了確認(rèn)。
這就像AI雖好,但每家企業(yè)都高價(jià)聘用算法架構(gòu)師,花費(fèi)大量時(shí)間做數(shù)據(jù)調(diào)優(yōu)、分類、提取也很不現(xiàn)實(shí)。為了解決這個(gè)問題,谷歌早在2018年就推出了AutoML,也就是自動(dòng)機(jī)器學(xué)習(xí)的相關(guān)工具。這類工具的基礎(chǔ)邏輯在于,盡量讓普通開發(fā)者,甚至不會(huì)寫代碼的AI應(yīng)用者,都能通過按要求上傳圖片的方式生成固定的AI模型。這些模型雖然簡單,但勝在零門檻,低成本。大眾熟知的類似應(yīng)用,可能就是以給明星換臉而出圈的deepfake。當(dāng)這東西被全球集體封殺,或許也側(cè)面證明了自動(dòng)機(jī)器學(xué)習(xí)的威力。
隨著產(chǎn)業(yè)發(fā)展,自動(dòng)機(jī)器學(xué)習(xí)也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入,今天中國AI產(chǎn)業(yè)的自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)與工具,在能力的多元化與工業(yè)化上已經(jīng)遠(yuǎn)遠(yuǎn)超過了谷歌等美國公司。廣義來看,從數(shù)據(jù)處理到數(shù)據(jù)特征提取,再到數(shù)據(jù)調(diào)參和訓(xùn)練,幾乎每一個(gè)AI步驟都可以在今天找到一些辦法來進(jìn)行自動(dòng)或半自動(dòng)簡化。而國內(nèi)幾大相關(guān)廠商也推出了自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)的升級(jí)版,以此來提升復(fù)雜模型的開發(fā)效率,或者幫助進(jìn)行行業(yè)化的AI落地。
在產(chǎn)業(yè)端,自動(dòng)機(jī)器學(xué)習(xí)的最突出價(jià)值在于可以快速滲透那些缺乏AI,甚至缺乏信息化基礎(chǔ),同時(shí)也無法進(jìn)行定制化服務(wù)的微型領(lǐng)域。比如說農(nóng)業(yè)、醫(yī)療,甚至校園場景。即使缺乏AI能力甚至編程能力的個(gè)人開發(fā)者,也可以依靠自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)很快完成一個(gè)簡單AI模型的開發(fā),并且在手機(jī)、攝像頭等設(shè)備上完成部署。比如在一個(gè)案例中,農(nóng)村扶貧干部可以依靠類似平臺(tái)快速開發(fā)一個(gè)識(shí)別房屋、果樹、農(nóng)作物的軟件,從而加強(qiáng)扶貧工作標(biāo)準(zhǔn)化以及提升工作效率。
當(dāng)然了,自動(dòng)機(jī)器學(xué)習(xí)類軟件既然瞄準(zhǔn)的是低門檻,那么問題也隨之產(chǎn)生。這類平臺(tái)的自動(dòng)化能力,導(dǎo)致其往往難以處理復(fù)雜數(shù)據(jù)或者完成算法創(chuàng)新。而一旦給平臺(tái)加強(qiáng)更多技術(shù)能力,又容易變得更為專業(yè)復(fù)雜,不適配缺少技術(shù)能力的企業(yè)和開發(fā)者。其中的平衡點(diǎn)很難拿捏。
無論如何,近兩年我們?cè)诳吹皆絹碓蕉嗟墓I(yè)級(jí)AI項(xiàng)目開始基于自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)來搭建,AI開發(fā)的時(shí)間成本與人力成本也在極速下降。
這些真正面向解放生產(chǎn)力的升級(jí),構(gòu)成了中國AI的最佳風(fēng)景。
說到工業(yè)級(jí)AI,那么就不得不提AI應(yīng)用的另兩個(gè)核心問題:數(shù)據(jù)量和訓(xùn)練算力。
在工業(yè)、能源、金融、醫(yī)療這些行業(yè)中應(yīng)用的AI,需求特征是參數(shù)精度高、訓(xùn)練數(shù)據(jù)需求量大。但問題也來了,一家傳統(tǒng)企業(yè)去哪搞那么多數(shù)據(jù),又哪來的算力進(jìn)行長時(shí)間、需要復(fù)雜調(diào)參優(yōu)化的模型訓(xùn)練呢?
面對(duì)這個(gè)問題,業(yè)界也有個(gè)辦法。就是平臺(tái)提供預(yù)訓(xùn)練模式,然而企業(yè)買回去進(jìn)行二次加工,從而生成自己想要的AI能力。這個(gè)邏輯很容易理解,有點(diǎn)像買熟食回家再二次烹飪一下。家里人還是會(huì)夸你手藝好,誰又在乎前面98%的步驟都是在餐廳完成的呢?
在AI領(lǐng)域,這個(gè)用半成品再加工的邏輯被叫做遷移學(xué)習(xí)。其在大數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型上再完成小數(shù)據(jù)的遷移,最終在企業(yè)用戶時(shí)間、人力成本的基礎(chǔ)上,保證了模型的精度和使用效果。
大規(guī)模預(yù)訓(xùn)練模型的邏輯很早就被提出,但近兩年在中國AI產(chǎn)業(yè)中開始不斷得到重視,形成了解決AI工業(yè)化的核心思路之一。一般來說,云計(jì)算企業(yè)會(huì)提供NLP、機(jī)器視覺等主要品類的AI預(yù)訓(xùn)練模型,或者重要行業(yè)、重要工作場景中的預(yù)訓(xùn)練模型,供企業(yè)下載部署。一方面以此帶動(dòng)企業(yè)用云量,另一方面還可以衍生出更多的智能化解決方案服務(wù)。
預(yù)訓(xùn)練模型這個(gè)領(lǐng)域的競爭主要集中在兩個(gè)方向,一是有效數(shù)據(jù)的參數(shù)規(guī)模和收斂精度,以此來決定模型在通用賽道上的能力指數(shù);二是預(yù)訓(xùn)練模型的行業(yè)細(xì)分度,以此來決定與行業(yè)、任務(wù)場景的適配廣度。
最典型的預(yù)訓(xùn)練模型應(yīng)用場景,應(yīng)該是工業(yè)巡檢、質(zhì)檢等領(lǐng)域。這些領(lǐng)域的絕大部分?jǐn)?shù)據(jù)精度要求都是一樣的,就是識(shí)別能力的精準(zhǔn)度。這個(gè)可以在云計(jì)算廠商進(jìn)行大數(shù)據(jù)預(yù)訓(xùn)練。而廠商到底是要識(shí)別劃痕還是識(shí)別污垢,就可以回到廠里進(jìn)行遷移訓(xùn)練來搞定。
最后說說問題,預(yù)訓(xùn)練模型目前還更多屬于云計(jì)算廠商提供的附加產(chǎn)品,不像基礎(chǔ)AI算法一樣有穩(wěn)定的市場空間。究竟其前景如何還有待檢驗(yàn)。另外預(yù)訓(xùn)練模型雖然比較受企業(yè)用戶的歡迎,但商業(yè)模式還有待探索,給供應(yīng)商帶來的實(shí)際價(jià)值不太清晰。
當(dāng)中國AI走到2021,工業(yè)級(jí)、產(chǎn)業(yè)級(jí)成為了三句不離口的關(guān)鍵詞。但真正具備工業(yè)化特征的AI,其實(shí)就像齒輪、軸承、鋼筋一樣,是標(biāo)準(zhǔn)化、規(guī)?;?、低成本的產(chǎn)物,而不是某種美好的智能魔法。
中國AI開始大面積擁抱工業(yè)化、流程化、標(biāo)準(zhǔn)化,也許將構(gòu)成一個(gè)交叉點(diǎn)。這條賽道上的AI,不那么受資本關(guān)注,理論上更接近企業(yè)IT而非傳統(tǒng)意義上的AI生態(tài),至少一點(diǎn)也不極客,不夠酷炫。
但這條路很重要,或者可以說是全球AI產(chǎn)業(yè)的一個(gè)拐點(diǎn)。尤其重要的是,中國AI的前景,不能一直被美國AI的上限所制約。行業(yè)知識(shí)圖譜、自動(dòng)機(jī)器學(xué)習(xí)這些東西其實(shí)都發(fā)源于美國,但在應(yīng)用化、平臺(tái)化和標(biāo)準(zhǔn)化上,美國AI并沒有中國業(yè)界來的干脆有力度。
至少在今天看來,沉默前行的AI工業(yè)化是一條孤獨(dú)的路。
前方一無所有,也因此給人安慰。
~END~
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請(qǐng)聯(lián)系我們,謝謝!