AI產(chǎn)業(yè)逆勢成長，為數(shù)據(jù)流程提供了一把火！

時(shí)間：2022-06-10 16:50:01

關(guān)鍵字： AI DPS 大數(shù)據(jù)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]在2022年新冠奧密疫情的影響下，各行各業(yè)都受到了影響， GDP增速、 PMI、金融貸款等數(shù)據(jù)繼續(xù)下滑。

在2022年新冠奧密疫情的影響下，各行各業(yè)都受到了影響， GDP增速、 PMI、金融貸款等數(shù)據(jù)繼續(xù)下滑。

而與疫情有關(guān)的行業(yè)，也是為數(shù)不多的亮點(diǎn)，而 AI技術(shù)，也是其中的關(guān)鍵。例如藥物開發(fā)中的輔助藥物篩選、疫苗基因設(shè)計(jì)算法等，加快了疫苗與疫苗的開發(fā);人臉識(shí)別、語音機(jī)器人、文字識(shí)別、智能流調(diào)等智能控制方案是疫情防控的核心;智能會(huì)議、智能輔助學(xué)習(xí)等工作學(xué)習(xí)情景越來越多;甚至，正在迅速發(fā)展的無人駕駛出租車、配送機(jī)器人、機(jī)器人餐廳等，都有望在未來成為一股重要的服務(wù)力量。

在未來，隨著市場的需要、政策的不斷推進(jìn)，技術(shù)的不斷成熟，中國的 AI數(shù)據(jù)服務(wù)將會(huì)有一個(gè)顯著的加速。云測數(shù)據(jù)為人工智能提供了高質(zhì)量、場景化的支持，幫助人工智能實(shí)現(xiàn)了極限的創(chuàng)新，實(shí)現(xiàn)了工業(yè)的落地。它的業(yè)務(wù)是圍繞人工智能三要素中的一項(xiàng)(算法、計(jì)算能力和數(shù)據(jù))進(jìn)行的，我們把它叫做 DPS (DPS, DataProcess Service)。

DPS是一種以數(shù)據(jù)處理過程為核心的數(shù)據(jù)處理系統(tǒng)，利用數(shù)字技術(shù)從現(xiàn)實(shí)世界或者信息系統(tǒng)中獲取數(shù)據(jù)，并根據(jù)應(yīng)用需求對(duì)數(shù)據(jù)進(jìn)行處理和輸出。DPS所提供的服務(wù)主要包括 AI、大數(shù)據(jù)、互聯(lián)網(wǎng)內(nèi)容服務(wù)等。DPS的服務(wù)結(jié)構(gòu)主要有數(shù)據(jù)收集與預(yù)處理、數(shù)據(jù)標(biāo)注、內(nèi)容審核、工具平臺(tái)及輔助服務(wù)(例如業(yè)務(wù)訓(xùn)練)等。

從監(jiān)督學(xué)習(xí)向非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的演進(jìn)

目前來看，大部分的AI應(yīng)用都是通過監(jiān)督學(xué)習(xí)，利用一組已標(biāo)注的訓(xùn)練數(shù)據(jù)，對(duì)分類器的參數(shù)進(jìn)行調(diào)整，使其達(dá)到所要求的性能。但在現(xiàn)實(shí)生活中，監(jiān)督學(xué)習(xí)不足以被稱為“智能”。對(duì)照人類的學(xué)習(xí)過程，許多都是建立在與事物的交互中，通過人類自身的體會(huì)、領(lǐng)悟，得到對(duì)事物的理解，并將之應(yīng)用于未來的生活中。而機(jī)器的局限就在于缺乏這些“常識(shí)”。

無監(jiān)督學(xué)習(xí)領(lǐng)域近期的研究重點(diǎn)在于“生成對(duì)抗網(wǎng)絡(luò)”(GANs)，而強(qiáng)化學(xué)習(xí)的一個(gè)重要研究方向在于建立一個(gè)有效的、與真實(shí)世界存在交互的仿真模擬環(huán)境，不斷訓(xùn)練，模擬采取各種動(dòng)作、接受各種反饋，以此對(duì)模型進(jìn)行訓(xùn)練。

從“堆數(shù)據(jù)”到研發(fā)低訓(xùn)練成本的算法

MIT Digital Lab的研究者聯(lián)合韓國的相關(guān)機(jī)構(gòu)在2020年發(fā)表了一項(xiàng)基于1058篇深度學(xué)習(xí)的論文和數(shù)據(jù)的研究。在分析了現(xiàn)有的深度學(xué)習(xí)論文成果后，研究人員提出了一個(gè)悲觀的預(yù)言：深度學(xué)習(xí)會(huì)隨著計(jì)算量的限制，在到達(dá)某個(gè)性能水平后停滯不前，因?yàn)樵谏疃葘W(xué)習(xí)領(lǐng)域有這樣一條規(guī)律：想提升 X 倍的性能，最少需要用 X^2倍的數(shù)據(jù)去訓(xùn)練模型，且這個(gè)過程要消耗X^4倍的計(jì)算量。即便是10倍性能提升和1萬倍計(jì)算量的提升，這樣失衡的比例關(guān)系也僅僅是理論上最優(yōu)的。在現(xiàn)實(shí)中，提升10倍性能往往要搭上10億倍的運(yùn)算量。以今天地球資源的狀況看，想把一些常用的模型錯(cuò)誤率降低到人們滿意的程度，代價(jià)高到人類不能承受。因此，在深度學(xué)習(xí)領(lǐng)域非常值得關(guān)注的是可大幅降低訓(xùn)練成本的新算法創(chuàng)新。

從數(shù)據(jù)到情報(bào)的演變，到底是怎樣的一個(gè)轉(zhuǎn)化路徑呢?

以某市霧霾輿情分析管控為例，當(dāng)輿情討論點(diǎn)產(chǎn)生時(shí)，可視化技術(shù)會(huì)基于后臺(tái)數(shù)據(jù)做串聯(lián)，從傳播軌跡、模式等方面進(jìn)行分析，提取真實(shí)數(shù)據(jù)，管控問題數(shù)據(jù)。

由此可見，在場景應(yīng)用中，無論是通過數(shù)據(jù)計(jì)算來監(jiān)測問題，還是利用數(shù)據(jù)關(guān)聯(lián)來分析問題，其實(shí)都是為了把真實(shí)世界的問題還原，用可視化建立起數(shù)據(jù)與決策之間的橋梁，最終要轉(zhuǎn)化出來的，是情報(bào)層級(jí)的信息。

在大型活動(dòng)安保中，技術(shù)怎樣輻射到場景?

每一次大型活動(dòng)，會(huì)針對(duì)活動(dòng)級(jí)別和要保障的核心點(diǎn)，去進(jìn)行相關(guān)數(shù)字模型和業(yè)務(wù)模型的匹配，再基于匹配結(jié)果將各類預(yù)警轉(zhuǎn)化為信息進(jìn)行決策和交互。

以上海進(jìn)博會(huì)為例，活動(dòng)開辦一年前，就要通過人防、技防、物防的相關(guān)手段，把所有風(fēng)險(xiǎn)點(diǎn)過濾，隨著時(shí)間的臨近，制定不同的安保預(yù)案，再進(jìn)行不同模型的設(shè)置和風(fēng)險(xiǎn)點(diǎn)的管控，直到最后一天保證活動(dòng)的整體運(yùn)行。