當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 從1956年達(dá)特茅斯會(huì)議提出AI開始,AI的研究經(jīng)歷幾次沉浮。在一次次的高潮和低谷的交替中,不可否認(rèn)的是,AI無論是在理論還是實(shí)踐中都取得了長(zhǎng)足的進(jìn)步。尤其是近期以深度學(xué)習(xí)為代表的AI技術(shù)取得了

從1956年達(dá)特茅斯會(huì)議提出AI開始,AI的研究經(jīng)歷幾次沉浮。在一次次的高潮和低谷的交替中,不可否認(rèn)的是,AI無論是在理論還是實(shí)踐中都取得了長(zhǎng)足的進(jìn)步。尤其是近期以深度學(xué)習(xí)為代表的AI技術(shù)取得了突破性的進(jìn)展,在計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、自然語言處理、機(jī)器人技術(shù)方面取得了巨大的進(jìn)步,深刻改變了我們的生活。在這次變革中,實(shí)驗(yàn)室的成果很快就可以進(jìn)入工業(yè)界,這在以往的技術(shù)發(fā)展史上是非常罕見的。2016年5月國家發(fā)展改革委員會(huì)等四部門聯(lián)合下發(fā)《互聯(lián)網(wǎng)+AI三年行動(dòng)實(shí)施方案》,李克強(qiáng)總理的政府報(bào)告中也提到了AI產(chǎn)業(yè)發(fā)展,中國科學(xué)技術(shù)部“科技創(chuàng)新2030重大項(xiàng)目”將增加“AI2.0”,AI已經(jīng)上升為國家戰(zhàn)略。面對(duì)AI的熱潮,我們應(yīng)該如何理解現(xiàn)狀?如何看待其進(jìn)步?又如何理解其功能和限制?本文將從AI的核心理論基礎(chǔ),當(dāng)前存在的一些問題以及未來可能發(fā)展的方向等諸多方面對(duì)AI做介紹。

一、 AI的核心基礎(chǔ)

1.專用AI算法

深度學(xué)習(xí)本質(zhì)上是一個(gè)自主學(xué)習(xí)系統(tǒng),是從傳統(tǒng)的模式識(shí)別衍生而來。通過大量數(shù)據(jù)進(jìn)行訓(xùn)練,深度學(xué)習(xí)網(wǎng)絡(luò)會(huì)自動(dòng)找到這些數(shù)據(jù)的模式,然后通過這些模式來對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。以Kaggle大賽中的貓狗分類為例,具體步驟是:(1)讓計(jì)算機(jī)“看”數(shù)以萬計(jì)包含貓和狗的圖像;(2)程序通過對(duì)圖像數(shù)據(jù)進(jìn)行分類和聚類(例如:邊緣、形狀、顏色、形狀之間的距離等)來建立模式,足夠多的的模式可以得到最終的預(yù)測(cè)模型;(3)運(yùn)行程序通過預(yù)測(cè)模型來查看新的圖像集,之后與預(yù)測(cè)模型比對(duì),確定圖像中是貓還是狗。

深度學(xué)習(xí)算法通過模擬我們大腦神經(jīng)元網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)類似人類大腦的功能。算法在運(yùn)行中會(huì)執(zhí)行各種循環(huán),通過縮小模式與實(shí)際的差距來改進(jìn)每個(gè)循環(huán)的預(yù)測(cè),最終建立一個(gè)預(yù)測(cè)模型。

安防行業(yè)中人臉識(shí)別應(yīng)用是一個(gè)很好的關(guān)于深度學(xué)習(xí)的工業(yè)應(yīng)用案例。人臉識(shí)別算法通過大量帶有標(biāo)簽的人臉數(shù)據(jù)來訓(xùn)練模型,算法會(huì)自動(dòng)識(shí)別出人臉的關(guān)鍵點(diǎn)。通過調(diào)用算法,設(shè)備會(huì)捕獲到多個(gè)關(guān)鍵點(diǎn),這些關(guān)鍵點(diǎn)會(huì)送到深度學(xué)習(xí)模型中,通過內(nèi)置引擎和執(zhí)行預(yù)測(cè)模型判斷是誰。

強(qiáng)化學(xué)習(xí)也是一種自主學(xué)習(xí)系統(tǒng),但它主要是通過反復(fù)試驗(yàn)來學(xué)習(xí)的。通過有限次執(zhí)行行動(dòng)以得到最大化獎(jiǎng)勵(lì)從而確定答案,換句話說,它是通過實(shí)踐來學(xué)習(xí),從實(shí)踐中找到結(jié)果。這就好比小時(shí)候?qū)W習(xí)騎自行車,剛開始的時(shí)候會(huì)經(jīng)常摔倒,但隨著摔的次數(shù)多了,慢慢就掌握竅門了,這個(gè)學(xué)習(xí)的過程就是強(qiáng)化學(xué)習(xí)。當(dāng)計(jì)算機(jī)使用強(qiáng)化學(xué)習(xí)時(shí),它們會(huì)嘗試不同的行為,從反饋中學(xué)習(xí)該行為是否能夠得到更好的結(jié)果,然后將能得到好結(jié)果的行為記住,規(guī)范點(diǎn)說就是計(jì)算機(jī)在多次迭代中進(jìn)行自主重新修正算法,直到能做出正確的判斷為止。

使用強(qiáng)化學(xué)習(xí)一個(gè)很好的例子是讓機(jī)器人學(xué)習(xí)走路。首先機(jī)器人向前邁出一大步然后跌倒,這一大步和摔倒是強(qiáng)化學(xué)習(xí)系統(tǒng)關(guān)注的響應(yīng)點(diǎn)。由于反饋是負(fù)面的,所以繼續(xù)調(diào)整,系統(tǒng)會(huì)根據(jù)多個(gè)負(fù)反饋進(jìn)行調(diào)整,最終確定機(jī)器人應(yīng)該把步子邁小一點(diǎn),不停地小,直到機(jī)器人走路不會(huì)摔倒為止。

深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)首先都是自主學(xué)習(xí)系統(tǒng)。它們之間的區(qū)別在于,深度學(xué)習(xí)是從訓(xùn)練集中學(xué)習(xí),然后將學(xué)習(xí)到的知識(shí)應(yīng)用于新數(shù)據(jù)集,這是一種靜態(tài)學(xué)習(xí)。而強(qiáng)化學(xué)習(xí)是通過連續(xù)的反饋來調(diào)整自身的動(dòng)作以獲得理想結(jié)果,是一種不斷試錯(cuò)的過程,這是動(dòng)態(tài)學(xué)習(xí)。另外現(xiàn)階段投入市場(chǎng)應(yīng)用的深度學(xué)習(xí)算法和強(qiáng)化學(xué)習(xí)算法都屬于有監(jiān)督學(xué)習(xí),不同于無監(jiān)督學(xué)習(xí)在數(shù)據(jù)集中自動(dòng)尋找規(guī)律,有監(jiān)督學(xué)習(xí)需要大量已標(biāo)注的訓(xùn)練數(shù)據(jù)作為訓(xùn)練集,在訓(xùn)練集中尋找規(guī)律。

深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)都屬于專用AI算法,在面向特定任務(wù)(比如下圍棋、分類、檢測(cè))時(shí),由于任務(wù)單一、需求明確、應(yīng)用邊界清晰、領(lǐng)域知識(shí)豐富、模型相對(duì)簡(jiǎn)單,形成了AI的單項(xiàng)突破,在單項(xiàng)測(cè)試中可以超過人類智能。AlphaGo在圍棋比賽中戰(zhàn)勝人類獲得冠軍,AI程序在大規(guī)模圖像識(shí)別和人臉識(shí)別中超過了人類水平,AI系統(tǒng)診斷皮膚癌達(dá)到專業(yè)醫(yī)生的水平。

2.算力

除了專用AI算法,近些年計(jì)算機(jī)硬件的發(fā)展構(gòu)成了AI發(fā)展的基礎(chǔ)。AI早期進(jìn)入第一個(gè)發(fā)展低谷的原因之一正是因?yàn)橛?jì)算機(jī)計(jì)算能力不足。深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練本質(zhì)就是矩陣運(yùn)算,反向傳播尋找整個(gè)網(wǎng)絡(luò)的損失最小值,使得訓(xùn)練很容易并行化。使用英偉達(dá)GPU可以大大加快深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,越來越多傳統(tǒng)的信息廠商都在利用英偉達(dá)的GPU構(gòu)建GPU集群。Intel的Xeon芯片提供了強(qiáng)大的多核計(jì)算能力,而且可以在服務(wù)器上組成多路,以及通過多節(jié)點(diǎn)集群進(jìn)行并行優(yōu)化計(jì)算。對(duì)于負(fù)載不是特別大的任務(wù)可以直接用cpu完成,目前Intel正在開發(fā)將cpu和FPGA計(jì)算能力整合的芯片。

專用的神經(jīng)網(wǎng)絡(luò)芯片發(fā)展迅速,主要有FPGA、DSPASIC、ARM擴(kuò)展模塊等技術(shù)路線,具有速度快、帶寬高、功耗低等特點(diǎn),主要面向移動(dòng)和嵌入式系統(tǒng)。很多廠家在芯片里已經(jīng)固化的圖像處理、目標(biāo)識(shí)別等基礎(chǔ)模型和算法,快速集成到嵌入式設(shè)備中,目前主要功能以人臉識(shí)別、照片分類、圖像處理、圖像風(fēng)格遷移、圖像超分辨率重建、車牌識(shí)別、智能安防、自動(dòng)駕駛、無人機(jī)姿態(tài)保持與位置追蹤等領(lǐng)域?yàn)橹鳌?/p>

3.數(shù)據(jù)

當(dāng)前正處于數(shù)據(jù)爆發(fā)的時(shí)代。根據(jù)希捷科技贊助、國際數(shù)據(jù)公司(IDC)發(fā)布的白皮書《數(shù)據(jù)時(shí)代2025》預(yù)測(cè):到2025年,全球數(shù)據(jù)圈將擴(kuò)展至163ZB,相當(dāng)于2016年所產(chǎn)生16.1ZB數(shù)據(jù)的十倍;屬于數(shù)據(jù)分析的全球數(shù)據(jù)總量將增長(zhǎng)至原來的50倍,達(dá)到5.2ZB;而認(rèn)知系統(tǒng)“觸及”的分析數(shù)據(jù)總量將增長(zhǎng)至原來的100倍,達(dá)到1.4ZB。大量涌現(xiàn)的數(shù)據(jù)催生出了一系列全新的技術(shù),AI將數(shù)據(jù)分析從不常見的、追溯式的實(shí)踐轉(zhuǎn)變?yōu)閼?zhàn)略決策和行動(dòng)的推動(dòng)因素。

二、存在的一些問題

1.數(shù)據(jù)成本

前面提到過,在工業(yè)領(lǐng)域廣泛應(yīng)用深度學(xué)習(xí)網(wǎng)絡(luò)需要大量的已經(jīng)標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練才有可能達(dá)到預(yù)期的效果,這些訓(xùn)練數(shù)據(jù)的標(biāo)注需要人為進(jìn)行,這造成巨大的人力成本。雖然互聯(lián)網(wǎng)有著取之不盡的海量數(shù)據(jù),但是絕大部分都是未進(jìn)行標(biāo)注的數(shù)據(jù)。為了解決這個(gè)問題,可以從以下兩方面嘗試解決:

(1)無監(jiān)督學(xué)習(xí)

相對(duì)于監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)能夠充分利用這些數(shù)據(jù),不需要花費(fèi)大量的人力物力去標(biāo)注訓(xùn)練數(shù)據(jù),這樣就大大減少了訓(xùn)練模型的成本。另一方面,目前的深度學(xué)習(xí)模型的訓(xùn)練需要使用大量的數(shù)據(jù)。

(2)小樣本學(xué)習(xí)

機(jī)器學(xué)習(xí)能力與人的學(xué)習(xí)能力相差甚遠(yuǎn),比如小孩只需要幾張貓的照片就能準(zhǔn)確的識(shí)別貓,但是深度學(xué)習(xí)的模型需要幾百萬張圖像,目前很熱門的自動(dòng)駕駛技術(shù),需要幾百萬公里才能訓(xùn)練到令人滿意的效果,但是人只需要幾千公里就可以成為老司機(jī)。事實(shí)上,小樣本學(xué)習(xí)更接近人的智能模型,小樣本學(xué)習(xí)能力的發(fā)展能夠?qū)I技術(shù)應(yīng)用到更多更廣泛的領(lǐng)域。小樣本學(xué)習(xí)研究的一個(gè)重大突破是三名分別來自麻省理工學(xué)院、紐約大學(xué)和多倫多大學(xué)的研究者在2015年提出的“Bayesian?Program?Learning”方法,并利用它解決?“看一眼就會(huì)寫字”的問題。

2.模型可解釋性

AI另一個(gè)難題就是機(jī)器學(xué)習(xí)模型的可解釋性和穩(wěn)定性。目前大部分機(jī)器學(xué)習(xí)模型都是“黑盒”模型,很難讓人理解。而且模型穩(wěn)定性也一直是個(gè)問題,例如給圖片加些白噪音,深度學(xué)習(xí)模型會(huì)給出令人大跌眼鏡的預(yù)測(cè)結(jié)果。

3.模型大小限制

目前的計(jì)算能力難以訓(xùn)練大型的深度學(xué)習(xí)模型,比如GB級(jí)的模型訓(xùn)練過程對(duì)帶寬要求很高。GPU比CPU更適合訓(xùn)練深度學(xué)習(xí)模型的原因之一是,相對(duì)于內(nèi)存來說顯存的帶寬更大。另外模型很大往往會(huì)過度擬合基準(zhǔn)數(shù)據(jù),并不會(huì)從樣本中提取更抽象的特征,在實(shí)際應(yīng)用中,如果深度網(wǎng)絡(luò)有偏差將會(huì)帶來非常嚴(yán)重的后果。比如在訓(xùn)練自動(dòng)駕駛的數(shù)據(jù)集中,不會(huì)有嬰兒坐在馬路中間。深度神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)準(zhǔn)的對(duì)抗性攻擊很敏感,這些攻擊會(huì)對(duì)圖像造成人類難以察覺的變化,但會(huì)改變神經(jīng)網(wǎng)絡(luò)對(duì)物體的認(rèn)知。Alan Yuille說這些問題的背后都是組合爆炸導(dǎo)致的,真實(shí)世界的圖像利用組合觀點(diǎn)來看數(shù)量太大了,從一定程度上說是無限的。任何一個(gè)數(shù)據(jù)集,不管多大,都很難表達(dá)出現(xiàn)實(shí)的復(fù)雜程度。

4.泛化性能

從專用智能算法到通用智能算法是下一代AI發(fā)展的必然趨勢(shì),也是研究與應(yīng)用領(lǐng)域需要挑戰(zhàn)的問題。通用智能被認(rèn)為是AI皇冠上的明珠,從目標(biāo)來看,通用智能意味著神經(jīng)網(wǎng)絡(luò)泛化能力的提高,為了解決這個(gè)問題,科研人員進(jìn)行了各種努力。從正則化技術(shù)到dropout技術(shù)再到BN技術(shù),這些技巧從一定程度上減緩了神經(jīng)網(wǎng)絡(luò)過度擬合的問題,提高了泛化能力。但是這些只是技巧,并不能從根本上解決問題。目前解決這個(gè)問題的方法是遷移學(xué)習(xí),遷移學(xué)習(xí)是將一個(gè)場(chǎng)景中學(xué)到的知識(shí)遷移到另一個(gè)場(chǎng)景中。比如我們可以將利用貓和狗圖像訓(xùn)練的分類模型遷移到其他相似的任務(wù),用來分別鷹和布谷鳥。利用遷移學(xué)習(xí),在一個(gè)模型訓(xùn)練任務(wù)中針對(duì)某種類型數(shù)據(jù)獲得的關(guān)系也可以輕松地應(yīng)用于同一領(lǐng)域的不同問題。遷移學(xué)習(xí)一定程度上緩解了標(biāo)記數(shù)據(jù)的壓力,對(duì)于我們接近通用AI邁進(jìn)了一步。

三、發(fā)展趨勢(shì)

雖然深度學(xué)習(xí)在某些方面還是存在一些不足,但是目前科學(xué)界已經(jīng)有了一些可喜的突破,并且基于深度學(xué)習(xí)的AI深刻地改變了人們的生活,未來AI將會(huì)更加快速地發(fā)展,本文認(rèn)為有以下四個(gè)發(fā)展趨勢(shì):

1.AI芯片加速發(fā)展

即使是快和先進(jìn)的CPU也無法提高AI模型的速度,在AI模型運(yùn)行的時(shí)候,需要額外的硬件來進(jìn)行復(fù)雜的數(shù)學(xué)計(jì)算。尤其是前端設(shè)備,在安防行業(yè)中的應(yīng)用,需要體積更小,功能更加強(qiáng)大的嵌入式芯片來運(yùn)行性能更好的算法,用于實(shí)時(shí)跟蹤、面部識(shí)別等應(yīng)用。

2.AI邊緣計(jì)算以及物聯(lián)網(wǎng)融合開發(fā)

目前AI在邊緣側(cè)不斷發(fā)展是駕馭數(shù)據(jù)洪流的關(guān)鍵之一,也是物聯(lián)網(wǎng)未來發(fā)展的重要趨勢(shì)。隨著AI技術(shù)如火如荼地發(fā)展,海量數(shù)據(jù)需要快速有效的提取和分析,這大大加強(qiáng)了對(duì)于邊緣計(jì)算的需求。未來AI技術(shù)、邊緣計(jì)算和物聯(lián)網(wǎng)將更加密切進(jìn)行融合發(fā)展,尤其在安防行業(yè)視頻監(jiān)控領(lǐng)域的應(yīng)用。

(1)神經(jīng)網(wǎng)絡(luò)之間的互操作性

神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是基于框架的,一旦模型在特定的框架中完成了訓(xùn)練和評(píng)估就很難移植到另一個(gè)框架,這阻礙了AI的發(fā)展,未來神經(jīng)網(wǎng)絡(luò)之間的互操作性將成為AI行業(yè)的重要技術(shù)。

(2)自動(dòng)化AI將會(huì)更加突出

從根本上改變AI解決方案的一個(gè)趨勢(shì)是自動(dòng)化AI,它使業(yè)務(wù)分析師和開發(fā)人員能夠高效發(fā)掘出可以解決復(fù)雜場(chǎng)景的機(jī)器學(xué)習(xí)模型,而無需經(jīng)過機(jī)器學(xué)習(xí)模型的典型培訓(xùn),業(yè)務(wù)分析師可以更加專注于業(yè)務(wù)問題。

四、結(jié)語

AI技術(shù)一直處于計(jì)算機(jī)技術(shù)的前沿,其研究的理論和發(fā)展在很大程度上將決定計(jì)算機(jī)技術(shù)的發(fā)展方向。目前很多AI的研究成果深刻地改變著人們的生活,將來,AI的發(fā)展將會(huì)更加快速,會(huì)給人們的生活工作和教育帶來更大的影響。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉