人工智能的現狀怎樣

時間：2020-04-27 12:48:02

關鍵字：人工智能神經網絡機器學習預測模型

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 從1956年達特茅斯會議提出AI開始，AI的研究經歷幾次沉浮。在一次次的高潮和低谷的交替中，不可否認的是，AI無論是在理論還是實踐中都取得了長足的進步。尤其是近期以深度學習為代表的AI技術取得了

從1956年達特茅斯會議提出AI開始，AI的研究經歷幾次沉浮。在一次次的高潮和低谷的交替中，不可否認的是，AI無論是在理論還是實踐中都取得了長足的進步。尤其是近期以深度學習為代表的AI技術取得了突破性的進展，在計算機視覺、機器學習、自然語言處理、機器人技術方面取得了巨大的進步，深刻改變了我們的生活。在這次變革中，實驗室的成果很快就可以進入工業(yè)界，這在以往的技術發(fā)展史上是非常罕見的。2016年5月國家發(fā)展改革委員會等四部門聯合下發(fā)《互聯網+AI三年行動實施方案》，李克強總理的政府報告中也提到了AI產業(yè)發(fā)展，中國科學技術部“科技創(chuàng)新2030重大項目”將增加“AI2.0”，AI已經上升為國家戰(zhàn)略。面對AI的熱潮，我們應該如何理解現狀？如何看待其進步？又如何理解其功能和限制？本文將從AI的核心理論基礎，當前存在的一些問題以及未來可能發(fā)展的方向等諸多方面對AI做介紹。

一、 AI的核心基礎

1.專用AI算法

深度學習本質上是一個自主學習系統(tǒng)，是從傳統(tǒng)的模式識別衍生而來。通過大量數據進行訓練，深度學習網絡會自動找到這些數據的模式，然后通過這些模式來對未知數據進行預測。以Kaggle大賽中的貓狗分類為例，具體步驟是：（1）讓計算機“看”數以萬計包含貓和狗的圖像；（2）程序通過對圖像數據進行分類和聚類（例如：邊緣、形狀、顏色、形狀之間的距離等）來建立模式，足夠多的的模式可以得到最終的預測模型；（3）運行程序通過預測模型來查看新的圖像集，之后與預測模型比對，確定圖像中是貓還是狗。

深度學習算法通過模擬我們大腦神經元網絡的人工神經網絡來實現類似人類大腦的功能。算法在運行中會執(zhí)行各種循環(huán)，通過縮小模式與實際的差距來改進每個循環(huán)的預測，最終建立一個預測模型。

安防行業(yè)中人臉識別應用是一個很好的關于深度學習的工業(yè)應用案例。人臉識別算法通過大量帶有標簽的人臉數據來訓練模型，算法會自動識別出人臉的關鍵點。通過調用算法，設備會捕獲到多個關鍵點，這些關鍵點會送到深度學習模型中，通過內置引擎和執(zhí)行預測模型判斷是誰。

強化學習也是一種自主學習系統(tǒng)，但它主要是通過反復試驗來學習的。通過有限次執(zhí)行行動以得到最大化獎勵從而確定答案，換句話說，它是通過實踐來學習，從實踐中找到結果。這就好比小時候學習騎自行車，剛開始的時候會經常摔倒，但隨著摔的次數多了，慢慢就掌握竅門了，這個學習的過程就是強化學習。當計算機使用強化學習時，它們會嘗試不同的行為，從反饋中學習該行為是否能夠得到更好的結果，然后將能得到好結果的行為記住，規(guī)范點說就是計算機在多次迭代中進行自主重新修正算法，直到能做出正確的判斷為止。

使用強化學習一個很好的例子是讓機器人學習走路。首先機器人向前邁出一大步然后跌倒，這一大步和摔倒是強化學習系統(tǒng)關注的響應點。由于反饋是負面的，所以繼續(xù)調整，系統(tǒng)會根據多個負反饋進行調整，最終確定機器人應該把步子邁小一點，不停地小，直到機器人走路不會摔倒為止。

深度學習和強化學習首先都是自主學習系統(tǒng)。它們之間的區(qū)別在于，深度學習是從訓練集中學習，然后將學習到的知識應用于新數據集，這是一種靜態(tài)學習。而強化學習是通過連續(xù)的反饋來調整自身的動作以獲得理想結果，是一種不斷試錯的過程，這是動態(tài)學習。另外現階段投入市場應用的深度學習算法和強化學習算法都屬于有監(jiān)督學習，不同于無監(jiān)督學習在數據集中自動尋找規(guī)律，有監(jiān)督學習需要大量已標注的訓練數據作為訓練集，在訓練集中尋找規(guī)律。

深度學習和強化學習都屬于專用AI算法，在面向特定任務（比如下圍棋、分類、檢測）時，由于任務單一、需求明確、應用邊界清晰、領域知識豐富、模型相對簡單，形成了AI的單項突破，在單項測試中可以超過人類智能。AlphaGo在圍棋比賽中戰(zhàn)勝人類獲得冠軍，AI程序在大規(guī)模圖像識別和人臉識別中超過了人類水平，AI系統(tǒng)診斷皮膚癌達到專業(yè)醫(yī)生的水平。

2.算力

除了專用AI算法，近些年計算機硬件的發(fā)展構成了AI發(fā)展的基礎。AI早期進入第一個發(fā)展低谷的原因之一正是因為計算機計算能力不足。深度神經網絡的訓練本質就是矩陣運算，反向傳播尋找整個網絡的損失最小值，使得訓練很容易并行化。使用英偉達的GPU可以大大加快深度神經網絡的訓練速度，越來越多傳統(tǒng)的信息廠商都在利用英偉達的GPU構建GPU集群。Intel的Xeon芯片提供了強大的多核計算能力，而且可以在服務器上組成多路，以及通過多節(jié)點集群進行并行優(yōu)化計算。對于負載不是特別大的任務可以直接用cpu完成，目前Intel正在開發(fā)將cpu和FPGA計算能力整合的芯片。

專用的神經網絡芯片發(fā)展迅速，主要有FPGA、DSP、ASIC、ARM擴展模塊等技術路線，具有速度快、帶寬高、功耗低等特點，主要面向移動和嵌入式系統(tǒng)。很多廠家在芯片里已經固化的圖像處理、目標識別等基礎模型和算法，快速集成到嵌入式設備中，目前主要功能以人臉識別、照片分類、圖像處理、圖像風格遷移、圖像超分辨率重建、車牌識別、智能安防、自動駕駛、無人機姿態(tài)保持與位置追蹤等領域為主。

3.數據

當前正處于數據爆發(fā)的時代。根據希捷科技贊助、國際數據公司（IDC）發(fā)布的白皮書《數據時代2025》預測：到2025年，全球數據圈將擴展至163ZB，相當于2016年所產生16.1ZB數據的十倍；屬于數據分析的全球數據總量將增長至原來的50倍，達到5.2ZB；而認知系統(tǒng)“觸及”的分析數據總量將增長至原來的100倍，達到1.4ZB。大量涌現的數據催生出了一系列全新的技術，AI將數據分析從不常見的、追溯式的實踐轉變?yōu)閼?zhàn)略決策和行動的推動因素。

二、存在的一些問題

1.數據成本

前面提到過，在工業(yè)領域廣泛應用深度學習網絡需要大量的已經標注的數據進行訓練才有可能達到預期的效果，這些訓練數據的標注需要人為進行，這造成巨大的人力成本。雖然互聯網有著取之不盡的海量數據，但是絕大部分都是未進行標注的數據。為了解決這個問題，可以從以下兩方面嘗試解決：

（1）無監(jiān)督學習

相對于監(jiān)督學習，無監(jiān)督學習能夠充分利用這些數據，不需要花費大量的人力物力去標注訓練數據，這樣就大大減少了訓練模型的成本。另一方面，目前的深度學習模型的訓練需要使用大量的數據。

（2）小樣本學習

機器學習能力與人的學習能力相差甚遠，比如小孩只需要幾張貓的照片就能準確的識別貓，但是深度學習的模型需要幾百萬張圖像，目前很熱門的自動駕駛技術，需要幾百萬公里才能訓練到令人滿意的效果，但是人只需要幾千公里就可以成為老司機。事實上，小樣本學習更接近人的智能模型，小樣本學習能力的發(fā)展能夠將AI技術應用到更多更廣泛的領域。小樣本學習研究的一個重大突破是三名分別來自麻省理工學院、紐約大學和多倫多大學的研究者在2015年提出的“Bayesian?Program?Learning”方法，并利用它解決?“看一眼就會寫字”的問題。

2.模型可解釋性

AI另一個難題就是機器學習模型的可解釋性和穩(wěn)定性。目前大部分機器學習模型都是“黑盒”模型，很難讓人理解。而且模型穩(wěn)定性也一直是個問題，例如給圖片加些白噪音，深度學習模型會給出令人大跌眼鏡的預測結果。

3.模型大小限制

目前的計算能力難以訓練大型的深度學習模型，比如GB級的模型訓練過程對帶寬要求很高。GPU比CPU更適合訓練深度學習模型的原因之一是，相對于內存來說顯存的帶寬更大。另外模型很大往往會過度擬合基準數據，并不會從樣本中提取更抽象的特征，在實際應用中，如果深度網絡有偏差將會帶來非常嚴重的后果。比如在訓練自動駕駛的數據集中，不會有嬰兒坐在馬路中間。深度神經網絡對標準的對抗性攻擊很敏感，這些攻擊會對圖像造成人類難以察覺的變化，但會改變神經網絡對物體的認知。Alan Yuille說這些問題的背后都是組合爆炸導致的，真實世界的圖像利用組合觀點來看數量太大了，從一定程度上說是無限的。任何一個數據集，不管多大，都很難表達出現實的復雜程度。

4.泛化性能

從專用智能算法到通用智能算法是下一代AI發(fā)展的必然趨勢，也是研究與應用領域需要挑戰(zhàn)的問題。通用智能被認為是AI皇冠上的明珠，從目標來看，通用智能意味著神經網絡泛化能力的提高，為了解決這個問題，科研人員進行了各種努力。從正則化技術到dropout技術再到BN技術，這些技巧從一定程度上減緩了神經網絡過度擬合的問題，提高了泛化能力。但是這些只是技巧，并不能從根本上解決問題。目前解決這個問題的方法是遷移學習，遷移學習是將一個場景中學到的知識遷移到另一個場景中。比如我們可以將利用貓和狗圖像訓練的分類模型遷移到其他相似的任務，用來分別鷹和布谷鳥。利用遷移學習，在一個模型訓練任務中針對某種類型數據獲得的關系也可以輕松地應用于同一領域的不同問題。遷移學習一定程度上緩解了標記數據的壓力，對于我們接近通用AI邁進了一步。

三、發(fā)展趨勢

雖然深度學習在某些方面還是存在一些不足，但是目前科學界已經有了一些可喜的突破，并且基于深度學習的AI深刻地改變了人們的生活，未來AI將會更加快速地發(fā)展，本文認為有以下四個發(fā)展趨勢：

1.AI芯片加速發(fā)展

即使是快和先進的CPU也無法提高AI模型的速度，在AI模型運行的時候，需要額外的硬件來進行復雜的數學計算。尤其是前端設備，在安防行業(yè)中的應用，需要體積更小，功能更加強大的嵌入式芯片來運行性能更好的算法，用于實時跟蹤、面部識別等應用。

2.AI邊緣計算以及物聯網融合開發(fā)

目前AI在邊緣側不斷發(fā)展是駕馭數據洪流的關鍵之一，也是物聯網未來發(fā)展的重要趨勢。隨著AI技術如火如荼地發(fā)展，海量數據需要快速有效的提取和分析，這大大加強了對于邊緣計算的需求。未來AI技術、邊緣計算和物聯網將更加密切進行融合發(fā)展，尤其在安防行業(yè)視頻監(jiān)控領域的應用。

（1）神經網絡之間的互操作性

神經網絡的訓練是基于框架的，一旦模型在特定的框架中完成了訓練和評估就很難移植到另一個框架，這阻礙了AI的發(fā)展，未來神經網絡之間的互操作性將成為AI行業(yè)的重要技術。

（2）自動化AI將會更加突出

從根本上改變AI解決方案的一個趨勢是自動化AI，它使業(yè)務分析師和開發(fā)人員能夠高效發(fā)掘出可以解決復雜場景的機器學習模型，而無需經過機器學習模型的典型培訓，業(yè)務分析師可以更加專注于業(yè)務問題。

四、結語

AI技術一直處于計算機技術的前沿，其研究的理論和發(fā)展在很大程度上將決定計算機技術的發(fā)展方向。目前很多AI的研究成果深刻地改變著人們的生活，將來，AI的發(fā)展將會更加快速，會給人們的生活工作和教育帶來更大的影響。