計算機視覺
一般來講,計算機視覺主要分為圖像分類、目標檢測、目標跟蹤和圖像分割四大基本任務(wù)。
目前,計算機視覺識別這一人工智能基礎(chǔ)應(yīng)用技術(shù)部分已達商業(yè)化應(yīng)用水平,被用于身份識別、醫(yī)學(xué)輔助診斷、自動駕駛等場景。
計算機視覺的三大熱點
在政策引導(dǎo)、技術(shù)創(chuàng)新、資本追逐以及消費需求的驅(qū)動下,基于深度學(xué)習(xí)的計算機視覺應(yīng)用不斷落地成熟,并出現(xiàn)了三大熱點應(yīng)用方向:人臉識別、視頻結(jié)構(gòu)化、姿態(tài)識別。
自然語言處理
自然語言處理(NLP)是研究計算機處理人類語言的一門技術(shù),是機器理解并解釋人類寫作與說話方式的能力,也是人工智能最初發(fā)展的切入點和目前大家關(guān)注的焦點。
自然語言處理的主要步驟包括分詞、詞法分析、語法分析、語義分析等,其應(yīng)用方向主要有文本分類和聚類、信息檢索和過濾、信息抽取、問答系統(tǒng)、機器翻譯等方向。
展望AI的五大趨勢
人工智能這座礦還遠沒有挖完,還有一籮筐的問題等待解決。
一方面,深度學(xué)習(xí)算法模型存在可靠性及不可解釋性問題,因此存在產(chǎn)生不可控結(jié)果的隱患;另一方面,當前的數(shù)據(jù)環(huán)境不夠完善,存在著流通不暢、數(shù)據(jù)質(zhì)量良莠不齊和關(guān)鍵數(shù)據(jù)集缺失等問題。
此外,推斷軟件框架質(zhì)量參差不齊,制約了業(yè)務(wù)開展,編譯器缺乏統(tǒng)一的中間表示層標準,云、側(cè)端AI芯片的市場格局有待形成。
基于技術(shù)和產(chǎn)業(yè)的發(fā)展現(xiàn)狀,信通院總結(jié)出了以下五大趨勢:
遷移學(xué)習(xí)的研究及應(yīng)用將成為重要方向。遷移學(xué)習(xí)由于側(cè)重對深度學(xué)習(xí)中知識遷移、參數(shù)遷移等技術(shù)的研究,能夠有效提升深度學(xué)習(xí)模型復(fù)用性,同時對于深度學(xué)習(xí)模型解釋也提供了一種方法,能夠針對深度學(xué)習(xí)算法模型可靠性及不可解釋性問題提供理論工具。
深度學(xué)習(xí)訓(xùn)練軟件框架將逐漸趨同,開源推斷軟件框架將迎來發(fā)展黃金期。隨著人工智能應(yīng)用在生產(chǎn)生活中的不斷深入融合,對于推斷軟件框架功能及性能的需求將逐漸爆發(fā),催生大量相關(guān)工具及開源推斷軟件框架,降低人工智能應(yīng)用部署門檻。
中間表示層之爭將愈演愈烈。以計算模型為核心的深度學(xué)習(xí)應(yīng)用,由于跨軟件框架體系開發(fā)及部署需要投入大量資源,因此模型底層表示的統(tǒng)一將是業(yè)界的亟需,未來中間表示層將成為相關(guān)企業(yè)的重點。
AI計算芯片朝云側(cè)和終端側(cè)方向發(fā)展。從云側(cè)計算芯片來看,目前GPU占據(jù)主導(dǎo)市場,以TPU為代表的ASIC只用在巨頭的閉環(huán)。生態(tài),未來GPU、TPU等計算芯片將成為支撐人工智能運算的主力器件,既存在競爭又長期共存,一定程度可相互配合;FPGA有望在數(shù)據(jù)中心中以CPU+FPGA形式作為有效補充。從終端側(cè)計算芯片來看,這類芯片將面向功耗、延時、算力、特定模型、使用場景等特定需求,朝著不同發(fā)展。
行業(yè)巨頭以服務(wù)平臺為核心打造生態(tài)鏈。對于國內(nèi)外的云服務(wù)和人工智能巨頭,如亞馬遜、微軟,阿里云、騰訊云、科大訊飛、曠視科技等企業(yè),將圍繞各自應(yīng)用,與設(shè)備商、系統(tǒng)集成商、獨立軟件開發(fā)商等聯(lián)合,為政府,企業(yè)等垂直領(lǐng)域提供一站式服務(wù),共同打造基于服務(wù)平臺的生態(tài)系統(tǒng)。
上一波的企業(yè)數(shù)字化為深度學(xué)習(xí)的產(chǎn)業(yè)化落地提供了初步引導(dǎo),隨后,人工智能相關(guān)的大數(shù)據(jù)、云服務(wù)、芯片、算法產(chǎn)業(yè)和市場格局逐漸成熟。在智能語音、計算機視覺、自然語言理解等細分技術(shù)的發(fā)展下,智能醫(yī)療、智能金融、智能汽車等“AI+”項目掀起了一波創(chuàng)投熱。無疑,AI泡沫確實存在,但AI曙光勢必降臨。