計算機視覺正在促進人工智能行業(yè)的高速發(fā)展
中央明確指示要加快推進國家規(guī)劃已明確的重大工程和基礎(chǔ)設(shè)施建設(shè),其中要加快 5G 網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進度。相比于傳統(tǒng)的"鐵公基",新基建是立足于高新科技的基礎(chǔ)設(shè)施建設(shè),主要包括5G基建、特高壓、城際高速鐵路和城市軌道交通、新能源汽車充電樁、大數(shù)據(jù)中心、人工智能、工業(yè)互聯(lián)網(wǎng)等七大領(lǐng)域。
當前人工智能理論和技術(shù)日益成熟,應用范圍不斷擴大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應的商業(yè)模式也在持續(xù)演進和多元化。據(jù)IDC統(tǒng)計,2018年我國人工智能市場規(guī)模為161.9億元,預計到2022年市場規(guī)模將接近700億元,年復合增長率超過50%。據(jù)中國人工智能學會和羅蘭貝格咨詢公司預測,2025年市場規(guī)模將達到3萬億美元。
?
以深度學習為代表的人工智能算法的出現(xiàn)極大推動了視覺人工智能行業(yè)的發(fā)展。計算機視覺是人工智能行業(yè)的最大組成部分,與其他細分的比較來看,計算機視覺技術(shù)應用的市場規(guī)模也遠遠大于其他細分。
計算機視覺(Computer Vision) 人工智能主要應用領(lǐng)域之一,起源于20世紀80年代的神經(jīng)網(wǎng)絡(luò)技術(shù),通過使用光學系統(tǒng)和圖像處理工具等來模擬人的視覺能力捕捉和處理場景的三維信息,理解并通過指揮特定的裝置執(zhí)行決策。2015年以來,全球科技界和產(chǎn)業(yè)界高度重視視覺人工智能研究和應用,在核心技術(shù)和產(chǎn)業(yè)化應用的研發(fā)投入持續(xù)倍增。
計算機視覺能極大提升機器的圖像感知能力和認知能力,因此應用場景十分廣闊,商業(yè)化變現(xiàn)空間大。
根據(jù)前瞻產(chǎn)業(yè)研究院的統(tǒng)計,國內(nèi)人工智能企業(yè)中,有高達42%的企業(yè)應用計算機視覺相關(guān)技術(shù),其次是語音和自然語言處理,分別占比24%、19%,兩者之和才與計算機視覺占比相當。在安防影像分析、泛金融身份認證、手機和互聯(lián)網(wǎng)娛樂、批發(fā)零售商品識別、工業(yè)制造、廣告營銷、自動駕駛、醫(yī)療影像分析等領(lǐng)域都具有巨大應用價值。
視覺人工智能行業(yè)的發(fā)展,離不開技術(shù)的驅(qū)動:一方面諸如GPU、FPGA、ASIC等一系列AI芯片的出現(xiàn)極大提升了芯片計算能力,突破了傳統(tǒng)CPU的算力瓶頸;另一方面以深學習為代表的AI算法的崛起,使得AI視覺的識別能力有了很大的提高。硬件算力的提升以及軟件算法的進步都對視覺人工智能的發(fā)展起到了重要的推動作用。
計算機視覺的工作流程包含四個模塊:檢測、分類、跟蹤與語義分割。具體為成像設(shè)備首先捕獲圖像,然后對每個圖像進行預處理,提取特征后輸入到分類模型中。
計算機視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計算機分析。
圖像可以由單個或者多個傳感器獲取,也可以是單個傳感器在不同時刻獲取的圖像序列。在消費級領(lǐng)域,隨著數(shù)據(jù)量上漲、運算力提升和深度學習算法的發(fā)展,計算機視覺技術(shù)越來越多地被應用在各類消費級應用場景中,典型的如人臉識別服務(wù),具體包括人臉檢測、人臉關(guān)鍵特征點、人臉對比、人臉搜索、人臉屬性、人臉聚類、人力活體檢測等。
計算機視覺實現(xiàn)了計算機“看得懂”,人臉識別、OCR和圖像結(jié)構(gòu)化是其主要應用場景。計算機視覺是用計算機模擬人眼對目標進行識別、跟蹤和測量,并且對圖形進行處理,即實現(xiàn)計算機“看得懂”。
根據(jù)億歐智庫《2019計算機視覺人臉識別市場研究報告》顯示,2018年中國計算機視覺人臉識別市場規(guī)模為151.7億元,預計2021年將達530億元,年均復合增長率53%,市場規(guī)模增長迅速。
計算機視覺行業(yè)產(chǎn)業(yè)鏈由上游基礎(chǔ)層、中游技術(shù)層以及下游應用層組成。
上游基礎(chǔ)層基礎(chǔ)層:主要包括CPU、GPU等芯片硬件,深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等算法,以及由真實數(shù)據(jù)和模擬數(shù)據(jù)共同構(gòu)成的數(shù)據(jù)集。核心芯片被Intel、Nvidia等傳統(tǒng)芯片廠商把控,新型芯片廠商尚未崛起,規(guī)模應用有待時日;開源平臺以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業(yè)的深度學習框架多為二次開發(fā);
中游技術(shù)層主要包括視頻識別、圖片識別、模式匹配等嵌入式視覺軟件,以及一站式解決方案。算法,初創(chuàng)企業(yè)占優(yōu);云計算,幾乎被AWS、Google Cloud、Azure、阿里云等壟斷。
下游應用層:為計算機視覺的落地場景,包括智慧安防、智慧金融、手機應用、無人駕駛等商業(yè)領(lǐng)域。垂直行業(yè)龍頭占據(jù)場景,技術(shù)層初創(chuàng)企業(yè)向上滲透。
國內(nèi)計算機視覺的玩家有三類:
1.??低?/u>、大華股份、宇視科技等安防廠商
安防影像分析的市場需求驅(qū)動此類企業(yè)的技術(shù)研發(fā)。在云邊融合的架構(gòu)下,近年來安防行業(yè)頭部廠商紛紛推出自家智能化產(chǎn)品和解決方案。
作為人工智能范疇中最關(guān)鍵的子領(lǐng)域之一(人類從外界獲取的信息中有80%~85%是依靠視覺實現(xiàn)的),計算機視覺技術(shù)的愿景是利用攝像機等視覺傳感裝置來代替人眼對物體進行識別、跟蹤和測量,再由計算機處理這些視覺信息,從而達到像人眼一樣對事物進行感知和認知,直接對應安防監(jiān)控系統(tǒng)“看得懂”的需求。
2.互聯(lián)網(wǎng)巨頭公司
近年來基于深度學習的智能語音、計算機視覺、自然語言處理等技術(shù)開始向各個應用領(lǐng)域滲透,全球人工智能產(chǎn)業(yè)規(guī)模快速增長。為搶占人工智能高地,谷歌、微軟、阿里巴巴、百度、騰訊、IBM、Facebook 等國際知名企業(yè)均持續(xù)增加在人工智能領(lǐng)域的資本投入。美國、中國、英國、德國、日本等國家也分別出臺人工智能相關(guān)支持政策及國家戰(zhàn)略規(guī)劃,為整個產(chǎn)業(yè)的發(fā)展創(chuàng)造良好的政策環(huán)境。
3.創(chuàng)業(yè)公司:包括商湯科技、依圖科技和曠視科技等企業(yè),普遍以細分領(lǐng)域為發(fā)力點,布局思路各異。
在商湯、曠視、依圖等頭部企業(yè)看,各家戰(zhàn)略思路差異明顯。商湯致力于構(gòu)造平臺,專注底層基礎(chǔ)應用,力圖在完善平臺后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現(xiàn)出對安防、醫(yī)療兩大領(lǐng)域的專注深耕,依托產(chǎn)品化、工程化能力深入落地。
按照中國信息通信研究院的統(tǒng)計結(jié)果,目前中國人工智能應用市場主要由五個領(lǐng)域構(gòu)成,其中,由于近幾年中國互聯(lián)網(wǎng)娛樂、廣告?zhèn)鞑ズ凸舶踩曨l監(jiān)控市場的高速發(fā)展,計算機視覺市場規(guī)模以37%占比大幅領(lǐng)先。
而在機器視覺領(lǐng)域的細分市場構(gòu)成中,安防行業(yè)又以67.9%占據(jù)大部分份額,這得益于中國公共安全視頻監(jiān)控建設(shè)的龐大市場。根據(jù)《安防+AI人工智能白皮書》的預計,在2020年全球智能安防產(chǎn)業(yè)規(guī)模將實現(xiàn)106億美元,中國將達到20億美元。
人工智能行業(yè)是一個典型的技術(shù)驅(qū)動型行業(yè),技術(shù)的核心在于算力、算法和數(shù)據(jù)三個方面。GPU及AI專用芯片的出現(xiàn)突破了傳統(tǒng)CPU的算力瓶頸,數(shù)據(jù)運算速度和處理規(guī)模爆發(fā)性增長,從而為大數(shù)據(jù)的分析提供硬件上的支持。越來越多的應用領(lǐng)域正持續(xù)積累著日趨豐富的大數(shù)據(jù),海量的圖像和視頻內(nèi)容為深度學習提供了有力的數(shù)據(jù)支撐。
視覺人工智能行業(yè)的快速發(fā)展一方面得益于現(xiàn)階段算力的大幅提升及算法的大幅改善(國內(nèi)算法甚至已經(jīng)達到國際水平),另一方面則受益于下游應用市場的廣闊空間。機器學習、深度學習等算法能力的不斷增強促進了視覺人工智能行業(yè)的高速發(fā)展。