企業(yè)投資物聯(lián)網(wǎng),人工智能成為下站香餑餑
掃描二維碼
隨時(shí)隨地手機(jī)看文章
ARM提供物聯(lián)網(wǎng)芯片的設(shè)計(jì),即便真如Gartner所預(yù)測(cè)在2020年將有260億物聯(lián)網(wǎng)設(shè)備,但這也只是物聯(lián)網(wǎng)的物理基礎(chǔ)。如何對(duì)這260億物聯(lián)設(shè)備7×24源源不斷產(chǎn)生出來(lái)的數(shù)據(jù)進(jìn)行分析、判斷和商業(yè)變現(xiàn),單靠人工智能則遠(yuǎn)遠(yuǎn)不能滿足這一需求,而必須依靠自動(dòng)化的算法,這就是Gartner所積極倡導(dǎo)的算法經(jīng)濟(jì)。
人工智能將成主流商業(yè)競(jìng)爭(zhēng)策略
為什么說(shuō)人工智能將成主流商業(yè)競(jìng)爭(zhēng)策略?這是因?yàn)樵谒惴ń?jīng)濟(jì)時(shí)代,人工智能是終極算法,對(duì)終極算法的追求必將成為主流商業(yè)競(jìng)爭(zhēng)策略。
在華盛頓大學(xué)教授Pedro Domingos的2015年新書(shū)《終極算法》中,有這樣論斷:“終極算法”就是通過(guò)機(jī)器學(xué)習(xí)的方式,自動(dòng)發(fā)現(xiàn)和創(chuàng)造其它所有算法的“主算法”。這個(gè)所謂的“主算法”是單一的、全球通用的算法,這個(gè)“主算法”對(duì)于生物界來(lái)說(shuō)是人類大腦,對(duì)于以物聯(lián)網(wǎng)為基礎(chǔ)的機(jī)器世界來(lái)說(shuō)就是人工智能。
在過(guò)去60年間,全球最頂尖的科學(xué)家們一直在研究如何用數(shù)學(xué)的方式來(lái)模擬人類的智能。早期可證明《數(shù)學(xué)原理》的“邏輯理論家”程序讓機(jī)器具備邏輯推理能力,中期的專家系統(tǒng)讓機(jī)器能獲得人類的知識(shí),再到后來(lái)旨在讓機(jī)器自主學(xué)習(xí)知識(shí)的機(jī)器學(xué)習(xí)算法,科學(xué)家們對(duì)人工智能的探索一直沒(méi)有停止。
進(jìn)入到2016年,也是人工智能學(xué)科誕生60周年之際,基于深度學(xué)習(xí)的機(jī)器學(xué)習(xí)算法成為人工智能主流,而深度學(xué)習(xí)的核心就是多層深度神經(jīng)元網(wǎng)絡(luò)DNN,這也是目前主流科學(xué)家能達(dá)到的最為成熟的機(jī)器智能。7月21日,技術(shù)解決方案提供商SoftServe發(fā)布了Big Data Snapshot 研究報(bào)告,研究顯示 62% 的大中型公司希望在未來(lái)的兩年內(nèi)能將機(jī)器學(xué)習(xí)用于商業(yè)分析。這意味著商用多層深度神經(jīng)元網(wǎng)絡(luò)DNN,即將成為各大企業(yè)追逐的主流商業(yè)競(jìng)爭(zhēng)策略。
硬件進(jìn)步推動(dòng)人工智能商用
我們正在進(jìn)入人工智能的商用時(shí)代。經(jīng)過(guò)60年的發(fā)展,基于DNN的人工智能已經(jīng)從高校和實(shí)驗(yàn)室走進(jìn)了企業(yè),并從企業(yè)擴(kuò)散向千家萬(wàn)戶。谷歌今年剛發(fā)布的智能硬件Google Home、即將量產(chǎn)的阿里互聯(lián)網(wǎng)汽車、微軟人工智能助理Cortana等,都是基于DNN的規(guī)?;虡I(yè)應(yīng)用。
在更為廣泛的傳統(tǒng)企業(yè)應(yīng)用層面,一場(chǎng)大規(guī)模的人工智能商用化正在開(kāi)始,這是基于硬件的進(jìn)步,其中一個(gè)顯著的進(jìn)步是GPU在人工智能商用中的崛起。《連線》雜志在2015年底發(fā)表了一篇名為《與Google競(jìng)爭(zhēng),F(xiàn)acebook開(kāi)源了人工智能硬件》文章中談及GPU在人工智能商用時(shí)代的崛起。現(xiàn)在,F(xiàn)acebook、Google、微軟、百度等大型互聯(lián)網(wǎng)公司正在轉(zhuǎn)向利用GPU完成人工智能商業(yè)應(yīng)用。
在過(guò)去,算法模型依靠CPU計(jì)算得出,但人工智能算法的獨(dú)特性在于分布式并行計(jì)算,這并非基于串行計(jì)算的CPU所擅長(zhǎng)。實(shí)際上針對(duì)圖形圖像處理的GPU從一開(kāi)始就是大規(guī)模并行計(jì)算,這也是為什么斯坦福大學(xué)的吳恩達(dá)教授會(huì)考慮采用GPU優(yōu)化人工智能算法的初衷。研究表明,12 顆 NVIDIA GPU 可以提供相當(dāng)于2,000 顆 CPU 的深度學(xué)習(xí)性能。
盡管從長(zhǎng)期來(lái)看,開(kāi)發(fā)真正的人工智能芯片依然是全球?qū)W界與企業(yè)界共同需要完成的任務(wù),但那仍需要很長(zhǎng)時(shí)間的探索與實(shí)驗(yàn)。從當(dāng)前人工智能商業(yè)化需求來(lái)看,把GPU用于人工智能商用顯然具有極大的優(yōu)勢(shì)。這就是2016年4月,NVIDIA推出基于GPU的全球首款深度學(xué)習(xí)超級(jí)計(jì)算機(jī)DGX-1的原因。
首款GPU深度學(xué)習(xí)超級(jí)計(jì)算機(jī)
首款GPU深度學(xué)習(xí)超級(jí)計(jì)算機(jī)NVIDIA DGX-1基于 NVIDIA Tesla P100 GPU,該 GPU 采用2016年最新的 NVIDIA Pascal GPU 架構(gòu)。Pascal是第五代GPU架構(gòu),于兩年前的GPU技術(shù)大會(huì)(GTC)上公布,產(chǎn)品將于2016年上市,這就是Tesla P100 GPU。作為新一代GPU架構(gòu),Pascal相比于前一代的Maxwell有較大的性能提升。根據(jù)NIVIDIA的數(shù)據(jù),Pascal GPU 在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的性能方面有1個(gè)數(shù)量級(jí)的提高。2015年GTC大會(huì)上,用4顆Maxwelll GPU訓(xùn)練Alexnet深度神經(jīng)網(wǎng)絡(luò)需要25小時(shí),到了2016年GTC大會(huì)上用8顆Pascal GPU則只用2小時(shí);對(duì)比英特爾雙路至強(qiáng)E5服務(wù)器訓(xùn)練Alexnet網(wǎng)絡(luò)需要150個(gè)小時(shí),而DGX-1只需要2個(gè)小時(shí)。
lexnet神經(jīng)網(wǎng)絡(luò)是2012 年國(guó)際ImageNet計(jì)算機(jī)圖形識(shí)別大賽的冠軍深度學(xué)習(xí)算法,著名的開(kāi)源深度學(xué)習(xí)算法Caffe就是基于Alexnet。而到2015 年的 ImageNet 大賽中所有的最好成績(jī),都是基于深度學(xué)習(xí)且在 GPU 加速的深度神經(jīng)網(wǎng)絡(luò),這也難怪《連線》雜志驚嘆GPU在人工智能時(shí)代的崛起。
Pascal GPU 架構(gòu)的優(yōu)勢(shì)在于:引入了NVIDIA獨(dú)家的新高速總線NVLink,專門(mén)用于GPU以及GPU與CPU的高速互連,GPU最高能夠以 160 GB/s的雙吐帶寬訪問(wèn)系統(tǒng)內(nèi)存,相當(dāng)于 PCIe傳統(tǒng)帶寬的5 倍;采用了目前最快、容量最高的堆疊式內(nèi)存技術(shù)HBM2,Tesla P100也是全球首款采用 HBM2 內(nèi)存的GPU;顯著改進(jìn)編程模型的統(tǒng)一內(nèi)存,以單一統(tǒng)一虛擬地址來(lái)訪問(wèn)系統(tǒng)中所有CPU 和 GPU內(nèi)存,極大簡(jiǎn)化了程序的可移植性及數(shù)據(jù)吞吐能力等。
微軟研究院首席語(yǔ)音科學(xué)家黃學(xué)東表示:“微軟正在開(kāi)發(fā)具有 1,000 多層的超級(jí)深度神經(jīng)網(wǎng)絡(luò)。NVIDIA Tesla P100 的驚人性能將讓微軟 CNTK 能夠加速實(shí)現(xiàn)人工智能的突破。”
80萬(wàn)的AI服務(wù)器,到底值不值?
NVIDIA DGX-1的定價(jià)為12,900美金,約合80萬(wàn)人民幣。那么,這個(gè)價(jià)格到底值不值呢?
NVIDIA DGX-1提供8 顆 Tesla P100 加速器、每顆 GPU 16GB 內(nèi)存、7TB 固態(tài)硬盤(pán) DL 高速緩存等配置,吞吐量相當(dāng)于250臺(tái)E5雙路X86服務(wù)器。那么,按2萬(wàn)元人民幣一臺(tái)E5服務(wù)器簡(jiǎn)單估算,250臺(tái)即500萬(wàn)的成本,這還不包括機(jī)房、網(wǎng)絡(luò)、能源等額外成本。而DGX-1采用 3U 架上型機(jī)箱,可單獨(dú)使用也可以集成到集群當(dāng)中,顯然用DGX-1做集群更劃算。
在集成的軟件方面,NVIDIA DGX-1提供了一整套優(yōu)化的深度學(xué)習(xí)軟件,屬于開(kāi)箱即用型。在NVIDIA的開(kāi)發(fā)者網(wǎng)站Developer.nvidia.com上,有一個(gè)Deep Learning深度學(xué)習(xí)專區(qū),里面提供了Deep Learning SDK開(kāi)發(fā)工具包、NVIDIA DIGITS圖像分類與識(shí)別軟件、Deep Learning開(kāi)源框架等定制化軟件為深度學(xué)習(xí)提供了全方位的軟件支持,可供下載和使用。
其中,Deep Learning SDK開(kāi)發(fā)工具包內(nèi)含強(qiáng)大的工具及類庫(kù),可用于設(shè)計(jì)、開(kāi)發(fā)和部署面向GPU優(yōu)化的深度學(xué)習(xí)應(yīng)用。其中的類庫(kù)包括深度學(xué)習(xí)基礎(chǔ)cuDNN、線性代數(shù)、稀疏矩陣、多GPU通信以及全面的CUDA C\C++開(kāi)發(fā)環(huán)境。NVIDIA DIGITS深度學(xué)習(xí)管理調(diào)度平臺(tái)為圖像視頻類數(shù)據(jù)分類和識(shí)別,提供了包括LeNet、AlexNet、GoogLeNet等在內(nèi)的預(yù)設(shè)優(yōu)化算法。除此之外,NVIDIA還定期更新開(kāi)發(fā)者網(wǎng)站,為開(kāi)發(fā)者提供更多的優(yōu)化算法——如果說(shuō)GPU已經(jīng)是深度學(xué)習(xí)領(lǐng)域不能或缺的組成,那么這款面向人工智能機(jī)器學(xué)習(xí)的NVIDIA DGX-1則讓更多企業(yè)拋開(kāi)束縛,以更快的步伐邁向人工智能。
基于NVIDIA GPU的商用人工智能軟件還有一個(gè)很大的優(yōu)勢(shì),在于GPU的普適性:針對(duì)個(gè)人電腦的GeForce、針對(duì)云和超級(jí)計(jì)算機(jī)的Tesla、針對(duì)機(jī)器人和無(wú)人機(jī)的Jetson以及針對(duì)汽車的DRIVE PX等所有NVIDIA GPU都共用同一種架構(gòu)。
百度、谷歌、Facebook、微軟是首批把 NVIDIA GPU 應(yīng)用于深度學(xué)習(xí)的企業(yè),在近兩年內(nèi)與NVIDIA 在深度學(xué)習(xí)方面合作的企業(yè)激增了近 35 倍至 3,400 多家,涉及醫(yī)療、生命科學(xué)、能源、金融服務(wù)、汽車、制造業(yè)以及娛樂(lè)業(yè)等多個(gè)行業(yè)。
考慮到NVIDIA DGX-1在硬件、軟件和集成服務(wù)等方面的明顯優(yōu)勢(shì),80萬(wàn)的價(jià)格并不為高。NVIDIA DGX-1顯然能夠大幅提升AI模型的學(xué)習(xí)和訓(xùn)練時(shí)間,加快對(duì)于來(lái)自物聯(lián)網(wǎng)上各類圖片、視頻、語(yǔ)音等非結(jié)構(gòu)化數(shù)據(jù)的處理速度,比如工業(yè)生產(chǎn)線檢測(cè)的圖片、醫(yī)療影像視頻、道路交通圖片與視頻分析等等,幫助企業(yè)盡快、盡早地從AI算法中受益。
中科曙光成為NVIDIA DGX-1在中國(guó)最重要的戰(zhàn)略合作伙伴之一,而全球領(lǐng)先的監(jiān)控產(chǎn)品供應(yīng)商、中國(guó)平安城市解決方案提供商??低曇渤蔀镹VIDIA DGX-1的首單客戶,后者將把DGX-1用于視頻監(jiān)控方面的深度學(xué)習(xí)超級(jí)計(jì)算機(jī)項(xiàng)目上。NVIDIA DGX-1已經(jīng)于今年7月正式上市,DGX-1的上市有望激活人工智能的大規(guī)模商用。對(duì)于企業(yè)來(lái)說(shuō),在跟投物聯(lián)網(wǎng)項(xiàng)目的同時(shí),需要開(kāi)始考慮人工智能策略。在大的產(chǎn)業(yè)趨勢(shì)到來(lái)之前,只有領(lǐng)先一步,才能步步占據(jù)先機(jī)。