阿里布局AI第二個(gè)60年:阿里云+新實(shí)體經(jīng)濟(jì)數(shù)據(jù)
阿里的野心是龐大的,自他建立阿里達(dá)摩院的計(jì)劃就可以知道。阿里關(guān)注現(xiàn)在,發(fā)展未來(lái)。馬云曾說(shuō),就算阿里巴巴不在了,阿里達(dá)摩院會(huì)依然存在。今年,可以算是人工智能技術(shù)的第二個(gè)60年的開始,阿里早就開始了布局。
2017年是全球人工智能第二個(gè)60年的開始。與十幾年前的人工智能相比,今天人工智能更多是數(shù)據(jù)驅(qū)動(dòng)。以前的人工智能是人工編寫的專家系統(tǒng)、由“人工”指導(dǎo)實(shí)現(xiàn)智能,系統(tǒng)處理的水平不會(huì)超過(guò)程序本身;而現(xiàn)在的人工智能則是數(shù)據(jù)指導(dǎo)的智能,每天都在進(jìn)步的程序已經(jīng)開始超越人類的極限,這就是人工智能的“奇點(diǎn)效應(yīng)”。人工智能的第二個(gè)60年,誰(shuí)能掌握更多的源自現(xiàn)實(shí)和實(shí)體經(jīng)濟(jì)數(shù)據(jù),誰(shuí)就是人工智能新60年的贏家。
在2016年10月的阿里云棲大會(huì)上,馬云提出了“新實(shí)體經(jīng)濟(jì)”說(shuō)。“新實(shí)體經(jīng)濟(jì)”以消費(fèi)者為核心,通過(guò)新技術(shù)平臺(tái)把數(shù)以億計(jì)的消費(fèi)者與企業(yè)直接連接起來(lái),從而實(shí)現(xiàn)個(gè)性化、定制化的生產(chǎn)制造與商品流通。“新實(shí)體經(jīng)濟(jì)”的出現(xiàn),一方面推動(dòng)了線下數(shù)據(jù)的全面上網(wǎng),另一方面把線上數(shù)據(jù)與線下數(shù)據(jù)結(jié)合起來(lái)形成了新型的大數(shù)據(jù),尤其是得以結(jié)合產(chǎn)業(yè)和工業(yè)數(shù)據(jù),這才是人工智能在現(xiàn)實(shí)商業(yè)世界中的突破口。
2017年3月29日,在2017年第一場(chǎng)阿里云棲大會(huì)深圳峰會(huì)上,阿里云總裁胡曉明宣布阿里云正在開啟新的征途:通往智能之路。
阿里在人工智能布局已久阿里對(duì)人工智能可以說(shuō)是志在必得。2017年2月21日,美國(guó)權(quán)威科學(xué)雜志《麻省理工科技評(píng)論》(MIT Technology Review)發(fā)布2017年全球十大突破性技術(shù)榜單。阿里巴巴分別入選“強(qiáng)化學(xué)習(xí)”和“刷臉支付”兩大突破性技術(shù)榜單,同列入榜單的還有Google、微軟、IBM等科技巨頭。
《MIT科技評(píng)論》認(rèn)為,中國(guó)的人臉識(shí)別技術(shù)精度已達(dá)到金融交易的級(jí)別,刷臉支付進(jìn)入成熟期。主導(dǎo)這項(xiàng)技術(shù)研發(fā)的阿里巴巴關(guān)聯(lián)公司螞蟻金服,旗下支付寶在2015年發(fā)布9.0版本時(shí),就引用人臉識(shí)別技術(shù)用于用戶登陸、實(shí)名認(rèn)證、找回密碼、支付風(fēng)險(xiǎn)校驗(yàn)等場(chǎng)景,迄今已有近1.2億用戶使用。阿里在“強(qiáng)化學(xué)習(xí)”領(lǐng)域的技術(shù)成果,也與自身商業(yè)實(shí)踐相關(guān),比如強(qiáng)化學(xué)習(xí)技術(shù)在阿里雙11推薦場(chǎng)景中將手機(jī)用戶點(diǎn)擊率提升了10-20%。
“強(qiáng)化學(xué)習(xí)”與“刷臉支付”只是阿里人工智能布局的冰山一角。阿里對(duì)人工智能的總體態(tài)度,阿里云總裁胡曉明在2016年8月的阿里云棲大會(huì)·北京峰會(huì)上表達(dá)的非常清楚:“擁有了數(shù)據(jù)的積累,機(jī)器將替代人類的智商。我們認(rèn)為人類一定會(huì)進(jìn)入數(shù)據(jù)時(shí)代,我們認(rèn)為人類一定會(huì)進(jìn)入到人工智能的時(shí)代。”
總體來(lái)說(shuō),阿里在人工智能方面的布局可以分為四個(gè)層面:一是在自身業(yè)務(wù)場(chǎng)景中鍛煉和孵化人工智能技術(shù);二是通過(guò)阿里云對(duì)外輸出以及獲得企業(yè)使用阿里人工智能技術(shù)的反饋;三是通過(guò)合作伙伴的生態(tài)進(jìn)一步擴(kuò)大人工智能的應(yīng)用場(chǎng)景與獲取各類商業(yè)大數(shù)據(jù);四是與科研機(jī)構(gòu)合作更為前期的前瞻性人工智能技術(shù),比如與中科院合作的量子計(jì)算。
“強(qiáng)化學(xué)習(xí)”與“刷臉支付”就是阿里自身業(yè)務(wù)場(chǎng)景中鍛煉和孵化人工智能技術(shù)代表,人工智能技術(shù)還在支撐著手淘每天上億用戶在手機(jī)上的商品選擇、信息瀏覽、個(gè)性化推薦等任務(wù),尤其是要做到千人千面即每一個(gè)用戶打開的手淘都是個(gè)性化界面,這是對(duì)人工智能技術(shù)極大的挑戰(zhàn)。而這些經(jīng)過(guò)了實(shí)踐檢驗(yàn)的技術(shù),經(jīng)由阿里云對(duì)外整體輸出,這就是去年8月推出的阿里云人工智能“大腦”ET,以及2016年1月推出的大數(shù)據(jù)“數(shù)加”平臺(tái)。
阿里云首席科學(xué)家周靖人表示,ET的背后使用了阿里云多項(xiàng)人工智能的技術(shù),特別是自然語(yǔ)言識(shí)別、實(shí)時(shí)視頻分析、語(yǔ)音識(shí)別及語(yǔ)音合成、人機(jī)交互、知識(shí)圖譜等,但更為重要的是利用了大數(shù)據(jù)技術(shù)。阿里云的一站式大數(shù)據(jù)平臺(tái)“數(shù)加”,打通數(shù)據(jù)采集、計(jì)算引擎、數(shù)據(jù)加工、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)應(yīng)用等數(shù)據(jù)生產(chǎn)全鏈條,是阿里人工智能的基礎(chǔ)。
周靖人強(qiáng)調(diào),人工智能和大數(shù)據(jù)相輔相成、相互依賴、相互促進(jìn)。阿里巴巴集團(tuán)兼阿里云CTO張建鋒也在去年表示,不論是人工智能還是其他前沿技術(shù),都離不開高質(zhì)量的數(shù)據(jù)、強(qiáng)大的計(jì)算平臺(tái)和高效的算法平臺(tái),只有三者結(jié)合才能真正取得突破。
新實(shí)體數(shù)據(jù)打開“NASA”之門
2017年3月9日,阿里巴巴集團(tuán)在杭州召開首屆技術(shù)大會(huì),動(dòng)員全球兩萬(wàn)多名科學(xué)家和工程師投身“新技術(shù)戰(zhàn)略”:即阿里巴巴的“NASA”的計(jì)劃——面向未來(lái)20年組建強(qiáng)大的獨(dú)立研發(fā)部門,建立新的機(jī)制體制,為服務(wù)20億人的新經(jīng)濟(jì)體儲(chǔ)備核心科技。
雖然阿里到目前為止并未透露將如何實(shí)施“NASA”計(jì)劃,但可以肯定的是數(shù)據(jù)特別是新實(shí)體數(shù)據(jù)將是打開“NASA”之門的鑰匙。馬云在首屆阿里技術(shù)大會(huì)上說(shuō),沃爾瑪過(guò)3萬(wàn)億銷售額時(shí)有230萬(wàn)人,阿里實(shí)現(xiàn)37000億交易額時(shí)參與員工加起來(lái)不到1萬(wàn)人。阿里用1萬(wàn)人做到了沃爾瑪60年230萬(wàn)人做的事情,這既是新技術(shù)的力量,也是新數(shù)據(jù)的能量。
胡曉明在2017云棲大會(huì)深圳峰會(huì)上介紹說(shuō),去年7月份上汽和阿里走到了一起,共同發(fā)布首輛搭載YunOS Auto操作系統(tǒng)的互聯(lián)網(wǎng)汽車。該互聯(lián)網(wǎng)汽車上路7個(gè)月,已經(jīng)帶來(lái)將近117億軌跡點(diǎn)的定位,可以看到用路線軌跡繪制的地圖正在讓中國(guó)的地圖定位越來(lái)越精準(zhǔn)。同時(shí),所有上路的汽車還在不斷收集路況與PM2.5的數(shù)值,嘗試創(chuàng)造新的數(shù)據(jù)價(jià)值。
在2017云棲大會(huì)深圳峰會(huì)上,阿里云還正式發(fā)布了ET工業(yè)大腦和ET醫(yī)療大腦。在工業(yè)領(lǐng)域,將人工智能技術(shù)應(yīng)用到工業(yè)生產(chǎn)的復(fù)雜度更高。單從數(shù)據(jù)而言,一臺(tái)民用渦輪風(fēng)扇發(fā)動(dòng)機(jī)的轉(zhuǎn)速就能達(dá)30,000轉(zhuǎn)/分鐘,不同型號(hào)渦輪發(fā)動(dòng)機(jī)轉(zhuǎn)動(dòng)次數(shù)也不同,這相當(dāng)于1分鐘內(nèi)就可以產(chǎn)生海量不同標(biāo)準(zhǔn)的數(shù)據(jù)。
目前ET已經(jīng)入駐國(guó)內(nèi)大型能源巨頭協(xié)鑫光伏的切片生產(chǎn)車間。ET工作的第一步是將標(biāo)準(zhǔn)化車間所有端口的數(shù)據(jù)傳入工業(yè)大腦,隨后通過(guò)人工智能算法對(duì)所有關(guān)聯(lián)參數(shù)進(jìn)行深度學(xué)習(xí)計(jì)算,精準(zhǔn)分析出與良品率最相關(guān)的60個(gè)關(guān)鍵參數(shù)并搭建參數(shù)曲線,在生產(chǎn)過(guò)程中實(shí)時(shí)監(jiān)測(cè)和控制變量。目前,通過(guò)ET工業(yè)大腦的幫助,協(xié)鑫光伏的生產(chǎn)良品率已經(jīng)提升1個(gè)百分點(diǎn),每年可節(jié)省上億元的生產(chǎn)成本。
ET醫(yī)療大腦的研發(fā)則大量采用深度學(xué)習(xí)技術(shù),通過(guò)海量的數(shù)據(jù)作為示例來(lái)訓(xùn)練機(jī)器完成特定任務(wù),例如由計(jì)算機(jī)通過(guò)學(xué)習(xí)病例數(shù)據(jù)來(lái)提升醫(yī)術(shù)。經(jīng)過(guò)一年多的研究訓(xùn)練,人工智能ET已具備多項(xiàng)醫(yī)療能力,可在患者虛擬助理、醫(yī)學(xué)影像、精準(zhǔn)醫(yī)療、藥效挖掘、新藥研發(fā)、健康管理等領(lǐng)域承擔(dān)醫(yī)生助手的角色。
浙江德尚韻興的科學(xué)家是超聲甲狀腺結(jié)節(jié)智能診斷算法的研發(fā)者,他們利用深度學(xué)習(xí)處理超聲影像,同時(shí)加入旋轉(zhuǎn)不變性等現(xiàn)代數(shù)學(xué)的概念。借助計(jì)算機(jī)視覺技術(shù),這套算法可以對(duì)甲狀腺B超快速掃描分析,圈出結(jié)節(jié)區(qū)域并給出良性與惡性的判斷。一般來(lái)說(shuō),人類醫(yī)生的準(zhǔn)確率為60%-70%,而當(dāng)下算法的準(zhǔn)確率已經(jīng)達(dá)到85%。這套算法現(xiàn)在被集成到ET醫(yī)療大腦當(dāng)中,并在多家醫(yī)院進(jìn)行試點(diǎn)。
ET還被應(yīng)用到了城市治理方面。杭州城市數(shù)據(jù)大腦正在試點(diǎn)階段,通過(guò)視覺數(shù)據(jù)分析、移動(dòng)數(shù)據(jù)分析、公交信息數(shù)據(jù)分析等,ET去指揮紅綠燈的配置方案。調(diào)整后,杭州部分路段的交通暢通率提升了11%。同樣,廣州用互聯(lián)網(wǎng)+信號(hào)燈數(shù)據(jù)把城市變成更通暢。通過(guò)阿里云的人工智能技術(shù)和地圖技術(shù),幫助廣州市把擁堵指數(shù)降低了19%。在廣州,現(xiàn)有接近1200個(gè)路口在使用ET大腦。
由于可以24小時(shí)不睡覺,同時(shí)處理成千上萬(wàn)項(xiàng)任務(wù),ET的學(xué)習(xí)進(jìn)步速度大大超過(guò)人類。而來(lái)自新實(shí)體經(jīng)濟(jì)中的大數(shù)據(jù),就是ET進(jìn)化的奇點(diǎn)。
阿里云機(jī)器學(xué)習(xí)PAI:高效的算法平臺(tái)在數(shù)據(jù)、技術(shù)與算法中,阿里已經(jīng)在超大規(guī)模計(jì)算操作系統(tǒng)、移動(dòng)操作系統(tǒng)、金融級(jí)分布式數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)平臺(tái)等核心基礎(chǔ)技術(shù)領(lǐng)域持續(xù)投入近10年,而通過(guò)ET工業(yè)、醫(yī)療與城市大腦和互聯(lián)網(wǎng)汽車等,阿里正在積累新實(shí)體經(jīng)濟(jì)數(shù)據(jù)。
在算法平臺(tái)方面,阿里云2017云棲大會(huì)深圳峰會(huì)上正式發(fā)布機(jī)器學(xué)習(xí)平臺(tái)PAI2.0,以更豐富的算法庫(kù)、更大規(guī)模的數(shù)據(jù)訓(xùn)練和全面兼容開源的平臺(tái)化產(chǎn)品,讓人工智能技術(shù)變成開發(fā)者只需要托拉拽就能可視化完成開發(fā)的普惠性技術(shù)。
周靖人介紹,阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI 2.0包括了豐富的算法,除數(shù)據(jù)預(yù)處理、特征選擇、文本分析外,還很好的支持了離線訓(xùn)練與在線預(yù)測(cè)的結(jié)合。在深度學(xué)習(xí)方面,PAI 2.0支持TensorFlow 、CAFFE、MXNET框架,開發(fā)者可以根據(jù)自己的喜好選擇最合適的人工智能開發(fā)框架。同時(shí)PAI 2.0也支持各種數(shù)據(jù)源,包括非結(jié)構(gòu)化、結(jié)構(gòu)化的數(shù)據(jù)等,提供一站式的服務(wù)。
里云為PAI 2.0提供了強(qiáng)大的計(jì)算資源,包括CPU、GPU、FPGA等,可根據(jù)每個(gè)人工智能的需求來(lái)選擇合適的硬件。同時(shí),阿里云PAI 2.0機(jī)器學(xué)習(xí)平臺(tái)支持超大規(guī)模訓(xùn)練,可以分析PB級(jí)大量的數(shù)據(jù),也支持千億的特征,可以訓(xùn)練萬(wàn)億級(jí)的樣本。
阿里在2015年發(fā)布了PAI 1.0平臺(tái),該平臺(tái)具有處理超大規(guī)模數(shù)據(jù)的能力和分布式的存儲(chǔ)能力,同時(shí)支持超大規(guī)模的建模以及GPU計(jì)算。此外,該平臺(tái)還具有社區(qū)的特點(diǎn),包括實(shí)驗(yàn)結(jié)果可共享、社區(qū)團(tuán)隊(duì)相互協(xié)作等。
介紹,PAI平臺(tái)通過(guò)可視化交互的界面降低了技術(shù)門檻,使用者可以輕松實(shí)現(xiàn)數(shù)據(jù)挖掘的工作,而無(wú)需太多經(jīng)驗(yàn);其次,其內(nèi)嵌的算法,都是經(jīng)過(guò)阿里內(nèi)部多年的淬煉,在性能和準(zhǔn)確率上都有較大的提升;最后是數(shù)據(jù)智能,該平臺(tái)提供了從元數(shù)據(jù)到模型部署整套流程,通過(guò)提供基本的組件,使用者可以搭建各個(gè)垂直場(chǎng)景下的解決方案。
阿里云+新實(shí)體數(shù)據(jù)+機(jī)器學(xué)習(xí)平臺(tái)PAI,這是通往智能之路的三駕馬車。有了這三駕馬車,阿里決戰(zhàn)人工智能第二個(gè)60年,就有了充分的底氣。當(dāng)然“羅馬不是一天建成的”,在更遠(yuǎn)期的阿里“NASA”計(jì)劃中,量子計(jì)算與量子通信等尖端科技,正在一點(diǎn)一點(diǎn)成為現(xiàn)實(shí)。