在了解阿里云人工智能機器人小Ai的基本運作過程后,筆者認為小Ai的算法其實已經(jīng)不僅是深度學習,而是在深度學習之上的更高階算法,并就此向阿里云人工智能科學家閔萬里求證,得到的回復:是的。
小Ai算法高階在哪里?
盡管阿里云方面沒有透露關于小Ai更多算法方面的信息,只說小Ai主要基于神經(jīng)網(wǎng)絡、社會計算(social compuTIng)、情緒感知等原理工作,善于洞察本質(zhì)和實時預測,并能理解人類情感。
但是小Ai挑戰(zhàn)歌王預測難點有三:首先,這是在7個歌手之間的混戰(zhàn),并非AlphaGo與李世石之間的兩人對弈;其次,唱歌是情感理解加藝術欣賞,不同的唱法、變聲、假聲等無常法也無定論,現(xiàn)場演唱更是即興創(chuàng)作;再次,最終結果是湖南衛(wèi)視節(jié)目組、電視觀眾、500位大眾評審、7位歌手共同創(chuàng)造的結果,其中充滿了巨大的隨機性。
簡單的理解,用于AlphaGo圍棋對弈、語音識別、圖像識別等的深度學習算法,主要解決的是單目標優(yōu)化問題,而小Ai要挑戰(zhàn)的本質(zhì)上是多目標優(yōu)化問題,這從根本上就“迫使”阿里云選擇更高階的算法。閔萬里告訴記者,小Ai本身是一個基于概率的決策優(yōu)化過程,在決策過程中需要多組變量輸入,其中的部分變量是通過深度學習優(yōu)化得來。
之前,小Ai的算法已經(jīng)被阿里云成功用于浙江省交通廳的路況預測,而能解決城市管理和宏觀經(jīng)濟問題的人工智能算法都屬于多目標優(yōu)化算法。西方已經(jīng)在城市綜合管理和宏觀政策制定等領域長期采用了多目標優(yōu)化算法,包括模擬退火算法、遺傳算法等。閔萬里透露,小Ai并沒有采用現(xiàn)成的多目標優(yōu)化算法,而是自己開發(fā)的算法體系。
小Ai憑什么?
那么,小Ai憑什么能夠?qū)崿F(xiàn)高階算法呢?這必須要提到小Ai之父、阿里云人工智能科學家閔萬里。
14歲被中科大的少年班錄取,閔萬里19歲赴美攻讀物理學碩士,2004年獲得芝加哥大學統(tǒng)計學博士,先后在IBM Watson研究院及Google擔任研究員,2013年加入阿里云負責人工智能項目小Ai。
閔萬里說在IBM Watson研究院的經(jīng)歷讓他受益匪淺。IBM最早提出智慧城市戰(zhàn)略,也是最早看到未來趨勢。2005年,IBM把PC硬件業(yè)務賣給聯(lián)想后,開始自己的轉(zhuǎn)型。這個轉(zhuǎn)型的過程,最缺的就是海量數(shù)據(jù)分析能力,因此補充了很多相關研究項目,包括海量數(shù)據(jù)分析、關鍵信息提取、預測建模、機器學習等,閔萬里也借此接觸了一線實戰(zhàn)案例。
之后到了Google,閔萬里比較具體地負責移動端廣告精準推送優(yōu)化研究,主要是對海量數(shù)據(jù)進行研判,這其實已經(jīng)非常接近今天小Ai要解決的問題了。移動端廣告精準推送優(yōu)化是互聯(lián)網(wǎng)廣告最核心的技術,需要通過大數(shù)據(jù)分析和機器學習等提升廣告的精準推送,從而提高廣告的點擊率。
移動端廣告精準推送優(yōu)化數(shù)據(jù)分析包括:研判用戶當前上下文網(wǎng)頁的內(nèi)容;研判用戶所在地理位置——駕車狀態(tài)下推送短廣告、飯館里推送復雜廣告;研判用戶對于推送廣告的喜愛程度等。這些都屬于多情景變量下的實時決策問題,與小Ai要挑戰(zhàn)的歌王預測場景極為類似。
閔萬里長期從事機器學習理論研究與應用算法研發(fā),在腦電波(EEG)解析、高維數(shù)據(jù)挖掘、隨機過程理論、時間序列分析、網(wǎng)絡流理論等領域獲得多項國際專利。他于2011年發(fā)表的道路交通流預測研究,是該領域全球五年來被引用次數(shù)最多的論文之一。
2013年,有獵頭找到閔萬里,希望游說他加入阿里云。當時獵頭說了一句話,中國有這樣一家公司,數(shù)據(jù)總量比亞馬遜、eBay、Paypal加起來還多。“這一句話就已經(jīng)可以說明一切了,做大數(shù)據(jù)就要來阿里。”
小Ai的研發(fā)過程
從2012年開始,阿里云研發(fā)了后來被稱為“MaxCompute”的海量數(shù)據(jù)處理計算引擎,當時叫做ODPS,這是小Ai非常重要的計算基礎設施。
ODPS是阿里集團30多個事業(yè)部唯一的大數(shù)據(jù)處理平臺,在2015世界Sort Benchmark排序比賽中,ODPS用377秒完成了100TB的數(shù)據(jù)排序,打破了此前Apache Spark創(chuàng)造的1406秒紀錄,創(chuàng)造了4項世界紀錄。如今,MaxCompute可在6小時內(nèi)處理100PB數(shù)據(jù)、相當于1億部高清電影。
值得一提的是ODPS的實時計算系統(tǒng)StreamSQL,后來在阿里云數(shù)據(jù)加平臺被稱為“StreamCompute”,可日均處理萬億消息、PB級的數(shù)據(jù)以及千萬級的每秒查詢率QPS,適用于根據(jù)用戶實時行為數(shù)據(jù)(瀏覽、成交、收藏等)調(diào)整推薦商品的實時推薦系統(tǒng)等。
阿里云方面說,小Ai的學習速度是人類的1萬倍,人類需要10萬小時成為某一領域的專家,小Ai只需要10小時。這其實就是基于MaxCompute和StreamCompute等阿里云大數(shù)據(jù)分析的實戰(zhàn)平臺,“阿里云的大數(shù)據(jù)分析是經(jīng)過了實戰(zhàn)檢驗,這是與其它平臺不一樣的地方。”這個平臺經(jīng)歷了阿里上萬名工程師的實戰(zhàn),其中包括7次雙十一的考驗。
在研發(fā)MaxCompute等計算平臺的同時,阿里云人工智能小組還在開發(fā)深度學習、社交網(wǎng)絡情感分析、語意分析、優(yōu)化算法等人工智能算法體系。到2015年的時候,阿里云的人工智能算法在阿里各個業(yè)務場景下實現(xiàn)了成熟的應用,之后被抽象成通用的模塊再嫁接到MaxCompute上。
“所以阿里云的人工智能模塊帶有明確的可應用場景,不是閉門造車。也不是我們憋了4年,就為做這件事(挑戰(zhàn)《我是歌手》)。這其實是在阿里整個業(yè)務生態(tài)中,慢慢成長起來的。”閔萬里說。
小Ai的算法體系
阿里云于2012年就開始人工智能領域的技術研發(fā)和儲備。在參加湖南衛(wèi)視《我是歌手》比賽之前,小Ai已經(jīng)積累了不少實戰(zhàn)經(jīng)驗,比如幫助光伏電廠預估發(fā)電產(chǎn)能減少能耗、幫助水利監(jiān)管部門預測水庫水位以預防災害發(fā)生、幫助金融機構客服人員接電話、幫助阿里音樂預測音樂黑馬等等。
小Ai團隊除了工程師、科學家之外,還有多位阿里音樂和專業(yè)人士作為教練,學習了幾百萬首歌提升音樂品味和鑒賞能力。小Ai基于阿里音樂數(shù)據(jù)庫,自動學習音頻的重要特征后形成對歌曲的多維度評價,包括音高、能量、語譜、基頻等,通過特征來訓練小Ai對音頻及受歡迎程度之間的關聯(lián)性思維,不過目前小Ai還沒有遍歷韓文等外文歌曲。
那么小Ai是如何現(xiàn)場預測比賽結果的?小Ai從歷史賽事和海量資料中尋找影響比賽結果的變量因子,訓練出一個實時動態(tài)模型進行預測,包括歌曲、歌手、粉絲、現(xiàn)場氛圍、網(wǎng)友討論等維度,每種維度都通過機器學習提取海量特征。這些特征有靜態(tài)的,也有跟隨比賽而動態(tài)變化的,需要現(xiàn)場實時計算。
閔萬里透露,小Ai眼里的歌手是無數(shù)標簽的集合,比如李玟就有女歌手、70后、華裔、美國、偶像、性感、奧斯卡、R&B、Soul、粉絲量等標簽。而現(xiàn)場影響評委喜好的因素非常多,小Ai需要找到這些影響因素的每一個信息變量,包括歌手演唱相關的曲風、流派、編曲、幫唱嘉賓、舞蹈、歌手顏值等現(xiàn)場熱數(shù)據(jù),以及場外的各種冷數(shù)據(jù)信息。再把這些信息通過一定邏輯疊加在一起,形成整體決策機制。
總結來說,小Ai要做的是去觀察一切可能影響投票結果的因子,整個過程是在全空間、連續(xù)、動態(tài)地場景中,“理解人類的喜好”、“洞察人類的思考”。
與微軟小冰的區(qū)別
作為同樣主打“情感算法”的微軟小冰,閔萬里表示微軟小冰與人類的一問一答對話很容易帶入上下文情境,之后就可以用語言學等相關的模型進行建模和分析。而小Ai要同時理解7個歌手的混戰(zhàn)以及音樂欣賞等超越語言的內(nèi)容,這是小Ai的不同之處。
閔萬里舉例小Ai的算法難點,比如上一次的孫楠退賽完全出乎意料,小Ai也不可能預料到這樣的事件,這對當時的模型訓練造成了很大的困擾。在現(xiàn)場比賽的時候,什么狀況都有可能發(fā)生,不管最后小Ai預測的結果如何,都是一次成功的嘗試。
此外,在商業(yè)模式方面,小Ai看起來也不如微軟小冰有一個比較容易的商業(yè)化路線,現(xiàn)在微軟正把小冰變成整個微軟產(chǎn)品與服務的人工智能基礎設施。與當前盛行的深度學習算法相比,小Ai的多目標優(yōu)化算法似乎也難于看到一個清晰的商業(yè)化前景。
對于商業(yè)化模式問題,閔萬里說阿里有一個戰(zhàn)略:Happiness(幸福)和Health(健康),也就是幸福指數(shù)與健康指數(shù)。小Ai的音樂和藝術欣賞能力,既跟幸福指數(shù)相關也與健康指數(shù)相關,僅僅實現(xiàn)這一點就已經(jīng)是巨大的技術成就了。此外,小Ai的能力可以很容易泛化到商業(yè)領域,之前已經(jīng)在交通管理、能源管理、天氣預測等成功應用。
《我是歌手》第四季總決賽中小Ai的實時預測嘗試得到了廣泛關注,IBM也提前為小Ai發(fā)來了祝愿。更為重要的是,本次預測是多目標優(yōu)化算法的一次挑戰(zhàn),可以說也是在中國首次被公眾體驗。
從此,人工智能揭開了新篇章。