專訪聯(lián)想AI實驗室負責人徐飛玉:深度學習的黑盒為何重要
當深度學習的“魔力”在人工智能研究領域大放異彩之時,許多相關領域的研究者癡迷于深度學習所帶來的驚人的模型效果,卻往往忽略,或是刻意回避了這樣一個現(xiàn)實:經(jīng)過深度學習模型得出的結(jié)果,無法用目前所掌握的知識和邏輯去解釋。深度學習的模型,就像“黑盒”一般呈現(xiàn)在人們面前,但依然吸引著無數(shù)的研究人員趨之若鶩。
在聯(lián)想人工智能實驗室負責人徐飛玉看來,可解釋性的AI(人工智能)是重要的,研究人員不應該單純追求模型的精確預測結(jié)果,而忽略了模型的可解釋性,在25日舉辦的人工智能峰會上,徐飛玉分享了她以及她所帶領的聯(lián)想人工智能實驗室,在可解釋性AI方面所取得的研究成果,在隨后接受騰訊新聞《一線》等媒體的專訪中,徐飛玉進一步介紹了她所帶領的聯(lián)想人工智能實驗室在成立兩年來所取得的進展以及未來的重點發(fā)展方向。
徐飛玉認為,可解釋性AI 對研究人員提出了更大的挑戰(zhàn),不應該只滿足于模型結(jié)果,應該進一步挖掘背后的機理,同時可解釋AI對于決策者來說也更加能夠接受,并應用到具體的生產(chǎn)經(jīng)營環(huán)節(jié)中。
成立于兩年前的聯(lián)想人工智能實驗室,目標定位是做一家世界級的AI研究所,作為領頭人,她并不滿足于僅僅將AI應用納入到聯(lián)想自身的生產(chǎn)經(jīng)營體系中,更大的目標是能夠?qū)嶒炇业娜斯ぶ悄苎芯磕芰﹂_放出去,賦能更多的企業(yè)和用戶,最終推動社會福祉向前。
可解釋性AI為何重要
“作為科學家,實際上我對于深度學習、黑盒子是不滿足的。”在回答騰訊新聞《一線》的提問時,徐飛玉說,“如果科學家只會解決很簡單的問題,那就不是科學家了。”
在當天的演講中,徐飛玉表示,目前的深度神經(jīng)網(wǎng)絡對人類來說還是一個“黑盒子”,導致人類不敢用、不能用,阻礙了人工智能的落地和商業(yè)化。因此,可解釋性對機器學習,特別是深度學習是一個很大的挑戰(zhàn)。
“只有人類理解了AI的決策過程,才能將其應用在更廣泛的社會場景中?!毙祜w玉說。
在接下來的專訪環(huán)節(jié),徐飛玉進一步解釋了她所理解的解釋性AI為何重要。以聯(lián)想自己為例,人工智能實驗室會于業(yè)務集團進行合作,當通過深度學習模型預測出,某個生產(chǎn)基地的某個部件的供應量需要提高1%或降低1%,在與供應鏈管理的具體決策者提出時,便需要能夠解釋,為何要提高或降低這1%,這一關鍵決策會直接影響到最終的生產(chǎn)、銷售環(huán)節(jié),如果最后終端用戶需求達不到滿足,相應的負責人就需要承擔責任。
只有當預測出結(jié)果的模型能夠被清晰地解釋時,才能夠真正被相關決策者所接受,并最終實現(xiàn)模型最初所期望達到的目標。
另外在醫(yī)療領域,越來越多的人工智能技術開始運用到醫(yī)療診斷過程中,如果無法向醫(yī)生解釋診斷結(jié)果,也會影響這一技術最終的應用。
“和人的生命健康有關系的那個黑盒子有可能不是一個大眾能夠接受的狀態(tài)。”徐飛玉說,她認為,在可解釋性方面,首先需要把“黑盒子”打開,其次是讓“黑盒子”里面的神經(jīng)產(chǎn)生語義,知道里面說的是什么意思,第三個是生成一些解釋給醫(yī)生。
聯(lián)想從事人工智能研究的獨特定位與優(yōu)勢
人工智能的重要性不言而喻,在某種程度上,掌握了人工智能,便掌握了未來科技行業(yè)發(fā)展的制高點,聯(lián)想在2017年3月成立了人工智能實驗室,目的也是為了在這一領域占的先機。徐飛玉作為該實驗室的負責人,對于實驗室的定位和發(fā)展方向有著明確的把握,在專訪過程中,徐飛玉介紹,目前該實驗室覆蓋的研究領域包括自然語言處理(NLP)、語音識別、計算機視覺、機器學習及智慧數(shù)據(jù)、AI訓練平臺及AI開放創(chuàng)新平臺。
在這些研究領域的基礎上,聯(lián)想目前已經(jīng)形成了人工智能的創(chuàng)新生態(tài),即通過學術合作,將技能、專業(yè)知識和技術傳導至人工智能實驗室,充分利用聯(lián)想設備獲取的大數(shù)據(jù)進行相關研究并部署到聯(lián)想云上,并向商業(yè)合作伙伴提供智能設備、智能云和智能服務等,同時,與合作伙伴合作所獲得的大數(shù)據(jù),又能反哺聯(lián)想人工智能的研究,形成正向良性循環(huán)。
在業(yè)界各大公司紛紛設立自己的人工智能實驗室的趨勢下,聯(lián)想的人工智能實驗室卻展現(xiàn)出了其獨特性,在回答騰訊新聞《一線》的提問時,徐飛玉表示,對于聯(lián)想這樣一個在個人電腦領域全球第一的公司,AI Lab設立的目標定位從一開始就是三個“Pro”,即“Product”(產(chǎn)品、服務)、“Process”(流程)和“Promotion”(宣傳)。
首先從產(chǎn)品端來看,聯(lián)想的人工智能技術有語音技術、自然語言分析技術、計算機視覺技術,這些技術可以讓聯(lián)想的設備、PC和手機在人機交互方面做得更好。這運用到了兩個非常重要的技術,即:多媒體和多模型交互。從軟件和硬件解決方案兩方面,人工智能對于像聯(lián)想這樣的公司非常重要。
其次對于業(yè)務流程,聯(lián)想最顯著的一個例子是,運用機器學習或者是可解釋的人工智能技術,幫助各層級的供應鏈管理做得更好。
“聯(lián)想是一個典型的IT制造型公司,如果我們的process做得很好,可以為公司省很多成本?!毙祜w玉說。
她表示,在供應鏈方面,一般公司50%到70%的資金流都有可能被供應鏈占據(jù)。這部分的優(yōu)化,能夠使得成本和效率得到顯著提升。
第三在宣傳方面,徐飛玉表示,聯(lián)想的“promotion”部分也很智能。不管是谷歌、阿里、百度、IBM,還是AlphaGo或者是IBM沃森,都有很好的promotion手段。
“我一直對聯(lián)想AI Lab團隊有一個要求:雖然我們的團隊很年輕,但是一定要把成為世界級AI實驗室作為我們的目標?!毙祜w玉說。
她認為,盡管現(xiàn)在做人工智能的技術門檻比以前要簡單很多,因為有很多開源技術,但聯(lián)想AI Lab的定位是做一個世界級的AI實驗室,參加國際競爭。
“我對團隊平常工作的要求也很高。直接的結(jié)果就是給公司一個很好的Promotion。所以聯(lián)想AI Lab和其他公司不一樣的是,聯(lián)想AI Lab的目標是把聯(lián)想的產(chǎn)品做得更加智能,并創(chuàng)造新的智能產(chǎn)品,第二個是幫助公司實現(xiàn)智能化變革,第三是讓整個聯(lián)想文化變成data driven smart(數(shù)據(jù)驅(qū)動智能)的文化。”徐飛玉說。
從事人工智能研究須將社會福祉考慮進來
在信息時代,數(shù)據(jù)隱私已經(jīng)成為一個繞不開的話題,對于人工智能研究而言,掌握大量的數(shù)據(jù)是進行研究的前提和基礎,如何平衡好數(shù)據(jù)隱私保護與研究的關系,徐飛玉在專訪中強調(diào),作為科學家乃至整個公司,在進行人工智能研究時,必須促進人類社會福祉這一重要因素考慮進來。
“研發(fā)人員不是在一個真空的世界里做研發(fā),應該知道我們生活在一個什么樣的環(huán)境中,”徐飛玉說,“不管是個人,還是安全,還是可解釋的人工智能,都必須成為我們研發(fā)人員應該有的意識?!?/p>
在獲取數(shù)據(jù)方面,徐飛玉認為,如果是為了讓研發(fā)項目做得更快,當然是數(shù)據(jù)越多越好、數(shù)據(jù)孤島越少越好,但是另一方面,需要考慮到監(jiān)管和法律框架的影響。
但同時,許多領域由于法律制度還不健全,實際上阻礙了人工智能的應用對于該領域的貢獻,例如在醫(yī)療領域,其實很多數(shù)據(jù)根本沒有打通,一個醫(yī)院里面可能部門和部門之間的數(shù)據(jù)都沒有打通。
“但是,如果要做罕見病的研究,有可能中國有100例,德國有20例,美國有10例,這個時候為了人類的發(fā)展、人類的進步、醫(yī)療的進步,這些數(shù)據(jù)應該是被打通的,且必須打通,我覺得任何最終的發(fā)展都要為人類服務?!毙祜w玉說。
她提到另一個例子是肝病的相關數(shù)據(jù),中國是世界肝病第一大國,肝病是全世界第三大的腫瘤,中國有如此多的數(shù)據(jù),通過中國人和專家的經(jīng)驗知識,完全可以賦能國際醫(yī)療研究。
徐飛玉認為,在這部分可能不只是一個企業(yè),還需要一個國家或者是整個學術的合作才能建立起來。
“我很高興地看到中國在率先做這個事情,即國家級的開放創(chuàng)新平臺,這個平臺也是全世界最先進的平臺。聯(lián)想也愿意貢獻開放創(chuàng)新平臺生態(tài)和算法模型,賦能整個社會和全世界?!毙祜w玉說。