時間：2020-05-18 20:00:01

關(guān)鍵字： AI 微軟 模型 建模

手機(jī)看文章
掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 眾所周知，AI將是推動未來社會發(fā)展的主力。不久前的10月21日，便有第六屆世界互聯(lián)網(wǎng)大會的重要產(chǎn)業(yè)合作對接活動——IDG“AI+5G 賦能科技引領(lǐng)未來”專場活動在烏鎮(zhèn)互聯(lián)網(wǎng)國際會展中心舉行。其

眾所周知，AI將是推動未來社會發(fā)展的主力。不久前的10月21日，便有第六屆世界互聯(lián)網(wǎng)大會的重要產(chǎn)業(yè)合作對接活動——IDG“AI+5G 賦能科技引領(lǐng)未來”專場活動在烏鎮(zhèn)互聯(lián)網(wǎng)國際會展中心舉行。其以“AI+5G 賦能科技引領(lǐng)未來”為主題，齊聚行業(yè)大咖，共同探討在5G時代，人工智能的發(fā)展之路，為促進(jìn)行業(yè)交流、實(shí)現(xiàn)產(chǎn)業(yè)合作提供平臺。

縱觀現(xiàn)在的國際市場，外有日本軟銀的孫正義，為了發(fā)展AI成立1000億美金的AI基金，專門投資一些AI領(lǐng)域的公司。內(nèi)則有如曠視科技、極鏈科技等AI產(chǎn)業(yè)獨(dú)角獸，積極進(jìn)取，開拓新領(lǐng)域。這些都體現(xiàn)出了AI在人們心中地位的加重。

可也有不少人對AI產(chǎn)生了質(zhì)疑聲，畢竟目前的電腦程序以及所謂的AI，其對我們?nèi)祟惖淖匀徽Z言只是達(dá)到處理的級別。這方面的專業(yè)叫法是自然語言處理NLP，還遠(yuǎn)遠(yuǎn)達(dá)不到我們期望的自然語言理解的程度。

它的實(shí)現(xiàn)方式是，從海量的人類自然語言素材里面，統(tǒng)計出詞與詞，字與字，以及詞組成的短語的模式和出現(xiàn)頻率，然后根據(jù)這個頻率統(tǒng)計，再結(jié)合一段文字上下文邏輯的簡短推理，來找出統(tǒng)計概率最大的結(jié)果。再把這個結(jié)果作為答案輸出或者根據(jù)這個結(jié)果尋找統(tǒng)計概率最大的匹配答案。

這樣的運(yùn)作模式和我們?nèi)祟惱斫庾匀徽Z言的方式有一定的相似，但缺失了很重要的一部分，即詞語背后所指代的事物的背景知識，而這才是理解人類自然的關(guān)鍵，所以現(xiàn)在AI界的一個重要挑戰(zhàn)是，如何讓計算機(jī)理解我們?nèi)祟愓莆盏墓仓R，也就是常識。

近期，微軟研究團(tuán)隊(duì)便通過對上下文建模加以研究，得出了一種新的方法。這種方法能夠讓 AI 模型通過上下文的歷史記錄來改寫對話中的最后話語。在一份預(yù)先出版的論文中，微軟研究團(tuán)隊(duì)詳細(xì)地介紹了他們的工作——為開放領(lǐng)域的對話進(jìn)行無監(jiān)督的上下文重寫。他們聲稱，在重寫質(zhì)量和多輪響應(yīng)生成方面，他們的實(shí)驗(yàn)結(jié)果已經(jīng)達(dá)到了最新基準(zhǔn)。

正如研究人員所解釋的那樣，對話上下文提出了句子建模中所沒有的挑戰(zhàn)，比如主題轉(zhuǎn)換、共同引用（像他、她、它、他們這種）、長期依賴。大多數(shù)系統(tǒng)解決這些問題的方法是在最后一段話中添加關(guān)鍵字，或者用 AI 模型學(xué)習(xí)數(shù)字表示，但這種方法往往會遇到障礙，比如無法選擇正確的關(guān)鍵詞、無法處理較長的上下文等。

這時候，就是微軟研究團(tuán)隊(duì)的方法的用武之地了。它通過對語境信息的考量，重新制定了對話中的最后一句話；這么做是為了生成一個獨(dú)立的話語，既不存在相互參照，也不依賴過去對話的其它話語。

舉個例子，如果將“我討厭喝咖啡。- - 為什么？它挺好喝的啊?！鞭D(zhuǎn)化成“為什么會討厭喝咖啡呢？它挺好喝的啊?！?，這就借用了“它”和“為什么”。其中，“它”指代的是對話中提到的咖啡，“為什么”則是“為什么討厭喝咖啡”的縮寫形式。

對此，研究人員設(shè)計了一個機(jī)器學(xué)習(xí)系統(tǒng)——上下文重寫網(wǎng)絡(luò)，來實(shí)現(xiàn)端到端的流程自動化。這個系統(tǒng)是由一個序列到序列模型組成的，它能夠?qū)⒐潭ㄩL度的話語映射到固定長度的重寫句子上。并且，它還具有一個獨(dú)立的注意力機(jī)制，這個機(jī)制能夠通過最后話語中的不同單詞來幫助它從上下文中復(fù)制單詞。

微軟研究團(tuán)隊(duì)認(rèn)為，他們的工作朝著更易解釋和更易控制的上下文建模中邁進(jìn)了一步。另外，該研究團(tuán)隊(duì)還表示，他們的模型可以從嘈雜的語境中提取出重要的關(guān)鍵詞，然后將這些關(guān)鍵詞插入到最后的話語中，使其不僅變得易于控制和解釋，還有助于將信息直接傳遞到最后的話語中。

這個技術(shù)可以幫助人工智能在真正理解人類話語的路上跨出一步，盡管該模型在強(qiáng)化學(xué)習(xí)后偶爾會變得不穩(wěn)定，不過它依舊顯著地提升了話語的多樣性。此外，微軟今年推出了一款可以識別情緒的工具，根據(jù)上傳的圖片就可以分析出情緒特征，但同時微軟也聲明目前這款軟件還只是以娛樂為主，還不能每次都能正確的識別情緒。

“情緒的產(chǎn)生過程會反映在外周器官狀態(tài)變化。比如人受到外界刺激感到恐懼的時候，會出現(xiàn)心跳加速或心律不齊、呼吸短促或停頓和血壓升高等情況。目前，AI深度學(xué)習(xí)的情緒識別已經(jīng)從快樂、驚訝、憤怒、悲傷、恐懼和厭惡等基本情緒發(fā)展到了超過二十種更微妙的情緒，例如“愉快的驚訝”、“憤怒的驚訝”、敬畏等。

不可否認(rèn)，未來已經(jīng)離我們不遠(yuǎn)了。無論我們喜不喜歡、樂不樂意，終有一天AI將能真正讀懂人類的語言、動作、情緒等各類因素。屆時，如何處理好其間可能存在的問題，還需我們提前進(jìn)行思考。