語言是人類特有的技能,是人類智慧的體現(xiàn)。在人工智能時代,自然語言處理(NLP)技術(shù)為機器賦予了這樣的語言功能,讓機器有了自然語言識別能力,為用戶體驗開辟了新路徑。
在近期的Google Cloud Next 18大會上,Google推出了第一個Solution Product (行業(yè)解決方案產(chǎn)品)——Contact Center AI,其集虛擬助理、智能信息發(fā)掘和情感分析等功能于一身,不但幫助工作人員有效解決了問題而且提升了用戶體驗,展現(xiàn)了人工智能語言技術(shù)的新突破。貌似科幻小說里的場景變成了現(xiàn)實,但是想要維護好人與機器的關(guān)系,機器必須能夠?qū)崿F(xiàn)直觀的、自然的語言交流,這對于NLP技術(shù)來說仍然是一個挑戰(zhàn)。很多企業(yè)早就開始研究NLP,該項技術(shù)的出現(xiàn)幾乎跟人工智能一樣早,但是目前還處于起步階段。
語言是人們進行信息交流的首要工具,要想機器也具備同樣的機制,就要理解人類語言的復(fù)雜性以及人類使用語言的行為習慣,其中情感分析、問題回答以及多任務(wù)學(xué)習是機器人逐漸成熟的重要途徑。
情緒分析語言本質(zhì)上是復(fù)雜的,一個正常人也要經(jīng)過數(shù)年才能掌握一門陌生的語言。對于機器人而言,我們要想使用人工智能來解析給定的陳述,首先要實現(xiàn)情緒分析,比如,判斷電影評價是正面的還是負面的,或者分析發(fā)話者是高興的、生氣的、驚訝的還是悲傷的等。從客戶服務(wù)到在線社區(qū)審核再到算法交易,企業(yè)能夠通過分析成千上萬個推文或數(shù)百個產(chǎn)品評論,了解公眾對產(chǎn)品的看法,對于企業(yè)來說,這個價值是很大的。
研發(fā)人員早就開始入手自然語言處理中的情緒分析,隨著NLP的進步,情緒分析也在不斷進步。比如CRM解決方案提供商Salesforce推出的一款產(chǎn)品——Einstein AI(愛因斯坦人工智能服務(wù)),它可以幫助客戶對電子郵件、社交媒體聊天文本進行情感分析,然后了解用戶信息,幫助確定企業(yè)客戶的下一步產(chǎn)品策劃。
Salesforce的首席科學(xué)家 Richard Socher表示,機器人只實現(xiàn)簡單的語意理解是不夠的,有時候需要一定的語境,需要通過聯(lián)系上下文去判斷。比如,你是一個生產(chǎn)肥皂的企業(yè),用戶在產(chǎn)品評價上說了這樣一句話“這款肥皂真的很適合嬰兒!”。按照表面的語意來說,可能就是對產(chǎn)品的積極評價,但是如果聯(lián)系上下文,整個語言環(huán)境都是對產(chǎn)品的差評,那么這句話的意思也可以理解成“這款產(chǎn)品真的很差勁!不要給嬰兒使用!”。所以,NLP真正的挑戰(zhàn)是在特定的語言背景下,去理解語言的細微差別,即需要通過簡單的標記數(shù)據(jù)改進模型訓(xùn)練,也需要能夠聯(lián)系上下文在多種不同任務(wù)中共享知識的新模型。
問題回答NLP的發(fā)展加快了信息化的速度,Siri和Google Assistant等應(yīng)用程序的出現(xiàn),解決了很多常見的自然語言處理問題,但是很多難題,機器仍然沒有給到我們想要的答復(fù)。
想要計算機到達理想效果,我們還要確保計算機對問題的理解。如果你問“我的飛機何時到達?”電腦需要知道你說的是飛機的航班還是你從外地訂購的某個飛機模型,它需要通過上下文語境,去猜測我們話語中的真實意思。通過NLP,我們可以讓機器學(xué)習如何通過上下文語境去分析語句,這樣的話,人工智能就可以一次性處理所有的上下文,而不會漏掉重要的信息。
多任務(wù)學(xué)習在IT領(lǐng)域,企業(yè)更擅長構(gòu)建單個任務(wù)的人工智能模型,但是一個更直觀的、細致入微的、有語境的對話界面則需要一個不斷學(xué)習的人工智能模型——將新的任務(wù)和舊的任務(wù)集成在一起,來學(xué)習執(zhí)行更復(fù)雜的任務(wù)。對于別的領(lǐng)域來說,人工智能達到這樣的標準也許是可能的,但是在語言方面,就需要很大的靈活性。
這里我們來舉一個例子:“誰是我的客戶?”,這是一個足夠簡單的任務(wù)。但是“誰是我在西部地區(qū)的某一產(chǎn)品的最佳客戶?”現(xiàn)在,我們增加了一些復(fù)雜條件,就需要一系列集成任務(wù)來回答這個問題,比如說:“最佳”如何界定?西部地區(qū)的客戶具體是哪里?哪些因素會使客戶對一種產(chǎn)品產(chǎn)生興趣?這里我們在查詢條件里增加了一個項目,問題的復(fù)雜性就顯著增加。
Salesforce Research最近創(chuàng)建了自然語言十項全能,利用問答的力量在單一模塊中解決NLP中最棘手的10項任務(wù):問答、機器翻譯、摘要、自然語言推理、情感分析、語義角色標注、關(guān)系抽取、目標導(dǎo)向?qū)υ?、語義分析、常識代詞消解。使用多個任務(wù)問答模型,將每個任務(wù)作為一種問答形式,單個模型在沒有特定參數(shù)或模塊的情況下共同處理不同的任務(wù),這不僅意味著研發(fā)人員不需要為每一項任務(wù)構(gòu)建、訓(xùn)練和優(yōu)化模型,而且還意味著該模型將具備zero-shot(零樣本學(xué)習)能力,也就是說,在未經(jīng)過任何訓(xùn)練的情況下該模型也可以處理它從未執(zhí)行過的任務(wù)。
Socher解釋道,問題回答其實是非常寬泛的——你可以隨便問任何問題——該研究相當于提供了解決幾個任務(wù)的單一模型。
雖然目前的NLP還處于起步階段,但是我們可以看到它巨大的發(fā)展?jié)摿?,隨著人工智能的發(fā)展,我們期待一個全新的自然語言處理技術(shù)體驗。