機(jī)器人如何讀懂文字中的情感
首先需要清楚“判斷標(biāo)準(zhǔn)”。多數(shù)情況下默認(rèn)的情感分析的評(píng)判標(biāo)準(zhǔn)是“一段文本的情感多分類的準(zhǔn)確性”。這是有問題的。因?yàn)榱奶觳煌陉愂?,這背后涉及到一個(gè)本質(zhì)的區(qū)別——“是否有交互”。一旦涉及到交互,情感分析(sentiment analysis)評(píng)判標(biāo)準(zhǔn)的復(fù)雜度就要上升不止一個(gè)數(shù)量級(jí)了。
“AffecTIve CompuTIng”(情感計(jì)算)和NLU是AI領(lǐng)域重要的研究方向,而其中針對(duì)中文的情感、情緒識(shí)別與理解,竹間智能已經(jīng)做了許多研究與探索,希望幫助AI在語義理解的基礎(chǔ)上更進(jìn)一步,實(shí)現(xiàn)真正的人機(jī)情感交互。此次我們邀請(qǐng) 竹間智能高級(jí)算法工程師鄧霖,來深入地分享一些竹間在中文情感、情緒識(shí)別上的經(jīng)驗(yàn),并從技術(shù),商業(yè),人文等多個(gè)角度談?wù)勅绾卧趯?duì)話中判斷和利用情感,以及情感判斷的重要意義。希望對(duì)大家有所幫助。
本文行文結(jié)構(gòu)如下,共分為三個(gè)部分:
一、 無交互的情感分析,其普遍的技術(shù)實(shí)現(xiàn)方式及商業(yè)應(yīng)用
二、 交互式情感分析的難處和解決思路
三、 情感在人類信息溝通中的意義和作用,以及如何應(yīng)用
一、 無交互的情感分析,其普遍的技術(shù)實(shí)現(xiàn)方式及商業(yè)應(yīng)用
1. 無交互文本情感分析的普遍技術(shù)實(shí)現(xiàn)方式
情感分析(senTIment analysis)又稱傾向性分析,意見抽?。∣pinion extracTIon),情感挖掘(Sentiment mining),主觀分析(Subjectivity analysis)等,是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程。
目前,情感分析在傳統(tǒng)機(jī)器學(xué)習(xí)上的主要研究方法還是基于一些傳統(tǒng)算法,例如,SVM、信息熵、CRF等?;跈C(jī)器學(xué)習(xí)的情感分析,其優(yōu)勢(shì)在于具有對(duì)多種特征建模的能力。要用人工標(biāo)注的單個(gè)詞作為特征,而語料的不足往往就是性能的瓶頸。
當(dāng)然也有基于情感詞典的情感分析方法,也就是應(yīng)用情感詞典中記錄的詞語或短語的情感傾向程度和強(qiáng)度信息對(duì)文本進(jìn)行情感分類。這個(gè)就比較依賴于人工構(gòu)建和抽取的特征了。會(huì)受到情感詞典本身的質(zhì)量以及適用領(lǐng)域的局限,否定詞也是一個(gè)小坑。(構(gòu)建情感詞典一般采用bootstrapping的方法)
至于深度學(xué)習(xí)在情感分析上的種類就比較多了,有各種方法的綜合創(chuàng)新,比如有利用LSTM結(jié)合句法分析樹,還有基于卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的。除了準(zhǔn)確率能有明顯的提高外,重要的是可以自動(dòng)從無標(biāo)注的文本中學(xué)習(xí)文本中的隱藏特征,并可以實(shí)現(xiàn)端到端的分類。
這些技術(shù)也并不獨(dú)立,往往都是混合使用,以此來取長補(bǔ)短,從而達(dá)到一種相對(duì)均衡的效果。
2. 無交互的文本情感分析的商業(yè)應(yīng)用
● 情感分析最大的應(yīng)用層在于評(píng)論的篩選和歸類,之所以這個(gè)應(yīng)用最廣泛,就是因?yàn)榈谝贿@個(gè)應(yīng)用離商業(yè)價(jià)值很近,第二不需要做到特別深,很多時(shí)候只要做到正負(fù)分類就能產(chǎn)生可見的收益了。比如對(duì)于一個(gè)餐廳來說,能夠做到把關(guān)于自己的相關(guān)好評(píng)自動(dòng)抽取并在自己的網(wǎng)站輪播也許就夠了。
電商平臺(tái)里關(guān)于商品評(píng)論的標(biāo)簽提取也可以說是情感分析。
關(guān)于評(píng)論的情感分析,再做深一點(diǎn)就是意見挖掘,這就涉及到關(guān)聯(lián)規(guī)則了。也就是做得更細(xì),能看到用戶到底是對(duì)產(chǎn)品的哪個(gè)屬性滿意或者不滿,比如我覺得這件衣服有色差或者材質(zhì)不夠好等。
再做好點(diǎn)就是能把情感的強(qiáng)度表示出來(強(qiáng)正面,弱正面,中性,弱負(fù)面,強(qiáng)負(fù)面),以及增加情感的分類。
也可以反向思考,利用情感分析評(píng)論,做用戶的分類聚類。
● 還有一個(gè)應(yīng)用是預(yù)測(cè)社交網(wǎng)絡(luò)上的輿論走向。美國大選那段時(shí)間,情感分析發(fā)揮了至關(guān)重要的預(yù)測(cè)作用,通過利用Twitter上的大量文本進(jìn)行分析,來預(yù)測(cè)整體的輿論走向。這也是在傳統(tǒng)調(diào)查都顯示特朗普會(huì)輸?shù)臅r(shí)候他卻表現(xiàn)得穩(wěn)如泰山的原因。
這方面自己做得好玩的話,可以爬爬社交網(wǎng)站中熱門事件的回答和評(píng)論,然后分析分析輿論的走向,說不定就成了一個(gè)PR的專業(yè)分析產(chǎn)品了呢。還可以看看有多少輿論問題是從網(wǎng)站中炒起來的,企業(yè)還是相當(dāng)在乎相關(guān)輿論的走向的,畢竟輿論錯(cuò)位導(dǎo)致的用戶認(rèn)知改變不是隨便砸錢就能扳回來的。所以要是實(shí)現(xiàn)了高準(zhǔn)確率的預(yù)測(cè),對(duì)于企業(yè)來說,或許可以一定程度上做到防患于未然。
● 以上這些都算相對(duì)直接的應(yīng)用。其實(shí)間接性的話,其實(shí)情感分析的偏向性判斷對(duì)于構(gòu)建較深層的個(gè)性化推薦系統(tǒng)有著比較大的幫助,能較好地理解對(duì)于不同種類商品以及不同屬性的偏好程度,從而具備一定的符號(hào)推理能力,相對(duì)于目前無論是按 itemCF、userCF 還是隱語音模型方式的推薦系統(tǒng)都更具有可解釋性與理解力。
當(dāng)一點(diǎn)點(diǎn)逐步知道了偏好傾向性后,其實(shí)關(guān)于用戶的精準(zhǔn)建模也就慢慢清晰了,從多個(gè)偏好中還能進(jìn)行進(jìn)一步的挖掘來推理用戶屬性。一個(gè)深刻的用戶模型能產(chǎn)生的商業(yè)價(jià)值是不言而喻的。當(dāng)然關(guān)于用戶的建模目前的研究也不多,基本是個(gè)藍(lán)海,我們正在嘗試去實(shí)現(xiàn),從文本中不斷收集用戶的偏好、屬性等,再進(jìn)行進(jìn)一步的挖掘和推導(dǎo)。這邊先不展開了,以后會(huì)有文章展開細(xì)說的。
二、交互式的文本情感分析
上面說的其實(shí)都是“0交互的情感分析”任務(wù)。
都是以單人敘述的方式,可能是短句子也可能是一段話,都有一個(gè)核心共同點(diǎn)——“沒有交互”。
所以相對(duì)而言比較容易,只要按無交互的敘述方式做解決方案就好:就像分析微博一樣,去判斷這些短文本就行了,然后再增加一個(gè)持續(xù)的情緒疊加和衰減的函數(shù)就可以了。
不過似乎這樣做下去能夠帶來的價(jià)值還遠(yuǎn)遠(yuǎn)不夠。
這里要明確幾個(gè)問題:
● 情感在人類信息交互時(shí)的作用是什么?
● 知道了情感狀態(tài)后能干什么?
● 怎么最大化地利用這些信息創(chuàng)造價(jià)值?
一直相信一句話——“問題比答案重要”,知道問題是第一步,尤其是在不確定性這么高的時(shí)代下。
這三個(gè)問題其實(shí)需要站在更高的層面去思考,也就是首先要從情感在人類信息溝通中的意義開始思考,再推理出怎么應(yīng)用,以及怎么更高效率地運(yùn)用。這些問題稍后來探討,我們先來看看有了交互后的情感分析會(huì)有什么變化?
為什么一旦有了“交互”,情感分析就變得那么難?
第一:交互是一個(gè)持續(xù)的過程而不是短時(shí)固定的。而這從本質(zhì)上改變了情感判斷的評(píng)價(jià)方式。在無交互的時(shí)候,比如商品評(píng)論,你判斷這段話是什么情感分類后就可以實(shí)現(xiàn)價(jià)值了,是清晰的分類任務(wù)。但用在對(duì)話上就不太一樣了,情感狀態(tài)持續(xù)在變,分析任何單一的一句話是沒有很大意義的,這不再是一個(gè)簡單的分類任務(wù)了。對(duì)于持續(xù)的過程,簡單的解決方案是加一個(gè)增益和衰減的函數(shù),但這個(gè)函數(shù)怎么寫?理論依據(jù)是什么?怎么判斷這個(gè)函數(shù)寫得好不好?難道靠人工標(biāo)注的數(shù)據(jù)去分析么。
第二:交互的存在將大部分的狀態(tài)信息都隱藏了起來。在明面上能看到的不到5%,只是冰山一角(用類似于隱馬爾可夫的方式去理解)。并且交互的雙方都默認(rèn)對(duì)方知道很多信息。比如溝通主客體之間的關(guān)系狀態(tài)、彼此的需求目的、情緒狀態(tài)、社會(huì)關(guān)系、環(huán)境、之前聊到的內(nèi)容,以及都具備的常識(shí),性格,三觀等等。
然后你會(huì)發(fā)現(xiàn)以下一些現(xiàn)象:
1.兩個(gè)人之間共同的信息越多就越難,因?yàn)殡[藏狀態(tài)的作用越大,隱藏狀態(tài)的維度越多。
2.不同的人之間存在著不同的交流范式。
這個(gè)范式的變化取決于其他的各種環(huán)境信息(包括時(shí)間,地點(diǎn),你們的關(guān)系狀態(tài),彼此的情緒,共同的經(jīng)歷,自己的聊天習(xí)慣等等)。
即便是相同的人,他們之間的交流范式也是一個(gè)動(dòng)態(tài)變化的過程,這個(gè)想必大家深有體會(huì),比如兩個(gè)人在戀愛的過程中,他們之間的交流方式會(huì)因?yàn)楦星榈纳郎睾徒禍囟兴煌?/p>
回想幾個(gè)生活中實(shí)際的經(jīng)歷:
1.找到一個(gè)微信對(duì)話,回想一下,在具體聊天的時(shí)候是不是都涉及到了這些隱藏的狀態(tài)和不同的范式。
2.當(dāng)你在和你覺得重要的人聊天的時(shí)候,是不是非常關(guān)心對(duì)方的情感狀態(tài),而且需要推理這個(gè)狀態(tài)。
第三:交互涉及到信息的跳躍。當(dāng)你自己一個(gè)人說什么的時(shí)候往往都是比較有邏輯的,連貫的。但聊天和個(gè)人陳述完全是兩件事,聊天會(huì)有較大的跳躍性。這種不確定的信息跳躍性指數(shù)級(jí)地增大了情感分析的難度。
這就是為什么加入了交互因素情感分析變得這么難判斷的原因,首先是評(píng)價(jià)方式改變了,而且這個(gè)評(píng)價(jià)方式很復(fù)雜,沒有什么可借鑒的。再從第二第三原因可以看到,這對(duì)于機(jī)器學(xué)習(xí)來說數(shù)據(jù)維度太稀疏了(顯性的狀態(tài)就只有文本,表情等,多數(shù)狀態(tài)都是隱藏的),再加上跳躍性,因此這種靠統(tǒng)計(jì)的方式,想把準(zhǔn)確率做高,其困難程度可想而知。
因此要想突破瓶頸,就需要在這三個(gè)問題上找解決方案。
舉個(gè)例子,第一個(gè)問題,我們目前的評(píng)價(jià)方式的理論依據(jù)是心理學(xué)和認(rèn)知科學(xué)的理論,當(dāng)然這個(gè)還在探索。第二個(gè)問題,既然是缺,那就補(bǔ),想辦法找到更多數(shù)據(jù)輸入進(jìn)來,多維度(圖片,表情,顏文字等)的語義理解是一個(gè)思路,即多模態(tài)分析的思路。第三個(gè)問題,暫時(shí)屬于好像沒頭緒的狀態(tài),結(jié)合知識(shí)圖譜和符號(hào)規(guī)則,這是一件看似簡單卻無比困難的事情,可能會(huì)有各種阻礙。
下面我簡述一下目前關(guān)于第二、三個(gè)問題稍細(xì)致點(diǎn)的解決方案。
提到問題的解決方案,會(huì)比較自然地想到通過LSTM來解決上下文記憶問題,只是效果不太好,原因第一是大部分隱藏狀態(tài)不出現(xiàn)在文本里,第二是交互對(duì)話信息的跳躍,這導(dǎo)致LSTM的記憶其實(shí)作用不是太大。但相比其他方法確實(shí)LSTM在對(duì)話中的效果是有顯著提升的。
比較新的方式是:Seq2Seq模型上加情感向量,將情感狀態(tài)放入LSTM再加入情感詞加權(quán)生成回復(fù)。
進(jìn)一步的話,可以利用NLU語義理解,從文本中抽取重要的實(shí)體和意圖,作為特征加入到學(xué)習(xí)中,并且加上一套規(guī)則,結(jié)合用戶的建模模型后再輸出最后的對(duì)話語句。
繼續(xù)深入的話,其實(shí)就是找到隱藏的信息狀態(tài)并加入到計(jì)算中,也就是多模態(tài),內(nèi)部的多模態(tài)設(shè)計(jì),emoji+照片+表情包+文本長度等等,外部的多模態(tài)就是加入了識(shí)別的面部表情+給我提供的標(biāo)簽(比如性格,星座,愛好,年齡,性別等等)+語音等等。利用這些信息的規(guī)則其實(shí)也相當(dāng)重要,更多的靠的是對(duì)人性的理解。
目前竹間智能正在努力做好第二和第三步,即更深的語義理解和多模態(tài)情感分析。
三、情感在人類信息溝通中的意義
上一部分講到了交互式的情感分析的困難。那既然那么困難,為什么還要做?
答案是:因?yàn)檫@很重要。
人類進(jìn)化的歷史本質(zhì)就是通信的進(jìn)化歷史。而情感在信息溝通中扮演著至關(guān)重要的角色。理解情感對(duì)于人類個(gè)體和人類社會(huì)的意義,才能做出懂人的產(chǎn)品。
●情感本身是高級(jí)智能的一部分
情感是大腦運(yùn)行資源的調(diào)配者,不同的情感狀態(tài)下大腦的計(jì)算資源分配方式差距巨大,因此會(huì)采取完全不同的思維執(zhí)行路徑。
情感對(duì)于人們的智力、理性決策、社交、感知、記憶和學(xué)習(xí)以及創(chuàng)造都有很重要的作用。
●情感是交互的核心
想必大家應(yīng)該聽過這句話“人類交流中80%的信息都是情感性的信息”,雖然不一定足夠嚴(yán)謹(jǐn),但自行體會(huì)生活點(diǎn)滴也會(huì)發(fā)現(xiàn),情感是交互的核心。
對(duì)于個(gè)體的來說,我們?cè)诮涣髦斜磉_(dá)情感,很重要的一個(gè)作用就是通過情感告知對(duì)方我現(xiàn)在的狀態(tài),一方面給出對(duì)于之前交互的狀態(tài)反饋,另一方面讓對(duì)方能推斷出我接下來行動(dòng)的傾向性。
為什么不是內(nèi)容而是情感,能傳遞最多的狀態(tài)信息?
因?yàn)閺恼J(rèn)知科學(xué)的角度來看,上面說過情感就是智能的一部分,情感就是大腦運(yùn)行資源的調(diào)配者,不同的情感狀態(tài)下大腦的計(jì)算資源分配方式差距巨大,因此會(huì)采取完全不同的思維執(zhí)行路徑,從而產(chǎn)出最后不同的結(jié)果。就像在和朋友對(duì)話的時(shí)候,如果語氣語調(diào)有了明顯變化,大腦就會(huì)迅速運(yùn)轉(zhuǎn)來做出各種判斷,從而相應(yīng)地改變自己的行為。千萬年的進(jìn)化使得我們判斷的準(zhǔn)確性很高,不斷的正向反饋也使得我們?cè)絹碓揭蕾囉米R(shí)別對(duì)方情感的方法來判斷行為傾向這個(gè)方式,而且已經(jīng)成為自動(dòng)運(yùn)行的認(rèn)知方式了。這就是為什么接近80%的信息都是情感信息的原因了,因?yàn)樾畔⒘扛撸瑯O大地增加了溝通效率。
溝通效率提升的結(jié)果就是——增加了群體之間協(xié)作的廣度(協(xié)作者的數(shù)量)和深度(協(xié)作內(nèi)容的復(fù)雜性)。群體智能得到了指數(shù)級(jí)的提升。
在“我現(xiàn)在的狀態(tài)”中“情感狀態(tài)”是信息量最大的狀態(tài),通過這個(gè)我們可以做兩件事,第一是預(yù)測(cè)接下來對(duì)方的行為傾向,第二就是可以結(jié)合狀態(tài)來改變反推別人想了些什么以及別人需要什么。
● 人類在交互中的情感帶寬
先提一個(gè)概念——“情感帶寬”,即你能表達(dá)的情感的信息量的大小和維度,比如說情感性的信息,往往是從多維度表達(dá)出來的,(口語:語音語調(diào),語速,聲音大?。簧眢w語言:面部表情,手勢(shì),其他身體動(dòng)作)等等,舉例如“最是那一眼的溫柔”“眉目傳情”“沉悶的干咳”等等。
到了網(wǎng)絡(luò),整個(gè)范式就發(fā)生了比較大的變化,情感的帶寬也變了。比如在網(wǎng)絡(luò)上交流溝通,我們的情感帶寬好像瞬間驟降了,需要以文本和圖片的方式來表達(dá)。
實(shí)際上在降低的同時(shí),我們的情感帶寬在某種程度上也增加了,增加了幾個(gè)新的輸出維度,比如emoji表情、各種表情包、gif圖,回話的時(shí)間快慢,正在輸入的狀態(tài),甚至像Faceu那樣的個(gè)人表情包等等都是不斷豐富我們情感帶寬的方式。
社交網(wǎng)絡(luò)上的聊天,文字對(duì)話占據(jù)了大部分,但實(shí)際上我們看到文字的時(shí)候其實(shí)是在大腦里虛擬者那個(gè)人在說的,會(huì)自行腦補(bǔ)Ta這么說的時(shí)候的語氣和表情等等。
文字文本依然是占據(jù)大部分的,而其他維度信息的縮減其結(jié)果就是——通過語義來推斷情感。
前面講到對(duì)話中情感分析的困難,其中一個(gè)重要原因就是因?yàn)樾畔⒕S度的稀疏,因此要盡可能從多維度把缺失的情感帶寬給補(bǔ)上。
解決方案上面也說過了,多模態(tài),內(nèi)部的多模態(tài)設(shè)計(jì)emoji+照片+表情包+文本長度等等,外部的多模態(tài)就是加入了識(shí)別的面部表情+給我提供的標(biāo)簽(比如性格,星座,愛好,年齡,性別等等)+語音等等。利用這些信息的規(guī)則其實(shí)也相當(dāng)重要,更多的靠的是對(duì)人性的理解。
總結(jié)
以上講到了情感識(shí)別在交互中至關(guān)重要的作用。
對(duì)于整個(gè)情感交互來說,情感識(shí)別可以說是技術(shù)基礎(chǔ),在識(shí)別之后可以做更深入的事情,“情感表達(dá)”、“需求分析”、“深度用戶建?!薄叭诵曰换ンw驗(yàn)”等等。
拿深度建模來說,通過和你聊天,就可以用情感分析對(duì)實(shí)體進(jìn)行高效率的自動(dòng)化標(biāo)注,實(shí)現(xiàn)專屬情感詞典。了解到你的偏好以及你的偏好程度,利用你的偏好給你建模,久而久之就實(shí)現(xiàn)了個(gè)性化,而不是像Siri那種號(hào)稱個(gè)人助手實(shí)際上卻不夠個(gè)性化的存在。
對(duì)情感表達(dá)來說,可以實(shí)現(xiàn)人機(jī)對(duì)話系統(tǒng)中情感的誘導(dǎo),判斷出情感之后自然就可以去影響情緒了,用不同的話語來實(shí)現(xiàn)情感傾向的改變。比如我能判斷我接下來說選哪一句答復(fù)能讓你產(chǎn)生一個(gè)情感傾向,可能是高興、驚訝也可能是傷心等等。讓你產(chǎn)生感受這就是進(jìn)一步在實(shí)現(xiàn)交互。
人性化交互體驗(yàn)的應(yīng)用方向是不言自明的,當(dāng)智能體的“智商”沒有過于顯著的差別的時(shí)候,一個(gè)稍微有些情商的智能系統(tǒng)更容易被選擇。拿家用機(jī)器人來說,核心的需求其實(shí)是陪護(hù)和娛樂,而要做好這兩件事“情商”是關(guān)鍵。上面也說過情感是信息交互中最重要的反饋,因?yàn)樾畔⒘孔畲?。因此一個(gè)不能很好地理解人類情感和意圖的機(jī)器是做不好交互的。當(dāng)然要實(shí)現(xiàn)這個(gè)需要的是一整套的情感系統(tǒng)。
竹間智能Emotibot以類腦對(duì)話系統(tǒng)和情感計(jì)算為核心,希望以人工智能技術(shù)助力更多行業(yè)、機(jī)構(gòu)及個(gè)人擁抱AI時(shí)代,分享AI發(fā)展的紅利。
來源:竹間智能Emotibot