人工智能大數(shù)據(jù)進(jìn)入心理學(xué)有什么意義
人工智能和大數(shù)據(jù)時代的到來為心理學(xué)的研究打開了全新的大門。人工智能除了在心理實(shí)驗(yàn)方面有著無法取代的潛力,在其他方面也會大大拓展心理學(xué)的研究領(lǐng)域。隨著智能終端的不斷發(fā)展,移動數(shù)據(jù)的不斷提速,人工智能不僅可以提供心理干預(yù)的平臺,更有可能成為心理干預(yù)的主力??茖W(xué)的研究方法將心理學(xué)從哲學(xué)中分離開來,而人工智能和大數(shù)據(jù)則可能將心理學(xué)更深刻地帶入生活。
心理學(xué)是研究人的行為和心理活動規(guī)律的科學(xué),自人類出現(xiàn),便有了對人類心理和行為的關(guān)注。直到 1879 年,構(gòu)造主義學(xué)派創(chuàng)始人馮特在德國萊比錫大學(xué)建立第一個心理學(xué)實(shí)驗(yàn)室,心理學(xué)從哲學(xué)的襁褓中分離出來,成為一門獨(dú)立的科學(xué)。
心理學(xué)通過科學(xué)的方法去分析人的行為和心理,主要包括觀察法、調(diào)查法(問卷法和訪談法)、測驗(yàn)法、實(shí)驗(yàn)法等。這些方法很容易受到主試和被試自身期待或動機(jī)的影響,而產(chǎn)生虛假或迷惑性的結(jié)果,即內(nèi)部效度可能會受到影響;由于是在一定的時間段內(nèi)選取有限的、有代表性的研究對象進(jìn)行研究,然后將結(jié)論推廣到相同的群體中,這些方法的外部效度和實(shí)效性也備受質(zhì)疑。
目前心理學(xué)研究主要以自我報(bào)告或者主觀觀察為主要技術(shù)手段,對現(xiàn)實(shí)或網(wǎng)絡(luò)環(huán)境中人們的行為和心理進(jìn)行研究。隨著技術(shù)的發(fā)展,網(wǎng)絡(luò)環(huán)境已不能單純地看作一種工具,它已經(jīng)與人類的生存及其環(huán)境深度融合,具有與既往傳統(tǒng)心理學(xué)研究環(huán)境完全不同的復(fù)雜性與特殊性,同時也為研究提供了新的思路。
人工智能和大數(shù)據(jù)時代的到來為心理學(xué)的研究打開了全新的大門。隨著網(wǎng)絡(luò)及各種智能可穿戴設(shè)備的普及,虛擬環(huán)境與真實(shí)生活不斷融合,現(xiàn)實(shí)社會中人的各種心理與行為現(xiàn)象能夠被電子化記錄成大數(shù)據(jù)保存下來,例如網(wǎng)絡(luò)訪問行為、社會情緒、社會態(tài)度、心理健康問題等。研究人員通過用戶留下的這些數(shù)據(jù)對其人格特質(zhì)或者行為進(jìn)行預(yù)測,Gosling等利用在線社交網(wǎng)站觀察到的人格結(jié)果對大五人格(big- five)的測量結(jié)果與基于Facebook的網(wǎng)絡(luò)行為自我報(bào)告進(jìn)行了相關(guān)分析,結(jié)果發(fā)現(xiàn)大五人格的不同維度與網(wǎng)絡(luò)行為顯著相關(guān);同時,依賴于現(xiàn)代生活方式,尤其是網(wǎng)絡(luò)信息傳播與人際互動,已經(jīng)深刻地影響甚至改變了人們的心理與行為特征,產(chǎn)生出一系列亟待解決的全新課題,例如謠言傳播、網(wǎng)絡(luò)煽動群體性事件、網(wǎng)絡(luò)成癮等。Zhou 等在研究利用中國社交媒體預(yù)測社會事件的發(fā)展趨勢時發(fā)現(xiàn),群體憤怒情緒會對集體行為產(chǎn)生影響,并且意見領(lǐng)袖、參與者的社會態(tài)度以及事件的持續(xù)時間都在預(yù)測網(wǎng)絡(luò)社交事件發(fā)展趨勢中發(fā)揮著重要作用。
大數(shù)據(jù)不僅在研究內(nèi)容上為心理學(xué)家?guī)砹诵碌恼n題,更重要的是,大數(shù)據(jù)與人工智能的結(jié)合,使得我們可以利用生態(tài)化的行為數(shù)據(jù),結(jié)合人工智能技術(shù),實(shí)現(xiàn)對人們心理指標(biāo)的自動識別,即生態(tài)化識別(ecological recognition),從而大大拓展了心理學(xué)研究和應(yīng)用范疇。Conroy等分析人工智能大數(shù)據(jù)與政治參與之間的關(guān)系發(fā)現(xiàn),利用互聯(lián)網(wǎng)新媒體可以增加投票率,促進(jìn)公民參與積極性。此外,有研究者利用用戶在網(wǎng)絡(luò)上留下的數(shù)字足跡來對其心理特質(zhì)進(jìn)行預(yù)測,并嘗試針對不同人格的用戶推送統(tǒng)一廣告的不同類型的廣告圖,結(jié)果顯示通過這一方式推送的廣告點(diǎn)擊率上升了40%。
生態(tài)化識別是指一種非接觸式的心理特征測量方法,利用機(jī)器學(xué)習(xí),建立心理指標(biāo)預(yù)測模型,從而實(shí)現(xiàn)對受試者的心理指標(biāo)的自動識別。相比于傳統(tǒng)的心理學(xué)研究方法,生態(tài)化識別具有以下優(yōu)勢:首先,由于數(shù)據(jù)自身的特點(diǎn),不同時間粒度的縱向追蹤成為可能;其次,可以通過時間回溯,獲取重大事件發(fā)生前后受試者的心理狀態(tài)和行為表現(xiàn)及其變化規(guī)律,從而對事件的影響進(jìn)行量化研究,例如利用社交媒體探索家庭暴力對心理健康的影響,通過分析家庭暴力前后不同時間段的心理健康狀況了解家庭暴力對心理健康的負(fù)面影響;最后,生態(tài)化識別不依賴于被試的主觀報(bào)告,也不依賴于主試的操控,從而可以有效避免實(shí)驗(yàn)條件帶來的誤差,提高了研究結(jié)果的內(nèi)部效度和外部效度。
以下將主要從人格預(yù)測模型的建立介紹如何將人工智能大數(shù)據(jù)應(yīng)用于心理學(xué)研究,然后通過主動自殺干預(yù)以及輿情分析介紹在心理學(xué)實(shí)踐中的應(yīng)用,最后討論特別需要關(guān)注的倫理問題。
01、建立心理指標(biāo)預(yù)測模型——以人格預(yù)測為例
人格是構(gòu)成一個人思想、情感、行為的獨(dú)特模式。人格一直以來都備受心理學(xué)家的關(guān)注,逐漸形成了特質(zhì)理論、類型理論以及整合理論。目前最被接受的大五人格理論,就是特質(zhì)理論的一個典型代表。大五人格理論認(rèn)為,人格可以分為5個因子:開放性(openness)、盡責(zé)性(conscienTIousness)、外傾性(extroversion)、宜人性(agreeableness)和神經(jīng)質(zhì)(neuroTIcism)。
現(xiàn)有的人格結(jié)構(gòu)主要是從現(xiàn)實(shí)語境中產(chǎn)生的,在解釋網(wǎng)絡(luò)用戶行為過程中常常遇到困難,研究網(wǎng)絡(luò)人格結(jié)構(gòu)將有助于我們從心理層面識別網(wǎng)絡(luò)用戶身份,深入了解網(wǎng)絡(luò)用戶的行為特征并預(yù)測用戶的網(wǎng)絡(luò)行為。中國科學(xué)院心理研究所計(jì)算網(wǎng)絡(luò)心理 實(shí) 驗(yàn) 室(computaTIonal cyber psychology lab,CCPL)對網(wǎng)絡(luò)人格結(jié)構(gòu)開展相關(guān)研究:根據(jù)詞匯學(xué)假設(shè)建立微博人格結(jié)構(gòu);利用機(jī)器學(xué)習(xí),以期建立一個對網(wǎng)絡(luò)用戶行為心理具有更好描述和預(yù)測效果的模型,即建立人格預(yù)測模型。
傳統(tǒng)的心理學(xué)主要采用詞匯學(xué)的方法,對于自然語言中獲得的人格詞匯進(jìn)行分析,得到一組數(shù)目有限的特質(zhì),用以代表在這一語言背景下的人們的最重要的特點(diǎn)。以新浪微博文本數(shù)據(jù)為研究材料,開展詞匯學(xué)研究。選取 100 個新浪微博活躍用戶的微博,通過人工標(biāo)記的方式,得到描述穩(wěn)定人物特點(diǎn)的術(shù)語1945個。經(jīng)過對這些屬于進(jìn)行刪除生僻、長度不宜詞匯和合并同義詞,獲得210個穩(wěn)定人格形容詞,隨后對形容詞好惡度、熟悉度和意義度進(jìn)行評定,將形容詞化簡到63個形容詞,并增加具有微博特色的形容詞15個,最終得出共78個形容詞的詞表。通過對106名被試的78個形容詞的評定結(jié)果進(jìn)行因素分析,得出了微博人格7因素:
道德善良、獨(dú)立擔(dān)當(dāng)、團(tuán)結(jié)包容、幽默活潑、網(wǎng)絡(luò)個性、謙虛淡定、自信低調(diào)(KMO=0.534)。分別對 7因素與人格5因子進(jìn)行雙向回歸分析發(fā)現(xiàn),7因素對大五的解釋度(0.3264±0.115)比大五對7因素的解釋度(0.2917±0.159)好。
在利用詞匯學(xué)方法建立微博人格預(yù)測模型的基礎(chǔ)上,我們利用深度學(xué)習(xí)建立網(wǎng)絡(luò)用戶行為和心理的向量化表征??紤]用戶在微博上一般都能夠充分自主地表達(dá)自我,通過對微博數(shù)據(jù)進(jìn)行深度學(xué)習(xí)和挖掘,可以直接在微博數(shù)據(jù)上建立更有效的表征向量,通過對微博數(shù)據(jù)的多層抽象學(xué)習(xí),建立對用戶行為和心理特征的計(jì)算描述,同時該結(jié)構(gòu)由于完全由數(shù)據(jù)計(jì)算得來,避免了由于用戶主觀符合度評判帶來的偏差,能夠?qū)崿F(xiàn)對大規(guī)模人群的快速分析。心理指標(biāo)的自動識別為進(jìn)一步研究網(wǎng)絡(luò)心理提供了基礎(chǔ)性研究,能更有效地進(jìn)行網(wǎng)絡(luò)用戶身份識別、預(yù)測用戶行為等。
02、在線主動自殺干預(yù)
據(jù)統(tǒng)計(jì),中國每年有 28.7 萬人死于自殺,200萬人自殺未遂,因此造成的直接和間接經(jīng)濟(jì)、社會、心理損失不可估量,成為一個嚴(yán)重的公共衛(wèi)生問題。傳統(tǒng)的自殺風(fēng)險(xiǎn)評估研究主要采用心理測驗(yàn)、訪談、問卷等分析方法,但從應(yīng)用效果上說,以上方法具有較大的被動性;往往有自殺企圖或傾向的人主動求助率低,而且很難防止他們刻意隱藏內(nèi)心的真實(shí)想法,難以起到及時預(yù)警的作用。
不同于傳統(tǒng)研究方法的被動性,隨著近年來越來越多的社交網(wǎng)絡(luò)平臺給人們更多機(jī)會在虛擬集群中吐露自己的感受和觀點(diǎn),通過社交網(wǎng)絡(luò)能主動尋找有潛在自殺傾向的個體,并對他們產(chǎn)生影響。
在新浪微博用戶文本分析基礎(chǔ)上,結(jié)合用戶行為數(shù)據(jù)分析,我們?nèi)姹容^了自殺用戶和無自殺傾向用戶在社交行為、語言使用上的差別,歸納有自殺傾向的用戶的可識別模式,建立自殺意念識別模型。該模型的精確率、召回率、F值和準(zhǔn)確率分別為 0.88、0.85、0.85 和 0.86,優(yōu)于之前相同領(lǐng)域內(nèi)自殺識別的模型的結(jié)果。目前,本研究組通過對各種網(wǎng)絡(luò)媒介內(nèi)容的實(shí)時分析,甄別出其中帶有自殺意念的發(fā)言,并通過對發(fā)言用戶的以往行為和內(nèi)容的分析,更進(jìn)一步確認(rèn)該用戶的自殺意念后,會向他們提供及時有效的干預(yù),通過微博私信及時推送各地區(qū)的自殺干預(yù)熱線,提供心理健康的一般常識及情緒調(diào)節(jié)策略。另外,通過志愿者為那些有自殺意念的微博用戶提供免費(fèi)的心理危機(jī)干預(yù)及轉(zhuǎn)介服務(wù)。研究結(jié)果表明,通過與志愿者的交流,有自殺意念的微博用戶情況得到好轉(zhuǎn)。
這種自動識別并主動預(yù)防社交媒體用戶,特別是年輕人的自殺干預(yù)方法,在世界范圍內(nèi)是一種全新的嘗試。結(jié)果表明,該方法可用于識別有自殺風(fēng)險(xiǎn)的人群并提供危機(jī)管理。高危人群的識別是自動且及時的,干預(yù)不僅是主動的,而且效率高且接受度好,是對現(xiàn)有預(yù)防自殺方法的有效補(bǔ)充。促進(jìn)主動自殺危機(jī)管理可以提高公眾對自殺想法尋求幫助的認(rèn)識,從而改善公共衛(wèi)生。該模式還可以緩解像中國這樣的大型發(fā)展中國家心理服務(wù)薄弱、現(xiàn)有自殺預(yù)防系統(tǒng)不完善、人口龐大等問題的困境。
03、青島大蝦事件分析
心理預(yù)測模型不僅可以適用于人格、心理健康等方面的研究,同樣可以適用于社會心理心態(tài)的預(yù)測。我們利用心理預(yù)測模型對2015年10月的一個熱點(diǎn)事件——青島大蝦宰客事件(原本 38 元一份的海捕大蝦,結(jié)賬時變成38元一只)進(jìn)行了分析。
通過新浪微博API (applicaTIon programming interface,應(yīng)用程序編程接口)獲取了全國100萬活躍微博用戶在該熱點(diǎn)事件期間發(fā)布的微博,并采用topic model 文本挖掘技術(shù)對相關(guān)文本進(jìn)行了分析。結(jié)果表明,事件爆發(fā)后2天,網(wǎng)友主要是對該事件本身進(jìn)行討論,從第3天開始,網(wǎng)友開始將事件發(fā)散,關(guān)注點(diǎn)已經(jīng)不在青島大蝦這一事件本身,而是以“段子”的形式討論不同地區(qū)旅游景點(diǎn)宰客的普遍現(xiàn)象,通過講述自己的親身經(jīng)歷或聽說的類似事件,表達(dá)對景點(diǎn)宰客這一現(xiàn)象的不滿。同時,結(jié)果表明,網(wǎng)友們對官方發(fā)布和回應(yīng)的內(nèi)容都高度關(guān)注,每次都會引發(fā)熱議。同時利用心理預(yù)測模型,計(jì)算了參與青島大蝦事件的用戶的社會態(tài)度,其中包括生活滿意度、收入滿意度、社會地位滿意度、憤怒情緒、國家政府滿意度、地方政府信心、國家經(jīng)濟(jì)滿意度、地方經(jīng)濟(jì)滿意度等多個維度。結(jié)果表明,與沒有參與該話題討論的微博用戶相比,該事件當(dāng)中的積極傳播者大多收入較高,有一定的社會地位,個人生活滿意較高同時憤怒情緒也較少;但他們也認(rèn)為社會發(fā)展中還存在一定問題,當(dāng)前政府的管理工作還有待提高。
通過利用心理預(yù)測模型分析此類事件,不僅可以及時獲取事件發(fā)生變化趨勢,了解事件背后大眾的心理變化和態(tài)度取向,更可以為國家相關(guān)機(jī)構(gòu)進(jìn)行輿情監(jiān)控提供先行指數(shù)(antecedent index),提高相關(guān)部門應(yīng)對危機(jī)事件的能力。
04、造福社會與隱私保護(hù)的均衡
技術(shù)往往都具有兩面性,大數(shù)據(jù)也不例外。一方面,大數(shù)據(jù)的應(yīng)用不僅拓展了人類的認(rèn)知范圍,提高了科學(xué)家們的研究能力,更為諸如抑郁干預(yù)、自殺預(yù)防、社會熱點(diǎn)事件分析等問題提供了新的解決方案;另一方面,隨之而來的隱私保護(hù)問題也不容小覷。Facebook 公司最近兩年頻頻卷入非法使用用戶數(shù)據(jù)的丑聞當(dāng)中,尤其在2018年3月份,還卷入了普朗特選舉的政治風(fēng)波中。人們在享受互聯(lián)網(wǎng)以及大數(shù)據(jù)代表的便利之余,也會擔(dān)心在這個網(wǎng)絡(luò)時代,自己是否還有隱私可言。因噎廢食是絕對不可取的,如何在勢不可擋的大數(shù)據(jù)時代利用好這項(xiàng)技術(shù),是學(xué)術(shù)界不可忽視的一項(xiàng)重要議題。
目前,學(xué)術(shù)界關(guān)于大數(shù)據(jù)的使用一般有這樣的共識:應(yīng)當(dāng)遵守人類被試研究的一般倫理原則,在使用需要用戶授權(quán)的數(shù)據(jù)前,必須征得用戶的知情同意,并嚴(yán)格按照經(jīng)由倫理委員會審核批準(zhǔn)的程序進(jìn)行,尤其不能將研究數(shù)據(jù)用于倫理委員會批準(zhǔn)范圍之外的目的(如轉(zhuǎn)賣給第三方)。在使用那些開放的無需用戶授權(quán)的網(wǎng)絡(luò)數(shù)據(jù),在用于科研時也應(yīng)同時滿足以下標(biāo)準(zhǔn):(1)用戶對數(shù)據(jù)公開是知情的;(2)數(shù)據(jù)收集后應(yīng)匿名處理;(3)在公開發(fā)表物中不得出現(xiàn)能夠識別用戶個人身份的信息。
在將大數(shù)據(jù)應(yīng)用于心理學(xué)研究的過程中,我們嚴(yán)格遵循一般共識:在獲取用戶個體數(shù)據(jù)之前,首先會征得用戶的知情同意,明確告知用戶實(shí)驗(yàn)設(shè)計(jì)以及以后的數(shù)據(jù)用途;在數(shù)據(jù)處理過程中,也采用了匿名處理的方式,一方面采用多次加密的方式保護(hù)用戶原始數(shù)據(jù)的隱私性,另一方面也最大程度地做好數(shù)據(jù)的保存與管理,防止數(shù)據(jù)外泄;在數(shù)據(jù)發(fā)表過程中,杜絕使用任何可識別出用戶身份信息的內(nèi)容。除了以上策略外,我們還專門對典型用戶進(jìn)行了訪談,直接詢問他們對隱私以及對實(shí)驗(yàn)的看法,之后的實(shí)驗(yàn)設(shè)計(jì)提供了理論指導(dǎo)和實(shí)證證據(jù)。
合理合規(guī)地使用大數(shù)據(jù)和人工智能技術(shù),是造福社會和保護(hù)隱私的重要底線。在看到這種結(jié)合對心理學(xué)的潛在促進(jìn)作用的同時,也應(yīng)該特別關(guān)注其帶來的隱私方面的潛在危害,通過立法等手段做到防患于未然。
05、結(jié)論
利用人工智能大數(shù)據(jù)技術(shù),能夠幫助我們以更生態(tài)化的方式對個體與群體的心理行為規(guī)律進(jìn)行研究。利用行為大數(shù)據(jù)研究人們的認(rèn)知、情感和行為規(guī)律,結(jié)合人工智能建立基于社會實(shí)時感知數(shù)據(jù)的心理預(yù)測模型,形成個體心理、行為特征預(yù)測和群體心理、行為分析及決策支持的關(guān)聯(lián)架構(gòu)。生態(tài)化識別(ecological recognition)的提出,為心理學(xué)家提供了新的研究工具和視角。為網(wǎng)絡(luò)時代下理解人格、幸福感、自殺干預(yù)乃至社會熱點(diǎn)事件的分析都提供了全新的可能。通過深入不同環(huán)境下的個體與群體的行為與心理,能夠幫助實(shí)現(xiàn)人們的心理健康或社會態(tài)度等進(jìn)行大規(guī)模、實(shí)時性的描述、預(yù)測、解釋和控制,從而有效防范風(fēng)險(xiǎn)。
隨著計(jì)算機(jī)軟硬件的不斷迭代更新,未來大數(shù)據(jù)在心理學(xué)中的應(yīng)用一定會更加深入,如可穿戴設(shè)備和體感設(shè)備的應(yīng)用。人工智能除了在心理實(shí)驗(yàn)方面有著無法取代的潛力,在其他方面也會大大拓展心理學(xué)的研究領(lǐng)域。隨著智能終端的不斷發(fā)展,移動數(shù)據(jù)的不斷提速,人工智能不僅可以提供心理干預(yù)的平臺,更有可能成為心理干預(yù)的主力??茖W(xué)的研究方法將心理學(xué)從哲學(xué)中分離開來,而人工智能和大數(shù)據(jù)則可能將心理學(xué)更深刻地帶入生活。在充分享受使用新技術(shù)帶來的便利的同時,也要保證大數(shù)據(jù)的合規(guī)使用,才能避免再次發(fā)生Facebook的丑聞事件,才能保證取之于眾的大數(shù)據(jù)最終成為為大眾服務(wù)的利器而不是威脅。