語音人工審查:谷歌、蘋果先后放棄 亞馬遜妥協(xié)
本周五,亞馬遜官方表示,將允許Alexa用戶選擇不再對他們的錄音進(jìn)行人工審查,新政策本周五正式生效。用戶可以通過Alexa智能手機(jī)應(yīng)用程序設(shè)置菜單中的選項(xiàng),允許用戶從由亞馬遜人工審核和分析的庫中刪除他們的錄音。
這是面對當(dāng)下用戶對個人隱私越來越注重、各國針對隱私推出越來越多隱私保護(hù)法案后,亞馬遜的妥協(xié)。面對用戶這樣的“拷問”,妥協(xié)的不只有亞馬遜,還有谷歌和蘋果。
亞馬遜交出“語音審核權(quán)”
據(jù)雷鋒網(wǎng)此前報(bào)道,今年4月彭博社曾披露,亞馬遜在全球擁有一支數(shù)千名員工的團(tuán)隊(duì),監(jiān)聽Echo使用者家中和辦公室等應(yīng)用場景中錄制的錄音,并通過將錄音轉(zhuǎn)錄、注釋,并反饋到軟件中,以消除Alexa對人類語言理解與實(shí)際語義的差距。
彭博社援引知情人士消息,該團(tuán)隊(duì)由承包商和全職亞馬遜員工組成,團(tuán)隊(duì)員工簽署了保密協(xié)議,禁止他們公開談?wù)撛撚?jì)劃。據(jù)亞馬遜布加勒斯特辦事處的兩名工作人員透露,他們每天工作9小時,每位評論員每班解析多達(dá)1000條音頻片段。
在彭博社爆料后,亞馬遜官方發(fā)表聲明,表示:
亞馬遜十分注重客戶的隱私安全。我們收集用戶對Alexa的指令,是為了更好地訓(xùn)練語言識別系統(tǒng)和自然語言處理系統(tǒng),以便于改善用戶體驗(yàn)。目前,亞馬遜已有嚴(yán)格的技術(shù)和措施來保護(hù)用戶的個人信息,即便是公司的員工也無權(quán)訪問。
雷鋒網(wǎng)了解到,此類數(shù)據(jù)收集行為在行業(yè)中屬于常態(tài),部分國內(nèi)廠商其實(shí)也會通過此類方法收集用戶信息,以提升智能語音助手的能力。與此同時,國內(nèi)大部分智能音箱都支持用戶創(chuàng)建訓(xùn)練計(jì)劃。
亞馬遜官方表示,Alexa應(yīng)用程序?qū)⒃谠O(shè)置菜單中包含免責(zé)聲明,確認(rèn)人們可以通過Alexa查看錄音。通過「設(shè)置—;—;Alexa隱私—;—;管理您的數(shù)據(jù)如何善Alexa的操作」操作步驟,關(guān)閉「幫助改善亞馬遜服務(wù)和開發(fā)新功能」選項(xiàng)。在這個頁面中,亞馬遜會提示用戶“啟用此設(shè)置后,您的錄音可用于開發(fā)新功能并進(jìn)行人工審核以幫助改進(jìn)我們的服務(wù)。手動審查只有極少部分的錄音?!?/p>
早在今年5月,在被曝出“監(jiān)聽門”后,亞馬遜官方曾對相關(guān)能力作出過調(diào)整,據(jù)當(dāng)時官方公布的信息顯示,亞馬遜為Alexa添加了新的隱私保護(hù)功能,允許Echo用戶通過“Alexa,刪除我今天所說的一切”、“Alexa,刪除我剛剛說的內(nèi)容”此類語音指令來刪除保存在亞馬遜服務(wù)器上的錄音。
此次,亞馬遜并沒有直接取消人工審核,而是將是否開啟人工審核的選擇權(quán)讓出,交到用戶手中。這樣的設(shè)置模式類似當(dāng)下部分國內(nèi)廠商設(shè)置的用戶訓(xùn)練計(jì)劃的模式。
顯然,之所以谷歌、蘋果、亞馬遜會妥協(xié),一方面是確保其產(chǎn)品、技術(shù)的影響力更深遠(yuǎn),覆蓋人群可以更廣闊,同時也是為了持續(xù)的品牌影響力。
谷歌、蘋果放棄人工審核
同樣在語音方面面臨人工審核遭控訴的不只亞馬遜一家,谷歌、蘋果此前也面臨同樣的困擾。
今年7月10日,外媒VRT NWS曝出荷蘭語和佛蘭芒語的谷歌語音助手存在監(jiān)聽用戶語音的事件。文中還提到,谷歌承認(rèn)它與世界各地的語言專家合作改進(jìn)語音技術(shù)。谷歌比利時發(fā)言人表示:“這是通過制作少量音頻文件的成績單來實(shí)現(xiàn)的”。他補(bǔ)充說:“這項(xiàng)工作對于開發(fā)支持谷歌智能語音助理等產(chǎn)品的技術(shù)至關(guān)重要。” 谷歌聲稱他們的語言專家只判斷“約占所有音頻片段的0.2%”。該公司補(bǔ)充道,這些與任何個人或可識別信息無關(guān)。
在谷歌的智能語音助手被曝出監(jiān)聽事件后,同樣是今年7月,英國《衛(wèi)報(bào)》曝出蘋果智能語音助手Siri涉嫌泄露用戶隱私一事,稱“蘋果公司的承包商經(jīng)常聽到機(jī)密的醫(yī)療信息、潛在毒品交易,以及不可描述的聲音,作為其工作的一部分,為蘋果的語音助手(Siri)提升服務(wù)質(zhì)量,例如請求是故意還是誤報(bào),是否意外觸發(fā)Siri,或者響應(yīng)是否有幫助”。報(bào)道中還提到,蘋果并沒有明確告知消費(fèi)者,一小部分錄音會被發(fā)送給承包商以改善Siri。
隨后,蘋果公司在回應(yīng)《衛(wèi)報(bào)》的官方聲明中稱,只有不到1%的Siri響應(yīng)會被分析以改善服務(wù)?!皟H有一小部分Siri請求會被分析用以改善Siri和聽寫。用戶請求與用戶的Apple ID并無關(guān)聯(lián)。Siri響應(yīng)會在安全的環(huán)境下進(jìn)行分析,所有審核人員都有義務(wù)遵守Apple嚴(yán)格的保密要求?!?/p>
蘋果公司特別強(qiáng)調(diào):被上傳的語音信息只是一個非常小的隨機(jī)子集,不到Siri日活的1%,用于評分,通常只有約幾秒鐘。
在谷歌和蘋果被曝出“監(jiān)聽門”后,雖然官方隨后均對此事作出了解釋,但是據(jù)據(jù)彭博社報(bào)道,德國隱私監(jiān)管機(jī)構(gòu)開始調(diào)查谷歌這一計(jì)劃后,谷歌決定停止人工審核;蘋果公司也在本周四對外表示,已經(jīng)暫停了對Siri查詢的人工審查,同時也表示,Siri還將在未來發(fā)布軟件更新,讓Siri的用戶選擇是否參與這一計(jì)劃。
大數(shù)據(jù)時代,數(shù)據(jù)更易獲取,隱私更難保證
大數(shù)據(jù)時代,隨著數(shù)字化進(jìn)程日益加快,人類生活的各類信息也逐漸被數(shù)字化,越來越多的數(shù)據(jù)被各類智能終端搜集,并集中到互聯(lián)網(wǎng)公司各地的數(shù)據(jù)中心中。正如最初進(jìn)入互聯(lián)網(wǎng)時代,大家都在擔(dān)心網(wǎng)絡(luò)安全問題一樣,大家現(xiàn)在也開始擔(dān)心個人數(shù)據(jù)、個人隱私安全問題。
這樣的擔(dān)心并非沒有道理,據(jù)包括雷鋒網(wǎng)此前報(bào)道,2017、2018年已經(jīng)出現(xiàn)過多起大型數(shù)據(jù)泄露問題,泄露的數(shù)據(jù)包括社交、酒店、企業(yè)等各個領(lǐng)域,涵蓋各類個人隱私、企業(yè)機(jī)密數(shù)據(jù)。
數(shù)據(jù)泄露似乎成為了當(dāng)下大家都在關(guān)心,卻難以避免的問題。而這樣的困局也將在相關(guān)法規(guī)、企業(yè)監(jiān)管、產(chǎn)業(yè)環(huán)境進(jìn)一步完善后,建立起大數(shù)據(jù)時代的規(guī)則和文明。