在谷歌I/O開發(fā)者大會召開的一個月后,谷歌召集了幾位記者在曼哈頓召開會議。對Google這家世界上最大的公司之一來說,這是一個不同尋常的地方。桌子被移出,為九把椅子騰出空間,共計三排,每排三座,面對著一個巨大的、明亮的顯示器。旁邊,四名谷歌員工坐在臨時控制中心的辦公桌后。Duplex在推出時曾引起廣泛討論與爭議,Google公司終于準(zhǔn)備好提供一種對Duplex更深入的解讀。
這家舒適的紐約餐廳對這類活動來說意義非凡,因為Google公司拉開了基于人工智能預(yù)訂服務(wù)的帷幕,餐廳的老板堅持認為,這樣的服務(wù)對于每天多達100多個預(yù)約的餐廳來說,真是天賜之物。對谷歌來說,顯然是時候為這一AI系統(tǒng)的設(shè)計目的和背后的運作方式提供更多的“透明度”了。
CEO桑達爾·皮查伊(Sundar Pichai)展示的簡短演示,引出的問題遠比其回答的要多。眾多觀點開始涌現(xiàn),探討了這一AI系統(tǒng)所能帶來的技術(shù)道德問題。Duplex AI系統(tǒng)可以實現(xiàn)逼真的擬人效果,讓企業(yè)相信其在和一個人說話。
“Duplex”代表著一個罕見的早期投射,主導(dǎo)這個正在進行中的項目的公司因似乎謹慎地策劃著什么行動卻隱藏自身意圖而聲名狼藉。然而,信息披露是關(guān)鍵。就像自動駕駛汽車一樣,需要嚴(yán)格的現(xiàn)實測試來消除系統(tǒng)中的所有問題。
谷歌公司今天在一篇博客文章中寫道:“雖然我們還沒有廣泛發(fā)布這一功能,但我們正在分享更多關(guān)于這項技術(shù)的信息,以提供透明度和鼓勵反饋,重要的是,我們要為員工和企業(yè)提供正確的體驗,而且我們正在采取一種緩慢而有分寸的方式,因為我們在測試中加入了學(xué)習(xí)和反饋。”
谷歌這一過程的性質(zhì)很可能會以某種方式出現(xiàn),因此I/O大會上的宣布有雙重目的,其一是為了讓自己站在這一敘述的前面,其二是在該公司最大的舞臺上呈現(xiàn)一個雄心勃勃的項目。皮查伊(Pichai)在主題演講中說:“你將聽到的是谷歌助理打給一家真正的美發(fā)沙龍店來進行預(yù)約。”
“嗨,我打電話來是為了預(yù)約一個女士理發(fā)項目。
嗯...我希望定在5月3日。”
——谷歌助理
“當(dāng)然,給我一秒鐘。”
——接待員
“嗯...嗯。”
——谷歌助理
在這里,觀眾們都笑了,起初難以置信。緊接著給予掌聲。我們很難相信,我們聽到的只是谷歌人工智能助手的一個純自動化版本。“嗯...嗯(mm-hm)”的語氣詞是錦上添花——這是一種微妙的聲音,透露出談話還在進行中以及帶有使談話更自然的延遲。
語言學(xué)中所謂的“言語障礙(speech disfluencies)”,是語言中正常的、常見的部分,也是使Duplex成為一種非凡產(chǎn)品的秘密武器的關(guān)鍵部分。除此之外,它們是系統(tǒng)的一種禮貌的變通方式。
例如,如果Duplex在要求為5人的派對預(yù)訂房間后面臨不確定的回應(yīng),那么它將會以微小的變化重申:“嗯,5個。”這能解決接線人員的潛在困惑,同時也將一種微妙的語言標(biāo)記包含在內(nèi),為談話提供了進一步的真實感。
這些元素是Duplex工作中的一個非常真實的部分。至于在大屏幕上播放的兩個演示,實際上,它們是真實的。更有趣的是,該公司表示,在電話發(fā)出后,它通知了企業(yè),似乎為這一過程提供了額外的真實性。
目前,“Duplex”仍然是一項正在進行中的項目。此外,該系統(tǒng)還沒有在早期提供信息披露,這一事實可能違反了在康涅狄格州、佛羅里達州、伊利諾斯州、馬里蘭州、馬薩諸塞州、蒙大拿州、新罕布什爾州、賓夕法尼亞州、華盛頓州和谷歌所在的加州總部等地記錄電話和通話的“雙方同意(two-party consent)”規(guī)定。
新聞自由記者委員會技術(shù)與新聞自由項目主管Gabe Rottman說:“在這里,從一開始到現(xiàn)在的問題,不僅僅是Duplex的問題,還涉及到機器語音的更廣泛的法律意義。”如果這項服務(wù)擴展到所有方的同意狀態(tài),或者在全球范圍內(nèi),你可以看到問題出現(xiàn),比如,如果你不知道來電者是一臺機器,同意是否有效。像這樣的難題將會成倍地增加我們進入恐怖谷的次數(shù),在那里,自動語音可以作為人類語音傳遞。”
展望未來,該系統(tǒng)將局限于那些法律使其可行的州。這也適用于州際電話,只要雙方都能被覆蓋。谷歌助理副總裁尼克·??怂?Nick Fox)說:“我們想要確保它的運作方式受法律規(guī)定的約束。”盡管披露的信息還沒有出現(xiàn),但該公司從一開始就表示打算將這些信息添加進去。然而,這種動機并不是因為法律后果,而是常見的機器人/人類禮儀。
谷歌公司在一篇博文中寫道:“谷歌Duplex技術(shù)的建立的目的是為了讓對話聽起來自然,讓對話的體驗感達到舒適。”“對我們來說,用戶和企業(yè)對這項服務(wù)有良好的體驗,這一點很重要,而‘透明度’是其中的關(guān)鍵部分。我們想要清楚地了解通話的意圖,以便企業(yè)了解上下文。我們將在未來幾個月里試驗正確的方法。”
在媒體的追問下,這種“透明度”最終將會是什么形式,Google公司的一位發(fā)言人后來補充說,“我們理解并重視圍繞谷歌Duplex的討論——就像我們從一開始就說過的那樣,技術(shù)的透明度很重要。”我們正在設(shè)計這一功能,并內(nèi)置了信息披露功能,我們將確保系統(tǒng)被正確識別。我們在I/O大會上展示的是一個早期的技術(shù)演示,我們期待著在開發(fā)產(chǎn)品的過程中加入反饋。”
從目前的形式看,這是很有意義的:
“嗨,我是谷歌助理,打電話來給客戶做一個預(yù)約。”這個自動調(diào)用將被記錄。
“Duplex”并沒有透露它是人工智能的事實——但如果你對谷歌助理有一定的了解,你就可以把這部分整合到一起。但是,它確實讓你知道電話正在被記錄。谷歌將這些對話記錄下來,用于文本處理和質(zhì)量保證目的,因此谷歌公司可以繼續(xù)修改和完善系統(tǒng)。
在我的測試電話中,我試圖讓Google助理重復(fù)這一段——很容易就能聽到這句開場白,尤其是當(dāng)你把手機放在一個擁擠的餐廳里時。但是人工智能只是在預(yù)定的情況下繼續(xù)使用。如果你錯過了信息披露,你就沒那么幸運了——至少現(xiàn)在是這樣。目前,選擇不被記錄的唯一方法就是掛斷電話——這顯然不是獲得回頭客的最佳方式。
谷歌助理副總裁Scott Huffman解釋說:“我們確實有一種機制,它會說‘好吧,我不會記錄你的語音’。我認為我們?nèi)栽诟闱宄谶@里做什么是正確的。退出是正確的嗎?基本上把錄音去除?”就像其他所有人在那天做演示一樣,我盡我最大的努力把這個系統(tǒng)關(guān)掉。助理要求預(yù)訂在下午6點。我告訴它我們要到11點才開門——這是曼哈頓。助手禮貌地結(jié)束電話——或者像谷歌所說的“退出”。
這里“努力想得到卻永遠無法獲取的”是試圖用圖靈測試從Duplex找出欺騙之處。如果你成功了,谷歌的一個人工操作員將會采取相應(yīng)的控制。這些人工操作人員是Duplex測試的一個重要組成部分,谷歌表示,他們計劃以某種形式將其保留在未來,以確保事情永遠不會失控。最終將會有多大的群體還有待觀察。
在我們的簡短聊天中,我們的小組中沒有人成功地調(diào)用了一個真實的人,盡管我們對系統(tǒng)的局限性有一些重要的見解。例如,當(dāng)被要求“重復(fù)最后四個數(shù)字”時,它會完整地重述電話號碼。這并不是一個缺陷,但它確實顯示了一個簡單的地方,即系統(tǒng)在理解人類對話微妙的細微差別時,被推到了它的極限。
另一方面,當(dāng)被問及用戶的電子郵件地址時,系統(tǒng)只是簡單地說,它沒有獲得“客戶”的許可來公開這些信息,以此來維護整個“助理”關(guān)系。谷歌表示,在測試中,該系統(tǒng)也會因使用電話樹(交互語音應(yīng)答系統(tǒng))而遇到另一臺機器。仔細地聽,因為我們的菜單選項已經(jīng)改變了,現(xiàn)在還沒有計算出來。
目前,谷歌表示,Duplex能夠完成五項完全自動化的任務(wù)。百分之八十是相當(dāng)不錯的,但是Google正在努力使事情變得更好。“我們希望確保我們不會浪費公司的時間,”??怂拐f。“我們想要確保我們在這里所做的每一件事,這對企業(yè)來說是一種很好的體驗,而且當(dāng)他們試圖經(jīng)營自己的業(yè)務(wù)與助理交談時,他們不會感到沮喪。”
正如在/O大會中所宣布的,更多的測試將在今年夏天開始。而在“未來幾周”,下一輪將會是助理展開對營業(yè)時間的詢問。在接下來的幾個月里,它將擴展到餐廳預(yù)訂和美發(fā)沙龍的預(yù)約。與在I/O大會上的演示不同的是,將會出現(xiàn)“一組有限的受信任的測試人員和選擇的企業(yè)”,他們將會參與其中。
到目前為止,企業(yè)似乎都渴望加入。正如谷歌在今年4月進行的一項客戶調(diào)查所顯示的,“60%依賴客戶預(yù)訂的小企業(yè)沒有建立在線預(yù)訂系統(tǒng)。”
對于那些不想接電話的用戶來說,Duplex提供了一個令人信服的替代方案。對于這些企業(yè)來說,這意味著增加更多的潛在客戶。另一方面,那些因為各種原因而不愿加入的人,將能夠通過他們的谷歌商業(yè)清單(假設(shè)他們有一個)而選擇退出。如果你使用,客戶可以用谷歌助手預(yù)訂。另外,通過偶爾調(diào)用來確認你的詳細信息,以快速更新你的清單。
谷歌的負責(zé)人介紹,自從Duplex開始成為一款臨時拼湊的演示程序(在MacBook上小心翼翼地放置了一款辦公電話)以來,這個系統(tǒng)已經(jīng)走過了很長一段路。Duplex是通過語音到文本、文本到語音的復(fù)雜組合和谷歌自己的WaveNet音頻處理深層神經(jīng)網(wǎng)絡(luò)來運作的。早期的演示并沒有像一些人猜測的那樣存在,但實際上它們是真實的——而且事情只會變得更令人印象深刻。
不管你喜不喜歡,Duplex很快就要來了,唯一能阻止它的辦法就是掛斷電話。