2018年,谷歌展示了令人印象深刻的Duplex技術(shù),這是一種經(jīng)過訓(xùn)練的AI語音系統(tǒng),可以撥打簡短電話和進(jìn)行預(yù)約。Duplex可以像人類一樣說話,并使用“嗯”和“哦”等停頓詞,它可以成功地參與真實(shí)對話,幫助預(yù)訂晚餐和理發(fā)。六年過去了,為什么我們還做不到讓自己的機(jī)器人能跟其他機(jī)器人打電話,而自己永遠(yuǎn)不需要親自打呢?
很簡單,部分原因是我們無法區(qū)分有用的機(jī)器人電話和垃圾機(jī)器人電話,[1]企業(yè)甚至可以選擇完全不接聽Duplex電話。因此,Duplex仍然是一個偶爾有用但很小眾的功能,就像谷歌的“Hold for Me”功能一樣,它可以幫你排隊(duì)等待接聽,讓你不用一直聽循環(huán)的電話鈴聲。
隨著AI的迅速崛起以及它的能力提升,那些討厭打電話的人迫切希望有AI個人助理來幫助承擔(dān)這份工作。AI個人助理不再只是奢侈品,它應(yīng)該能夠管理我們的收件箱、日歷和電話,同時向我們轉(zhuǎn)達(dá)執(zhí)行摘要。 雖然某些AI應(yīng)用確實(shí)能為我們過濾噪音,但功能齊全的個人助理還不太可能取代目前低技術(shù)含量的工作。
眼球經(jīng)濟(jì)
你的注意力是網(wǎng)絡(luò)經(jīng)濟(jì)中最寶貴的資源。你在網(wǎng)上看到的一切都經(jīng)過了嚴(yán)格的A/B測試,以盡可能地吸引人,甚至具體到鏈接和通知的顏色。 2009年,谷歌上了頭條新聞,當(dāng)時設(shè)計(jì)師測試了41種藍(lán)色,以確定哪種顏色最容易被點(diǎn)擊。
這只是在學(xué)習(xí)如何吸引用戶注意力方面投入巨資的一個例子。收件箱、新聞源、社交媒體信源、電視和傳統(tǒng)的紙質(zhì)新聞,我們唾手可得的信息廣度令人難以置信,它們都在爭奪你的注意力。但是廣度有了,深度卻沒了。
信息來源越多,我們就越難關(guān)注某個特定的信息來源。我們不難發(fā)現(xiàn),互聯(lián)網(wǎng)加速了這一現(xiàn)象的發(fā)展 - 現(xiàn)在我們可以在新聞播報(bào)時查看社交媒體,也可以在開會時查看電子郵件?!叭褙炞ⅰ币殉蔀檫^去式。
利用AI過濾信息
AI助手似乎已經(jīng)準(zhǔn)備就緒 -語言模型可以在眨眼間處理好信息。在線搜索方面已經(jīng)有了不錯的用例,比如谷歌一直致力于“零點(diǎn)擊”搜索,用算法確定你要找的答案,并顯示相關(guān)片段,而不需要你點(diǎn)擊進(jìn)入網(wǎng)站(圖1)。這種搜索似乎也正在流行。據(jù)搜索引擎優(yōu)化工具SEMRush測算,超過一半的搜索都是零點(diǎn)擊。[2]
圖1:借助“零點(diǎn)擊”搜索,無需訪問其他網(wǎng)頁即可快速獲得信息(圖源:作者)
零點(diǎn)擊搜索讓你在電腦或手機(jī)上的搜索速度更快,而且還能提供語音搜索結(jié)果。雖然“今天天氣如何?”之類的短句有助于快速搜索,但像食譜這樣的長篇搜索結(jié)果仍然需要我們點(diǎn)擊查看。而這正是AI的優(yōu)勢所在。圖2顯示了給谷歌和ChatGPT提供相同提示:“土豆湯菜譜”,所得到的不同結(jié)果。
圖2:谷歌和ChatGPT的菜譜搜索結(jié)果對比(圖源:作者)
谷歌給了我四個幾乎相同的結(jié)果,讓我選擇一個,然后我還要在cookie彈出窗口、電子郵件通知彈出窗口和橫幅廣告中尋找關(guān)鍵的“跳轉(zhuǎn)到菜譜 ”按鈕。搜索結(jié)果離真正的食譜還有幾步之遙。
而ChatGPT則是立即給我提供了一份菜譜。而且,我還可以要求ChatGPT將菜譜用料翻倍,增加辣度或替換配料。我甚至可以要求它按照我最喜歡的電視廚師的風(fēng)格給我菜譜(圖3)。
圖3:大型語言模型 (LLM) 可生成的創(chuàng)新類型示例。(圖源:作者)
超越菜譜搜索的挑戰(zhàn)
生成式AI讓我們有機(jī)會從根本上改變從互聯(lián)網(wǎng)獲取信息的方式。我們可以使用一個元應(yīng)用程序 (meta-app),對自己個人關(guān)注的信息做一個執(zhí)行摘要,而不必每天穿梭于十多個新聞和社交媒體應(yīng)用程序來了解最新信息。就像一個你可以與之對話的RSS源,對你說:“早上好。您當(dāng)?shù)氐谋}g球隊(duì)已晉級地區(qū)冠軍賽,本周市議會將就一項(xiàng)與您相關(guān)的法案召開會議。穿上外套吧,今天很冷”。
遺憾的是,我們離真正的AI個人助理還很遙遠(yuǎn)。有數(shù)十家供應(yīng)商提供AI“個人助理”,但大多數(shù)只能作為聊天機(jī)器人使用。應(yīng)用程序和社交媒體網(wǎng)站更希望你親自體驗(yàn)它們的服務(wù),而不是派你的AI代理過去。它們是從人類用戶身上賺錢,而不是從訪問它們API的自動程序上賺錢。當(dāng)發(fā)現(xiàn)像ChatGPT這樣的大型語言模型(LLM)可以自由地使用公開內(nèi)容進(jìn)行自我訓(xùn)練時,社交媒體巨頭和獨(dú)立創(chuàng)作者們在他們的內(nèi)容周圍筑起了虛擬圍墻。[3]
在用戶方面,對數(shù)據(jù)隱私的擔(dān)憂也阻礙了AI個人助理的發(fā)展。在GDPR等數(shù)據(jù)隱私法規(guī)出臺后,應(yīng)用程序之間共享數(shù)據(jù)變得越來越困難。這對用戶來說是件好事,但也意味著我們不太可能看到一款能與我們的收件箱、日歷、新聞源和社交媒體信源對接的程序。我們的左手經(jīng)常不知道右手在做什么,而讓我們的數(shù)字足跡保持碎片化也有一定的安全性。分散使用多個應(yīng)用程序,可以防止單一漏洞竊取所有信息。
出人意料的低科技含量解決方案
收件箱會自動識別重要郵件并將日期添加到我們的日歷中,新聞源會根據(jù)我們的興趣定制,但現(xiàn)在,沒有任何東西能將這一切捆綁在一起。許多人通過一個簡單的模擬解決方案來解決數(shù)字信息碎片化的問題:紙質(zhì)計(jì)劃表(圖4)。紙質(zhì)計(jì)劃表讓忙碌的人們能將多種來源的信息整合成單一的真相來源。而且紙質(zhì)計(jì)劃表還帶貼紙!
圖4:將待辦事宜從清單上劃掉會更有成就感(圖源:Andrey Popov / stock.adobe.com)
雖然生成式AI為改變我們的搜索方式提供了令人興奮的機(jī)會,但個人和現(xiàn)實(shí)的局限性還是限制了AI個人助理的實(shí)際潛力。在科技界推出比簡陋的紙質(zhì)計(jì)劃表更全面的解決方案之前,AI個人助理仍將是一個幻想。我們現(xiàn)在只能繼續(xù)自己安排約會了。
作者簡介
Matt Campbell是貿(mào)澤電子的技術(shù)文章作者。在攻讀電氣工程學(xué)位期間,Matt意識到自己擅長文字表達(dá)更勝于解微積分,因而在其職業(yè)生涯中始終致力于探索尖端技術(shù)背后的故事。工作之余,他喜歡聽音樂會、參與戶外活動、收集舊物和拍攝日落。