123,123,123

[導(dǎo)讀]2018年，谷歌展示了令人印象深刻的Duplex技術(shù)，這是一種經(jīng)過訓(xùn)練的AI語音系統(tǒng)，可以撥打簡短電話和進(jìn)行預(yù)約。Duplex可以像人類一樣說話，并使用“嗯”和“哦”等停頓詞，它可以成功地參與真實(shí)對話，幫助預(yù)訂晚餐和理發(fā)。六年過去了，為什么我們還做不到讓自己的機(jī)器人能跟其他機(jī)器人打電話，而自己永遠(yuǎn)不需要親自打呢？

2018年，谷歌展示了令人印象深刻的Duplex技術(shù)，這是一種經(jīng)過訓(xùn)練的AI語音系統(tǒng)，可以撥打簡短電話和進(jìn)行預(yù)約。Duplex可以像人類一樣說話，并使用“嗯”和“哦”等停頓詞，它可以成功地參與真實(shí)對話，幫助預(yù)訂晚餐和理發(fā)。六年過去了，為什么我們還做不到讓自己的機(jī)器人能跟其他機(jī)器人打電話，而自己永遠(yuǎn)不需要親自打呢？

很簡單，部分原因是我們無法區(qū)分有用的機(jī)器人電話和垃圾機(jī)器人電話，[1]企業(yè)甚至可以選擇完全不接聽Duplex電話。因此，Duplex仍然是一個偶爾有用但很小眾的功能，就像谷歌的“Hold for Me”功能一樣，它可以幫你排隊(duì)等待接聽，讓你不用一直聽循環(huán)的電話鈴聲。

隨著AI的迅速崛起以及它的能力提升，那些討厭打電話的人迫切希望有AI個人助理來幫助承擔(dān)這份工作。AI個人助理不再只是奢侈品，它應(yīng)該能夠管理我們的收件箱、日歷和電話，同時向我們轉(zhuǎn)達(dá)執(zhí)行摘要。雖然某些AI應(yīng)用確實(shí)能為我們過濾噪音，但功能齊全的個人助理還不太可能取代目前低技術(shù)含量的工作。

眼球經(jīng)濟(jì)

你的注意力是網(wǎng)絡(luò)經(jīng)濟(jì)中最寶貴的資源。你在網(wǎng)上看到的一切都經(jīng)過了嚴(yán)格的A/B測試，以盡可能地吸引人，甚至具體到鏈接和通知的顏色。 2009年，谷歌上了頭條新聞，當(dāng)時設(shè)計(jì)師測試了41種藍(lán)色，以確定哪種顏色最容易被點(diǎn)擊。

這只是在學(xué)習(xí)如何吸引用戶注意力方面投入巨資的一個例子。收件箱、新聞源、社交媒體信源、電視和傳統(tǒng)的紙質(zhì)新聞，我們唾手可得的信息廣度令人難以置信，它們都在爭奪你的注意力。但是廣度有了，深度卻沒了。

信息來源越多，我們就越難關(guān)注某個特定的信息來源。我們不難發(fā)現(xiàn)，互聯(lián)網(wǎng)加速了這一現(xiàn)象的發(fā)展 - 現(xiàn)在我們可以在新聞播報(bào)時查看社交媒體，也可以在開會時查看電子郵件?！叭褙炞ⅰ币殉蔀檫^去式。

利用AI過濾信息

AI助手似乎已經(jīng)準(zhǔn)備就緒 -語言模型可以在眨眼間處理好信息。在線搜索方面已經(jīng)有了不錯的用例，比如谷歌一直致力于“零點(diǎn)擊”搜索，用算法確定你要找的答案，并顯示相關(guān)片段，而不需要你點(diǎn)擊進(jìn)入網(wǎng)站（圖1）。這種搜索似乎也正在流行。據(jù)搜索引擎優(yōu)化工具SEMRush測算，超過一半的搜索都是零點(diǎn)擊。[2]

圖1：借助“零點(diǎn)擊”搜索，無需訪問其他網(wǎng)頁即可快速獲得信息（圖源：作者）

零點(diǎn)擊搜索讓你在電腦或手機(jī)上的搜索速度更快，而且還能提供語音搜索結(jié)果。雖然“今天天氣如何？”之類的短句有助于快速搜索，但像食譜這樣的長篇搜索結(jié)果仍然需要我們點(diǎn)擊查看。而這正是AI的優(yōu)勢所在。圖2顯示了給谷歌和ChatGPT提供相同提示：“土豆湯菜譜”，所得到的不同結(jié)果。

圖2：谷歌和ChatGPT的菜譜搜索結(jié)果對比（圖源：作者）

谷歌給了我四個幾乎相同的結(jié)果，讓我選擇一個，然后我還要在cookie彈出窗口、電子郵件通知彈出窗口和橫幅廣告中尋找關(guān)鍵的“跳轉(zhuǎn)到菜譜 ”按鈕。搜索結(jié)果離真正的食譜還有幾步之遙。

而ChatGPT則是立即給我提供了一份菜譜。而且，我還可以要求ChatGPT將菜譜用料翻倍，增加辣度或替換配料。我甚至可以要求它按照我最喜歡的電視廚師的風(fēng)格給我菜譜（圖3）。

圖3：大型語言模型 (LLM) 可生成的創(chuàng)新類型示例。（圖源：作者）

超越菜譜搜索的挑戰(zhàn)

生成式AI讓我們有機(jī)會從根本上改變從互聯(lián)網(wǎng)獲取信息的方式。我們可以使用一個元應(yīng)用程序 (meta-app)，對自己個人關(guān)注的信息做一個執(zhí)行摘要，而不必每天穿梭于十多個新聞和社交媒體應(yīng)用程序來了解最新信息。就像一個你可以與之對話的RSS源，對你說：“早上好。您當(dāng)?shù)氐谋｝g球隊(duì)已晉級地區(qū)冠軍賽，本周市議會將就一項(xiàng)與您相關(guān)的法案召開會議。穿上外套吧，今天很冷”。

遺憾的是，我們離真正的AI個人助理還很遙遠(yuǎn)。有數(shù)十家供應(yīng)商提供AI“個人助理”，但大多數(shù)只能作為聊天機(jī)器人使用。應(yīng)用程序和社交媒體網(wǎng)站更希望你親自體驗(yàn)它們的服務(wù)，而不是派你的AI代理過去。它們是從人類用戶身上賺錢，而不是從訪問它們API的自動程序上賺錢。當(dāng)發(fā)現(xiàn)像ChatGPT這樣的大型語言模型（LLM）可以自由地使用公開內(nèi)容進(jìn)行自我訓(xùn)練時，社交媒體巨頭和獨(dú)立創(chuàng)作者們在他們的內(nèi)容周圍筑起了虛擬圍墻。[3]

在用戶方面，對數(shù)據(jù)隱私的擔(dān)憂也阻礙了AI個人助理的發(fā)展。在GDPR等數(shù)據(jù)隱私法規(guī)出臺后，應(yīng)用程序之間共享數(shù)據(jù)變得越來越困難。這對用戶來說是件好事，但也意味著我們不太可能看到一款能與我們的收件箱、日歷、新聞源和社交媒體信源對接的程序。我們的左手經(jīng)常不知道右手在做什么，而讓我們的數(shù)字足跡保持碎片化也有一定的安全性。分散使用多個應(yīng)用程序，可以防止單一漏洞竊取所有信息。

出人意料的低科技含量解決方案

收件箱會自動識別重要郵件并將日期添加到我們的日歷中，新聞源會根據(jù)我們的興趣定制，但現(xiàn)在，沒有任何東西能將這一切捆綁在一起。許多人通過一個簡單的模擬解決方案來解決數(shù)字信息碎片化的問題：紙質(zhì)計(jì)劃表（圖4）。紙質(zhì)計(jì)劃表讓忙碌的人們能將多種來源的信息整合成單一的真相來源。而且紙質(zhì)計(jì)劃表還帶貼紙！

圖4：將待辦事宜從清單上劃掉會更有成就感（圖源：Andrey Popov / stock.adobe.com）

雖然生成式AI為改變我們的搜索方式提供了令人興奮的機(jī)會，但個人和現(xiàn)實(shí)的局限性還是限制了AI個人助理的實(shí)際潛力。在科技界推出比簡陋的紙質(zhì)計(jì)劃表更全面的解決方案之前，AI個人助理仍將是一個幻想。我們現(xiàn)在只能繼續(xù)自己安排約會了。

作者簡介