谷歌語(yǔ)音助手副總裁講述開(kāi)發(fā)故事,挑戰(zhàn)Alexa不容易
谷歌工程師斯科特·哈夫曼(Scott Huffman)在550英尺的高空俯視拉斯維加斯的天際線。那是一月初一個(gè)陽(yáng)光明媚的下午,而谷歌來(lái)這兒是為了在世界最大的技術(shù)展覽會(huì)——消費(fèi)電子產(chǎn)品大展(CES)上打響營(yíng)銷(xiāo)閃電戰(zhàn)——吹捧谷歌助手,一款可以控制智能恒溫器、獲取用戶(hù)航班信息和閱讀頭條新聞的數(shù)字軟件。
這款智能助手的工程副總裁哈夫曼正同我站在豪客摩天輪上一個(gè)巨大的玻璃球里。這是罪惡之城版的倫敦眼觀光艙,而我們剛剛到達(dá)了摩天輪的頂點(diǎn)。往下看,可以看到谷歌助手的喚醒語(yǔ)“Hey, Google”,巨大的字母貼在拉斯維加斯會(huì)議中心大樓上。這句話的一部分被另一建筑物的戶(hù)外框架擋住了,使標(biāo)語(yǔ)看起來(lái)像是在說(shuō)“Hey, Go”。
談及智能助手,對(duì)于谷歌來(lái)說(shuō)“Go”似乎是其堅(jiān)定不移的理念,進(jìn)而,這也是個(gè)合適的標(biāo)語(yǔ)。自從三年前谷歌首席執(zhí)行官桑德?tīng)枴てげ橐粒⊿undar Pichai)發(fā)布了該軟件以來(lái),這家搜索巨頭就一直致力于追趕亞馬遜的智能助理Alexa。2014年Alexa擊敗谷歌進(jìn)入市場(chǎng),現(xiàn)在,已是一個(gè)家喻戶(hù)曉的名字。許多人認(rèn)為這是谷歌才做得出來(lái)的產(chǎn)品,并且谷歌的宗旨又是賦予互聯(lián)網(wǎng)搜索與使用之功能。
谷歌要想取得勝利,還得加把勁
研究公司eMarketer的數(shù)據(jù)顯示,亞馬遜旗下由Alexa支持的Echo設(shè)備擁有智能語(yǔ)音助手市場(chǎng)將近70%。而運(yùn)作谷歌助手的Google Home Devices只占據(jù)不到四分之一的市場(chǎng)份額。另一家研究公司Canalys預(yù)測(cè),到2023年,谷歌可能會(huì)從亞馬遜手上奪走皇冠。
哈夫曼稱(chēng),“如果搶不到市場(chǎng)份額,谷歌助手就沒(méi)用了。因此在過(guò)去幾年里,我們花了很多精力研發(fā)改良Assistant?!?/p>
倘若詢(xún)問(wèn)大多數(shù)人他們用Assistant或Alexa做什么,他們也許會(huì)說(shuō),語(yǔ)音助手非常適合播放歌曲、設(shè)置廚房計(jì)時(shí)器,連接到智能設(shè)備開(kāi)燈關(guān)燈。這些很好,但谷歌想要實(shí)現(xiàn)更多的功能來(lái)打敗亞馬遜。過(guò)去一年,谷歌和Assistant的發(fā)展軌跡一直處于科幻小說(shuō)的水平。從現(xiàn)在開(kāi)始,谷歌只會(huì)越來(lái)越有抱負(fù)。
谷歌憑借其核心的機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和人工智能,雄心勃勃地引入了新功能,即Duplex項(xiàng)目。谷歌希望做出一個(gè)模擬人聲的機(jī)器人,可以幫人安排約會(huì),同時(shí)希望Assistant能內(nèi)置27種語(yǔ)言,實(shí)時(shí)為用戶(hù)翻譯對(duì)話。
“但是,如果人工智能是讓我們與眾不同之處,那么用它來(lái)真正革新人們生活方式的功能是什么?”我這樣問(wèn)哈夫曼是因?yàn)槲蚁M麖V闊的環(huán)境能激發(fā)一些反思。
和一位受過(guò)媒體培訓(xùn)的技術(shù)主管談話時(shí),事情從來(lái)沒(méi)有那么戲劇化過(guò)。但這并不僅僅是我的一廂情愿。哈夫曼,一個(gè)14年的谷歌老手,目光和善,留著濃密山羊胡子,他認(rèn)真思考了我對(duì)未來(lái)數(shù)字助理時(shí)代提出的隱私問(wèn)題。他說(shuō),首先,這可能需要立法。他也是在討論谷歌助手的發(fā)展方向,這對(duì)谷歌思考其最重要產(chǎn)品有啟發(fā)意義。
哈夫曼建議,在接下來(lái)的五年里,Assistant可以實(shí)現(xiàn)與人自然對(duì)話的基礎(chǔ),但從計(jì)算機(jī)科學(xué)的角度看,自然對(duì)話根本就不是基礎(chǔ)。他說(shuō)"Hey" 或者“OK”這樣的喚醒語(yǔ)是“真的很奇怪”。哈夫曼想讓Assistant了解你的心情和語(yǔ)氣,覺(jué)察你是否感到沮喪。他想讓軟件完全記住你昨天與其進(jìn)行的一次討論,這樣今天你就可以接著昨天的話繼續(xù)說(shuō)。
我問(wèn)他10年后的愿景。他沉思著說(shuō),也許物理機(jī)器人,不僅僅是可以交談的機(jī)器人,還是可移動(dòng)和做事的機(jī)器人,并將成為家用產(chǎn)品,數(shù)字助理也可與之連接。
我們的摩天輪之旅結(jié)束了,座艙慢慢下降到地面。我們路過(guò)了一輛停在軌道上的拉斯維加斯單軌車(chē),也有“Hey Google”的字樣印在側(cè)面。單軌車(chē)正準(zhǔn)備駛離車(chē)站,就變成了“Hey Go”。
Duplex的高光時(shí)刻
2016年5月,皮查伊(Pichai)在Google年度I/O會(huì)議上向7000名開(kāi)發(fā)人員介紹Assistant的前幾天,我在他的辦公室里坐著一起聆聽(tīng)產(chǎn)品推介。這家搜索巨頭正在籌備Google Home,一個(gè)智能家庭語(yǔ)音助手,將與Amazon Echo正面交鋒。很明顯,Assistant會(huì)和Alexa歸為一類(lèi)。但從一開(kāi)始,皮查伊就堅(jiān)決表態(tài)Assistant還有其他功能?!斑@是谷歌在問(wèn)用戶(hù),‘嗨,我能幫什么忙嗎?’可以把它看作是建立你個(gè)人的谷歌。”
一番刺激后,惹惱的皮查伊最終將點(diǎn)燃市場(chǎng)的功勞歸功于亞馬遜。他說(shuō),“有些地方我們會(huì)領(lǐng)跑,有些地方會(huì)有人指路,然后我們來(lái)實(shí)現(xiàn)?!?/p>
過(guò)去的一年里,這種野心變得愈發(fā)明顯。今年5月,皮查伊發(fā)布了Duplex,一款模仿人類(lèi)語(yǔ)言、聲音逼真、令人驚訝的人工智能。軟件使用諸如“uh、“um”之類(lèi)的語(yǔ)氣詞,說(shuō)話時(shí)會(huì)有停頓,好像在思考接下來(lái)要說(shuō)什么,即使它的反應(yīng)其實(shí)是預(yù)先設(shè)定好的。目前,Duplex正在進(jìn)行有限的公開(kāi)測(cè)試階段。
Duplex旨在讓谷歌助手為你預(yù)訂餐廳和預(yù)約理發(fā)。但幾乎立刻,行業(yè)觀察者、人工智能倫理學(xué)家和消費(fèi)者開(kāi)始擔(dān)心軟件是否也能欺騙與之交談的人。后來(lái)谷歌表示,將加強(qiáng)信息披露,讓人們明確他們是在和機(jī)器人說(shuō)話。
哈夫曼表示,這是谷歌的關(guān)鍵時(shí)刻。他說(shuō),“強(qiáng)烈的反響出乎我的意料。這向我們表明了社會(huì)問(wèn)題的重要性?!?/p>
立法之陰霾
其中一個(gè)大問(wèn)題是:在數(shù)字助理越來(lái)越智能的時(shí)代,隱私如何保護(hù)?
這一點(diǎn)很重要,硅谷正面臨比以往任何時(shí)候更多的隱私審查。過(guò)去兩年,F(xiàn)acebook一直在抵御一場(chǎng)又一場(chǎng)的危機(jī),從虛假宣傳到大規(guī)模數(shù)據(jù)泄露。去年12月,皮查伊被拉到國(guó)會(huì)面前,應(yīng)答有關(guān)中國(guó)項(xiàng)目Dragonfly的問(wèn)題,并回應(yīng)谷歌對(duì)用戶(hù)個(gè)人信息的全面收集。
假如還要在起居室里放一個(gè)設(shè)備,有一個(gè)麥克風(fēng),一直在聽(tīng)喚醒語(yǔ)“Hey Google”,事情也會(huì)變得更加復(fù)雜。
擁有計(jì)算機(jī)科學(xué)博士學(xué)位的哈夫曼說(shuō),“想想Google Home或者Alexa,這是有史以來(lái)第一款非個(gè)人的設(shè)備。它們是真正生活在共享環(huán)境中的計(jì)算設(shè)備……這些東西現(xiàn)在和我們一起住在這個(gè)房間里,我們都是用戶(hù)。那么隱私是如何保障的呢?”
哈夫曼指出谷歌圍繞人工智能在制定議程方面已經(jīng)完成的工作。去年6月,皮查伊發(fā)布了一套人工智能道德準(zhǔn)則,指導(dǎo)公司如何使用這項(xiàng)技術(shù)。此前,谷歌員工抗議公司與五角大樓簽訂幫助開(kāi)發(fā)人工智能分析無(wú)人機(jī)足跡的合同。這些指導(dǎo)方針包括發(fā)誓永遠(yuǎn)不為武器開(kāi)發(fā)人工智能,只創(chuàng)造“造福社會(huì)”的技術(shù)。
但公司的自我監(jiān)管可能不會(huì)是唯一的辦法。
哈夫曼表示,“老實(shí)說(shuō),我認(rèn)為隨著社會(huì)弄清楚這些技術(shù)是如何適應(yīng)時(shí)代的,大概最終也會(huì)采取新的立法。你看電話之類(lèi)的東西;這已經(jīng)存在很久了。關(guān)于如何使用電話,打電話來(lái)干什么,有很多法律。比如你不能在沒(méi)有授權(quán)的情況下竊聽(tīng)電話?!?/p>
哈夫曼還表示,“所以那一規(guī)則適用于那一代的技術(shù),而有了人工智能,我們的社會(huì)將思考一些新的規(guī)則?!?/p>
當(dāng)被問(wèn)及這項(xiàng)立法可能會(huì)是什么樣子,哈夫曼收回了他的聲明。他說(shuō),“我不知道是否需要立法。我不是談?wù)撨@件事的合適人選。”他表示,但無(wú)論如何,這將由社會(huì)來(lái)決定。
哈夫曼不會(huì)推測(cè)監(jiān)管的類(lèi)型,但斯坦?;ヂ?lián)網(wǎng)與社會(huì)中心隱私主管珍·金(Jen King)對(duì)立法倒有一番見(jiàn)解。她如今正在研究通過(guò)智能語(yǔ)音助手收集的數(shù)據(jù)類(lèi)型。
金說(shuō),監(jiān)管可能看起來(lái)類(lèi)似于由通用數(shù)據(jù)保護(hù)條例(GDPR)引入的限制,這是一項(xiàng)在2018年5月生效的全面歐洲法律。它使消費(fèi)者能更好地控制他們移交給科技公司的個(gè)人信息。對(duì)于數(shù)字助理,立法可能意味著如果消費(fèi)者希望刪除數(shù)據(jù),政府可以強(qiáng)制執(zhí)行刪除政策,或者法律可能要求對(duì)數(shù)據(jù)的具體使用方式尋求更具體的同意權(quán)限,并確保數(shù)據(jù)不會(huì)被“永久”使用。
金認(rèn)為,我們都應(yīng)該關(guān)注谷歌及其他公司未來(lái)在設(shè)備上的默認(rèn)設(shè)置,以免人們無(wú)意中放棄對(duì)個(gè)人信息的保護(hù)。
金說(shuō),“對(duì)大多數(shù)人來(lái)講,谷歌是互聯(lián)網(wǎng)的門(mén)戶(hù)。這些助手進(jìn)一步扮演了這一角色。公司塑造了用戶(hù)體驗(yàn),但會(huì)以有商業(yè)利益的方式來(lái)做?!?/p>
競(jìng)爭(zhēng)態(tài)勢(shì)正在加劇
哈夫曼和他的團(tuán)隊(duì)為谷歌助手開(kāi)發(fā)功能時(shí),皮查伊也在做相應(yīng)的工作。哈夫曼表示,首席執(zhí)行官經(jīng)常報(bào)告軟件的缺陷和低效。例如,當(dāng)他說(shuō)"Hey Google" 時(shí),如果錯(cuò)誤的裝置啟動(dòng)了,他會(huì)告知哈夫曼。皮查伊試圖設(shè)置軟件,讓助手也可以聽(tīng)從家人的指令時(shí),他告訴哈夫曼這個(gè)過(guò)程太復(fù)雜了。
哈夫曼笑著說(shuō),“我有時(shí)也會(huì)被人大聲嚷嚷,這是對(duì)的。皮查伊真的有在推動(dòng)我們前進(jìn)。”
急于證明消費(fèi)者有實(shí)際使用語(yǔ)音助手,上個(gè)月亞馬遜和谷歌都做了一些他們幾乎不可能做的事情:他們公布了用戶(hù)數(shù)據(jù)。
亞馬遜聲稱(chēng)Alexa設(shè)備銷(xiāo)量超過(guò)1億臺(tái),谷歌不甘示弱,幾日后宣布Assistant銷(xiāo)量即將突破10億。然而兩家的數(shù)據(jù)都無(wú)法說(shuō)明真相。例如,由于Assistant軟件是預(yù)安裝的,所以這十億個(gè)輔助設(shè)備中的絕大多數(shù)(谷歌不會(huì)公布具體數(shù)據(jù))是自動(dòng)安裝到安卓手機(jī)上。當(dāng)然,谷歌也會(huì)在自己的Pixel手機(jī)上安裝Assistant。
我問(wèn)哈夫曼,這個(gè)數(shù)字何時(shí)會(huì)被非手機(jī)設(shè)備所主導(dǎo)。他說(shuō)他也不知道,但谷歌正在尋找Assistant的兩大用武之地——汽車(chē)和房子,最終可能會(huì)合并。
谷歌關(guān)于智能家居的作戰(zhàn)計(jì)劃記錄良好。谷歌希望在智能家庭助手市場(chǎng)上能與亞馬遜及其Echo設(shè)備一較高下。谷歌還想讓Assistant盡可能多地與三星、索尼和海信等制造商的智能電視合作。但鮮有提及谷歌推進(jìn)Assistant為汽車(chē)提供服務(wù)。在國(guó)際消費(fèi)電子產(chǎn)品展上,谷歌公布了一些汽車(chē)輔助設(shè)備,包括Anker Roav的汽車(chē)電話適配器,可插入打火機(jī)使用。
這個(gè)想法將谷歌助手的適用范圍延伸到越來(lái)越廣泛的領(lǐng)域。這并不容易。在計(jì)算成功率時(shí),哈夫曼回到了拉斯維加斯的主題。
他說(shuō),“對(duì)于大多數(shù)人而言,虛擬助理,不論是我們的還是其他人的,都還不太適合普及大眾,還沒(méi)達(dá)到‘沒(méi)有這個(gè)我就活不下去’的境界?!彼怨雀枞匀挥性S多努力要做?!昂翢o(wú)疑問(wèn),這是一個(gè)賭注。”