《麻省理工科技評論》:阿里巴巴已擁有比谷歌更好的AI語音技術(shù)
阿里巴巴近日一項(xiàng)在國際頂級學(xué)術(shù)會議上的AI語音技術(shù)演示,引起業(yè)界轟動。權(quán)威科學(xué)雜志《麻省理工科技評論》認(rèn)為,阿里巴巴的AI語音助手可以完成復(fù)雜的人類對話功能,甚至可讀懂人類的潛在意圖,顯示出阿里巴巴已經(jīng)擁有比谷歌更好的AI語音技術(shù)。
(《麻省理工科技評論》近日報(bào)道截圖)
不久前,阿里巴巴達(dá)摩院的科學(xué)家在機(jī)器學(xué)習(xí)領(lǐng)域頂級會議NIPS(神經(jīng)信息處理系統(tǒng)大會)上,演示了這項(xiàng)已應(yīng)用于快遞領(lǐng)域的AI語音技術(shù)。在約30秒的時(shí)間里,菜鳥語音助手在經(jīng)歷了被用戶打斷、更改意圖、沉默等交互后,依然能夠應(yīng)對自如,順利幫助用戶完成了快遞派送地址的更改。
今年5月份,谷歌曾發(fā)布一款酷似人類的的語音助手Duplex,可以幫助客戶預(yù)定餐廳。這在業(yè)界引起了不小的關(guān)注。
但《麻省理工科技評論》認(rèn)為,阿里巴巴演示中發(fā)生的一幕,揭開了人機(jī)語音交互的新序幕:當(dāng)AI問用戶明天早上是否可以派送時(shí),用戶回答“我早上不在家”,阿里巴巴的AI語音助手沒有直接回答“是”或“否”,而是讀出人類背后潛藏的意圖,并采取后續(xù)行動。
“類似表達(dá)在人類對話中可能非常普遍,但機(jī)器往往很難對其進(jìn)行處理。從演示的效果來看,阿里巴巴的AI語音助手能夠做到這一點(diǎn),說明它比谷歌更高級。”《麻省理工科技評論》認(rèn)為,這顯示出阿里巴巴在AI語音領(lǐng)域的技術(shù)能力已經(jīng)超出谷歌?!堵槭±砉た萍荚u論》是全球影響力最大、最權(quán)威的科技雜志之一。
此外,阿里巴巴的語音助手能讓機(jī)器在跟人交互過程中既能"說"又能"聽",并能模仿真人的語氣、語調(diào)、語速,整個(gè)對話過程幾乎聽不出是機(jī)器在跟人交互。今年5月,阿里巴巴在國內(nèi)展示這一技術(shù)時(shí),現(xiàn)場就有觀眾驚呼太逼真了。
在今年雙11期間,這款語音助手已為數(shù)百萬用戶提供服務(wù)。菜鳥提供的數(shù)據(jù)顯示,平均每個(gè)快遞員每天大約要送150-200個(gè)包裹,以一個(gè)電話半分鐘至1分鐘計(jì)算,每天光打電話就要3小時(shí)。這項(xiàng)技術(shù)的應(yīng)用能夠幫助快遞員節(jié)省時(shí)間,更輕松地完成工作。
據(jù)悉,阿里巴巴目前正在限制這一技術(shù)的使用范圍,以避免該技術(shù)被應(yīng)用于機(jī)器對人類的欺詐行為。
附現(xiàn)場演示視頻對話全錄:
智能助手:“您好,您有一個(gè)上午送到文一西路588號的中通快遞,請問方便簽收嗎?”
用戶:“您哪位?”
智能助手:“我是菜鳥語音助手,在快遞員派送前跟您確認(rèn)”
用戶:“我上午不在家呢”
智能助手:“那您方便留一個(gè)簽收地址嗎?我轉(zhuǎn)告快遞員為您安排?!?/p>
用戶:“是什么東西???”
智能助手:“物流單上顯示是文件”
用戶:“嗯,那幫我放物業(yè)吧……算了,還是給我放到門口吧”
智能助手:“是送到門口是把?”
用戶:……(沉默狀態(tài))
智能助手:“喂,還在嗎?給您放在門口可以嗎?”
用戶:“可以的”
用戶:“啊,對了,我好像還有一個(gè)中通的包裹,今天會派件嗎?”
智能助手:“您稍等,這里看到您有一個(gè)中通快遞的包裹,預(yù)計(jì)明天到達(dá)”
用戶:“謝謝,再見”
智能助手:“再見”