語(yǔ)義識(shí)別難住中國(guó),Siri 商用前景仍不明朗
掃描二維碼
隨時(shí)隨地手機(jī)看文章
“Siri是催化劑,但是能否修成正果尚需時(shí)日。” 小i機(jī)器人董事長(zhǎng)袁斌表示。
自從去年10月,借助發(fā)布iPhone 4S之勢(shì)推出Siri語(yǔ)音問(wèn)答系統(tǒng)以來(lái),全世界都掀起了一場(chǎng)語(yǔ)音技術(shù)熱潮,這些長(zhǎng)期被邊緣化的公司瞬間成為了市場(chǎng)關(guān)注的焦點(diǎn)。前有Ciriis和Airi,后有科大訊飛的“語(yǔ)點(diǎn)”。
被資本市場(chǎng)高度熱捧的是市場(chǎng)是機(jī)會(huì)還是陷阱?目前下定論顯然有點(diǎn)早。
過(guò)去的一個(gè)月,TechWeb走訪了國(guó)內(nèi)眾多從事語(yǔ)音技術(shù)的公司,發(fā)現(xiàn)這些Siri的跟隨者們都面臨的共同問(wèn)題是,聽(tīng)得懂你在說(shuō)什么,卻不理解你在說(shuō)什么。至少目前來(lái)看,語(yǔ)音市場(chǎng)距離大規(guī)模商用依然有不小的距離。
這個(gè)問(wèn)題的出現(xiàn)并不意外,因?yàn)榧幢闶翘O果的Siri同樣困擾于此。近日,Siri在國(guó)外遭到了多起訴訟,原因是Siri無(wú)法準(zhǔn)確理解用戶的問(wèn)題,蘋果涉嫌夸大宣傳。由此可見(jiàn),如果Siri尚且不夠完美,那么中國(guó)的Siri必定還有更多的路要走。
“最后的禮物”不完美
2011年10月,蘋果iPhone 4S發(fā)布,雖然iPhone 4S無(wú)甚亮點(diǎn),但其配備的語(yǔ)音控制助手Siri一經(jīng)發(fā)布便艷驚全球。被稱為喬布斯送給這個(gè)世界“最后的禮物”。
這是蘋果唯一一款打上Beta標(biāo)簽的產(chǎn)品,但卻承載了巨大的期望。蘋果可以借此機(jī)會(huì)創(chuàng)建一個(gè)人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺(tái),讓Siri與其他程序結(jié)合,Siri本身將成為入口。其結(jié)果是谷歌的搜索形式將被顛覆,用戶可以通過(guò)更自然的交互方式直接獲得答案。《紐約時(shí)報(bào)》撰文稱:Siri代表著蘋果的商業(yè)未來(lái),也預(yù)示著未來(lái)“搜索”的形態(tài)。
雖然蘋果有長(zhǎng)遠(yuǎn)的規(guī)劃,但Siri的發(fā)布還是略顯倉(cāng)促,實(shí)現(xiàn)這些美好愿景尚需時(shí)日。Siri所具有的發(fā)電子郵件、播放音樂(lè)、安排會(huì)議等諸多功能用戶使用頻率并不高。最新的一項(xiàng)調(diào)查顯示,30%的用戶從未使用Siri來(lái)發(fā)送電子郵件,32%的用戶分別表示自己從未使用Siri播放音樂(lè)。對(duì)Siri表示非常滿意的用戶只有55%。
本月早些時(shí)候,紐約iPhone 4S用戶弗蘭克·法齊奧(Frank M. Fazio)在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對(duì)Siri功能的描述存在“誤導(dǎo)性和欺騙性信息”。另一位iPhone 4S用戶大衛(wèi)·瓊斯(David Jones)在美國(guó)加州庫(kù)珀蒂諾對(duì)蘋果提起訴訟,指控蘋果錯(cuò)誤地描述了Siri功能。“Siri要么無(wú)法理解原告所提出的問(wèn)題,要么在經(jīng)過(guò)長(zhǎng)時(shí)間等待后提供了錯(cuò)誤的答案。”
語(yǔ)義識(shí)別之難
為什么Siri會(huì)有這些不完美?國(guó)內(nèi)從事了十年智能網(wǎng)絡(luò)機(jī)器人研究的小i機(jī)器人董事長(zhǎng)袁斌解釋稱,Siri最難的技術(shù)不是語(yǔ)音,而是語(yǔ)義識(shí)別。
我們現(xiàn)在看到的Siri實(shí)際上由兩部分組成,一部分是語(yǔ)音識(shí)別,一部分是語(yǔ)義識(shí)別。當(dāng)用戶對(duì)Siri講一句話時(shí),語(yǔ)音識(shí)別分析出這句話說(shuō)的是什么,語(yǔ)義識(shí)別分析出這句話是什么意思。語(yǔ)音和語(yǔ)義兩部分技術(shù)在Siri中所占的比例分別是20%和80%。也就是說(shuō),要正確理解用戶的意思并作出反應(yīng),語(yǔ)義識(shí)別實(shí)際上更為關(guān)鍵。
脫胎于美國(guó)國(guó)防部技術(shù)的Siri真正擅長(zhǎng)的是語(yǔ)義識(shí)別。語(yǔ)音識(shí)別部分,Siri選擇跟語(yǔ)音識(shí)別引擎Nuance合作。Siri現(xiàn)在的任務(wù)是不斷加強(qiáng)其語(yǔ)義識(shí)別能力,建立更加龐大的數(shù)據(jù)庫(kù)。據(jù)說(shuō)蘋果已經(jīng)在印度招大量工程師進(jìn)行數(shù)據(jù)庫(kù)的梳理。
語(yǔ)義識(shí)別的另外一個(gè)挑戰(zhàn)是,內(nèi)容越多,對(duì)智能識(shí)別的挑戰(zhàn)越大,需要的算法更強(qiáng)。
從事了多年語(yǔ)音技術(shù)研究的李開(kāi)復(fù)也表達(dá)過(guò)類似的觀點(diǎn),他說(shuō):“人們一旦開(kāi)使用語(yǔ)音跟你交流了,就會(huì)把你當(dāng)做一個(gè)人,這個(gè)帶來(lái)的超級(jí)高的期望值會(huì)給語(yǔ)音帶來(lái)很大的挑戰(zhàn)。”
Siri不適合創(chuàng)業(yè)公司
Siri的火爆讓不少國(guó)內(nèi)的創(chuàng)業(yè)者非常興奮,因?yàn)樗碇粋€(gè)可以探索的新方向。但是不少業(yè)內(nèi)人士對(duì)此表示懷疑態(tài)度。
李開(kāi)復(fù)曾在微博中稱:“‘中國(guó)Siri’創(chuàng)業(yè)計(jì)劃不太適合中國(guó)創(chuàng)業(yè)公司,需要解決的問(wèn)題很多也很棘手,主要是新的智能語(yǔ)音控制技術(shù)如何引導(dǎo)用戶行為,再是克服海量數(shù)據(jù)學(xué)習(xí)門檻和應(yīng)用整合困難等。”
國(guó)內(nèi)現(xiàn)在已有的類Siri應(yīng)用,Ciriis和Airi,尚且都停留在娛樂(lè)層面。而前段時(shí)間科大訊飛高調(diào)發(fā)布的“訊飛語(yǔ)點(diǎn)”也并未有實(shí)質(zhì)性突破,如果一句話中間增加停頓,它便無(wú)法正確理解。
袁斌認(rèn)為,要做中國(guó)的Siri,第一需要語(yǔ)料庫(kù),第二需要人工智能的算法。訊飛擁有前者的優(yōu)勢(shì),但后者仍需積累摸索。“需要長(zhǎng)期的、系統(tǒng)的平臺(tái)去處理每天進(jìn)來(lái)的海量的知識(shí),經(jīng)過(guò)長(zhǎng)期的集聚,形成工程化的產(chǎn)品,最后才能對(duì)每天進(jìn)來(lái)的知識(shí)進(jìn)行去重、篩選,同時(shí)能夠?qū)W習(xí)新的知識(shí)點(diǎn)。”
在這一點(diǎn)上,袁斌的小i機(jī)器人有值得借鑒的經(jīng)驗(yàn)。
小i機(jī)器人是一款網(wǎng)絡(luò)機(jī)器人,主要應(yīng)用于運(yùn)營(yíng)商、銀行等的網(wǎng)絡(luò)客服系統(tǒng)。小i機(jī)器人從2001年開(kāi)始開(kāi)發(fā),最終以IM聊天機(jī)器人的形式推出,經(jīng)歷了個(gè)人用戶激增、產(chǎn)品線眾多、用戶滿意度下降、公司負(fù)擔(dān)過(guò)重等一系列問(wèn)題,最終艱難轉(zhuǎn)型。而這些問(wèn)題與今天的Siri以及類Siri應(yīng)用面臨的問(wèn)題非常相似。
袁斌認(rèn)為,無(wú)論誰(shuí)做語(yǔ)音控制技術(shù)或者智能識(shí)別技術(shù),這些問(wèn)題都無(wú)法繞開(kāi)。解決了,則柳暗花明,解決不了,只有死路一條。