當前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導讀]“Siri是催化劑,但是能否修成正果尚需時日。” 小i機器人董事長袁斌表示。自從去年10月,借助發(fā)布iPhone 4S之勢推出Siri語音問答系統(tǒng)以來,全世界都掀起了一場語音技術(shù)熱潮,這些長期被邊緣化的公司瞬間成

“Siri是催化劑,但是能否修成正果尚需時日。” 小i機器人董事長袁斌表示。

自從去年10月,借助發(fā)布iPhone 4S之勢推出Siri語音問答系統(tǒng)以來,全世界都掀起了一場語音技術(shù)熱潮,這些長期被邊緣化的公司瞬間成為了市場關(guān)注的焦點。前有Ciriis和Airi,后有科大訊飛的“語點”。

被資本市場高度熱捧的是市場是機會還是陷阱?目前下定論顯然有點早。

過去的一個月,TechWeb走訪了國內(nèi)眾多從事語音技術(shù)的公司,發(fā)現(xiàn)這些Siri的跟隨者們都面臨的共同問題是,聽得懂你在說什么,卻不理解你在說什么。至少目前來看,語音市場距離大規(guī)模商用依然有不小的距離。

這個問題的出現(xiàn)并不意外,因為即便是蘋果的Siri同樣困擾于此。近日,Siri在國外遭到了多起訴訟,原因是Siri無法準確理解用戶的問題,蘋果涉嫌夸大宣傳。由此可見,如果Siri尚且不夠完美,那么中國的Siri必定還有更多的路要走。

“最后的禮物”不完美

2011年10月,蘋果iPhone 4S發(fā)布,雖然iPhone 4S無甚亮點,但其配備的語音控制助手Siri一經(jīng)發(fā)布便艷驚全球。被稱為喬布斯送給這個世界“最后的禮物”。

這是蘋果唯一一款打上Beta標簽的產(chǎn)品,但卻承載了巨大的期望。蘋果可以借此機會創(chuàng)建一個人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺,讓Siri與其他程序結(jié)合,Siri本身將成為入口。其結(jié)果是谷歌的搜索形式將被顛覆,用戶可以通過更自然的交互方式直接獲得答案?!都~約時報》撰文稱:Siri代表著蘋果的商業(yè)未來,也預示著未來“搜索”的形態(tài)。

雖然蘋果有長遠的規(guī)劃,但Siri的發(fā)布還是略顯倉促,實現(xiàn)這些美好愿景尚需時日。Siri所具有的發(fā)電子郵件、播放音樂、安排會議等諸多功能用戶使用頻率并不高。最新的一項調(diào)查顯示,30%的用戶從未使用Siri來發(fā)送電子郵件,32%的用戶分別表示自己從未使用Siri播放音樂。對Siri表示非常滿意的用戶只有55%。

本月早些時候,紐約iPhone 4S用戶弗蘭克·法齊奧(Frank M. Fazio)在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對Siri功能的描述存在“誤導性和欺騙性信息”。另一位iPhone 4S用戶大衛(wèi)·瓊斯(David Jones)在美國加州庫珀蒂諾對蘋果提起訴訟,指控蘋果錯誤地描述了Siri功能。“Siri要么無法理解原告所提出的問題,要么在經(jīng)過長時間等待后提供了錯誤的答案。”

語義識別之難

為什么Siri會有這些不完美?國內(nèi)從事了十年智能網(wǎng)絡(luò)機器人研究的小i機器人董事長袁斌解釋稱,Siri最難的技術(shù)不是語音,而是語義識別。

我們現(xiàn)在看到的Siri實際上由兩部分組成,一部分是語音識別,一部分是語義識別。當用戶對Siri講一句話時,語音識別分析出這句話說的是什么,語義識別分析出這句話是什么意思。語音和語義兩部分技術(shù)在Siri中所占的比例分別是20%和80%。也就是說,要正確理解用戶的意思并作出反應(yīng),語義識別實際上更為關(guān)鍵。

脫胎于美國國防部技術(shù)的Siri真正擅長的是語義識別。語音識別部分,Siri選擇跟語音識別引擎Nuance合作。Siri現(xiàn)在的任務(wù)是不斷加強其語義識別能力,建立更加龐大的數(shù)據(jù)庫。據(jù)說蘋果已經(jīng)在印度招大量工程師進行數(shù)據(jù)庫的梳理。

語義識別的另外一個挑戰(zhàn)是,內(nèi)容越多,對智能識別的挑戰(zhàn)越大,需要的算法更強。

從事了多年語音技術(shù)研究的李開復也表達過類似的觀點,他說:“人們一旦開使用語音跟你交流了,就會把你當做一個人,這個帶來的超級高的期望值會給語音帶來很大的挑戰(zhàn)。”

Siri不適合創(chuàng)業(yè)公司

Siri的火爆讓不少國內(nèi)的創(chuàng)業(yè)者非常興奮,因為它代表著一個可以探索的新方向。但是不少業(yè)內(nèi)人士對此表示懷疑態(tài)度。

李開復曾在微博中稱:“‘中國Siri’創(chuàng)業(yè)計劃不太適合中國創(chuàng)業(yè)公司,需要解決的問題很多也很棘手,主要是新的智能語音控制技術(shù)如何引導用戶行為,再是克服海量數(shù)據(jù)學習門檻和應(yīng)用整合困難等。”

國內(nèi)現(xiàn)在已有的類Siri應(yīng)用,Ciriis和Airi,尚且都停留在娛樂層面。而前段時間科大訊飛高調(diào)發(fā)布的“訊飛語點”也并未有實質(zhì)性突破,如果一句話中間增加停頓,它便無法正確理解。

袁斌認為,要做中國的Siri,第一需要語料庫,第二需要人工智能的算法。訊飛擁有前者的優(yōu)勢,但后者仍需積累摸索。“需要長期的、系統(tǒng)的平臺去處理每天進來的海量的知識,經(jīng)過長期的集聚,形成工程化的產(chǎn)品,最后才能對每天進來的知識進行去重、篩選,同時能夠?qū)W習新的知識點。”

在這一點上,袁斌的小i機器人有值得借鑒的經(jīng)驗。

小i機器人是一款網(wǎng)絡(luò)機器人,主要應(yīng)用于運營商、銀行等的網(wǎng)絡(luò)客服系統(tǒng)。小i機器人從2001年開始開發(fā),最終以IM聊天機器人的形式推出,經(jīng)歷了個人用戶激增、產(chǎn)品線眾多、用戶滿意度下降、公司負擔過重等一系列問題,最終艱難轉(zhuǎn)型。而這些問題與今天的Siri以及類Siri應(yīng)用面臨的問題非常相似。

袁斌認為,無論誰做語音控制技術(shù)或者智能識別技術(shù),這些問題都無法繞開。解決了,則柳暗花明,解決不了,只有死路一條。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉