國(guó)內(nèi)類Siri應(yīng)用頻出 存智能化程度不夠高問題
搭載Siri功能的iPhone4s一經(jīng)推出便在市場(chǎng)上掀起了不小的波瀾。
與以往不同的是,iPhone4s本身并沒有給廣大“果粉”帶來(lái)太多的驚喜,反而是嵌入iPhone4s的叫做“Siri”的語(yǔ)音助手火了起來(lái)。在iPhone4s還未推出之際,江湖中關(guān)于“Siri”的傳說(shuō)和猜想就從未間斷過(guò)。
Siri是蘋果公司在其產(chǎn)品iPhone4S內(nèi)嵌入的一項(xiàng)語(yǔ)音控制功能,它可以令iPhone4S變身為一臺(tái)智能化機(jī)器人,利用Siri用戶可以通過(guò)手機(jī)讀短信、介紹餐廳、詢問天氣、語(yǔ)音設(shè)置鬧鐘等。
但是蘋果公司極力宣傳的這一功能并沒有得到廣大“果粉”們的認(rèn)可,紐約的一位iPhone4s用戶弗蘭克·法齊奧(FrankM.Fazio)甚至在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對(duì)Siri功能的描述存在“誤導(dǎo)性和欺騙性信息”。
Siri的稍顯不“成熟”并沒有阻礙語(yǔ)音智能應(yīng)用盛行的趨勢(shì),反而其商業(yè)上的成功使眾多國(guó)內(nèi)外商家蠢蠢欲動(dòng),摩拳擦掌起來(lái)。
國(guó)內(nèi)“類Siri”應(yīng)用大量涌現(xiàn)
據(jù)小編的不完全統(tǒng)計(jì),目前在市場(chǎng)上出現(xiàn)的類Siri的語(yǔ)音助手已經(jīng)有十多種,這其中包括國(guó)外的iris、Assistant、Evi、cluzee等英文版軟件,也包括國(guó)內(nèi)應(yīng)用市場(chǎng)上出現(xiàn)的蟲洞、語(yǔ)點(diǎn)、智能360、Ciriis等中文版的語(yǔ)音助手。
實(shí)際上,Siri也并不是手機(jī)上出現(xiàn)的第一個(gè)智能語(yǔ)音助手。據(jù)悉,最早出現(xiàn)的語(yǔ)音助手是Speaktoit、Vlingo這類工具,但它們的弊端在于只能聽話,不能說(shuō)話,這在一定程度上桎梏了他們的發(fā)展速度。被蘋果公司收購(gòu)之后,Siri讓越來(lái)越多的智能手機(jī)用戶關(guān)注語(yǔ)音助手,它的興起讓人們真正意義上了解到語(yǔ)音助手這項(xiàng)技術(shù)。iPhone4S搭載的Siri則聽、說(shuō)功能兼具,在一定程度上彌補(bǔ)了前者的不足,也讓人們開始關(guān)注這一領(lǐng)域的發(fā)展。
而市場(chǎng)上出現(xiàn)的類Siri應(yīng)用,給小編的一個(gè)最大的感受是智能化程度不夠高。對(duì)于一些關(guān)于日常的衣食住行或是相對(duì)簡(jiǎn)單的問題,這些語(yǔ)音助手基本上都能夠給予相對(duì)明確的答復(fù),但是對(duì)于一些稍微復(fù)雜的問題,盡管與其交流的時(shí)候“雞同鴨講”得挺熱鬧,但通常給出的答案都是模糊兩可或者干脆打起了太極。
“你有男朋友嗎?”“目前智能360想的最多的不是個(gè)人問題,而是努力工作。”這是智能360給出的回答。同樣的問題蟲洞給出的回答則顯得很應(yīng)景,“男朋友??我說(shuō)有的,至于你信不信,反正我是不信。”當(dāng)小編繼續(xù)問道:“美國(guó)為什么攻打伊拉克?”蟲洞給出的回答顯得有些裝傻賣萌:“不懂!嗚嗚嗚,我懷疑你是故意欺負(fù)我,我準(zhǔn)備告訴我媽媽。”
技術(shù)壁壘:語(yǔ)音識(shí)別+語(yǔ)義分析
對(duì)于中國(guó)用戶來(lái)講,Siri給國(guó)內(nèi)用戶帶來(lái)的最大困擾就是其不支持中文。據(jù)了解,目前Siri共支持四種語(yǔ)音,即英文、法文、德文和日文。其中英文部分只支持美國(guó)、英國(guó)和澳大利亞的口音,對(duì)于其他國(guó)家和地區(qū)的英語(yǔ)口音在識(shí)別上還存在困難。
有分析認(rèn)為,聲調(diào)和地方口音龐雜,或許是Siri中文版遲遲未推出的主要原因。一家國(guó)外媒體表示,對(duì)于語(yǔ)音識(shí)別來(lái)說(shuō),中文極具挑戰(zhàn)性,因?yàn)槠胀ㄔ捴挥?00個(gè)單音節(jié)聲音,根據(jù)聲調(diào)予以區(qū)別,而且中國(guó)還擁有很多種方言和數(shù)不盡的地方口音。
國(guó)際巨頭蘋果的劣勢(shì),對(duì)本土創(chuàng)業(yè)企業(yè)而言卻是機(jī)遇所在,是本土研發(fā)類似Siri產(chǎn)品的最大優(yōu)勢(shì)。
小編從智能360這款應(yīng)用的“機(jī)器人的聲音”設(shè)置一項(xiàng)了解到,單是機(jī)器人的聲音就有12中語(yǔ)音可供選擇,除了傳統(tǒng)意義上的男女普通話和男女童及老人普通話之外,其中還包括臺(tái)灣普通話、女生東北話、男聲河南話和女聲陜西話等多種帶有地方特色方言的各式普通話可供選擇。同類中蟲洞在這方面也表現(xiàn)優(yōu)異,它給提供的語(yǔ)音選擇多達(dá)18種,小編嘗試了一下,的確很精準(zhǔn)的抓住了各個(gè)地方的發(fā)音技巧和規(guī)律。這個(gè)小細(xì)節(jié)或許在一定程度上解釋了中文在韻律上的復(fù)雜性和Siri遲遲沒有推出中文版的原因吧。
此外,基于語(yǔ)音的人機(jī)交互智能應(yīng)用,構(gòu)成整個(gè)語(yǔ)音系統(tǒng)框架的是兩部分,即語(yǔ)音識(shí)別和語(yǔ)義識(shí)別。前者是詮釋說(shuō)話的人說(shuō)的內(nèi)容是什么,后者則是對(duì)話的內(nèi)容進(jìn)行進(jìn)一步的詮釋,要想達(dá)到理想的語(yǔ)音輸出效果,需要二者的完美配合才可以,否則答非所問的窘境仍然無(wú)法徹底避免。
通過(guò)對(duì)目前市面上出現(xiàn)的類Siri語(yǔ)音助手的試驗(yàn)小編也驗(yàn)證了“聽懂其音,不解其意”的現(xiàn)狀。這些Siri的效仿者普遍面臨一個(gè)共同的問題是,它通常能聽得懂你在說(shuō)什么,卻不理解你在說(shuō)什么。換而言之,其實(shí)就是它能夠識(shí)別到人的語(yǔ)音功能,卻無(wú)法準(zhǔn)確的詮釋語(yǔ)義的含義,這也讓很多用戶在用的時(shí)候經(jīng)常出現(xiàn)“所問非所答”的令人啼笑皆非的情景。要想達(dá)到理想的人機(jī)互動(dòng)效果,語(yǔ)音和語(yǔ)義上的有機(jī)完美結(jié)合才是避免尷尬的最終要做的事情。
專家觀點(diǎn):不適合創(chuàng)業(yè)公司?
對(duì)于國(guó)內(nèi)不少開發(fā)者開始拓土這一領(lǐng)域,創(chuàng)新工場(chǎng)CEO李開復(fù)(微博)在微博中稱:“中國(guó)Siri或安卓Siri的計(jì)劃不太適合創(chuàng)業(yè)公司,因?yàn)橥度氪?、風(fēng)險(xiǎn)高、技術(shù)難以實(shí)現(xiàn)。”對(duì)于語(yǔ)音控制這項(xiàng)技術(shù)研究多年為何依然有較大的屏障,李開復(fù)認(rèn)為:“過(guò)去30年,總說(shuō)語(yǔ)音要改變世界,為什么沒有改?有幾個(gè)理由,第一是語(yǔ)音識(shí)別的精確度不夠,第二是語(yǔ)音應(yīng)用在哪里,靠一小批的語(yǔ)音專家拍腦袋想,不是辦法。”
著名天使投資人薛蠻子(微博)在微博評(píng)論:“中國(guó)Siri從頭開始創(chuàng)業(yè)難,但有積累有實(shí)力的中國(guó)企業(yè)還是存在的,關(guān)鍵是要有可持續(xù)發(fā)展性。”
對(duì)于語(yǔ)音控制的前景,微軟的創(chuàng)始人蓋茨也曾說(shuō)過(guò),五年后語(yǔ)音會(huì)改變世界。只是,這樣的論調(diào),蓋茨每隔五年都要再說(shuō)一遍。
也許我們還不清楚實(shí)現(xiàn)真正意義上的人機(jī)交互還有多遠(yuǎn)的路要走,但是“調(diào)戲類Siri”已經(jīng)成為某類青年的調(diào)侃標(biāo)配,因?yàn)樗鼈円驳拇_夠萌、夠2、夠天真。
國(guó)內(nèi)類Siri精選:
1.智能360
[!--empirenews.page--]應(yīng)用名稱:智能360
平臺(tái):Android
應(yīng)用類型:語(yǔ)音助手
優(yōu)勢(shì):
1語(yǔ)音識(shí)別度較高,語(yǔ)義解析相對(duì)同類算是不錯(cuò)。
2.數(shù)據(jù)庫(kù)涉獵較廣,對(duì)當(dāng)下的熱點(diǎn)話題能夠很快做出反應(yīng)。對(duì)于其不太熟悉的領(lǐng)域,它能很快從互聯(lián)網(wǎng)上查到相應(yīng)信息,呈現(xiàn)在用戶面前。
3.機(jī)器人聲音劃分較細(xì),共有12種帶有地方特色的普通話可供用戶選擇。
4.加入了換膚功能,用戶可以選擇自己喜歡的界面。
5.支持語(yǔ)音手寫雙重輸入方式。
改進(jìn):
1.對(duì)于稍快的語(yǔ)速識(shí)別程度較差,需要放慢說(shuō)話速度。
2.語(yǔ)音識(shí)別的反應(yīng)速度有點(diǎn)慢。
3.需聯(lián)網(wǎng)才可以用,耗費(fèi)流量。
2.訊飛語(yǔ)點(diǎn)
應(yīng)用名稱:訊飛語(yǔ)點(diǎn)
平臺(tái):Android
應(yīng)用類別:語(yǔ)音助手
優(yōu)勢(shì):
1.界面根據(jù)用戶的試用頻次分為六個(gè)板塊,用起來(lái)很方便,省去查找的煩惱。
2.語(yǔ)音識(shí)別度在同類里算是佼佼者,且反應(yīng)速度相對(duì)較快。
3.語(yǔ)音輸出清新自然,不生澀。
改進(jìn):
1.需要聯(lián)網(wǎng)才可以用,耗費(fèi)流量。
2.需加強(qiáng)對(duì)稍微復(fù)雜的問題的把握度,避免雞同鴨語(yǔ)的窘境。
3.頁(yè)面顯示較呆板,可以適當(dāng)加些換膚功能。
3.蟲洞
應(yīng)用名稱:蟲洞
平臺(tái):Android
應(yīng)用類別:語(yǔ)音助手
優(yōu)勢(shì):
1.發(fā)音系統(tǒng)強(qiáng)大,共有18種帶有不同地域特點(diǎn)或年齡段的特色語(yǔ)音。
2.嵌入了當(dāng)下流行的LBS定位功能,接入互聯(lián)網(wǎng)后用戶可以很方便的定位到自己所在的地理位置,非常方便。
3.支持語(yǔ)音和手動(dòng)輸入雙重輸入模式。
改進(jìn):
1.語(yǔ)音和語(yǔ)義準(zhǔn)確度的把握還有待提高和完善。
2.需聯(lián)網(wǎng)后才可以使用,耗費(fèi)流量太大。
3.界面略顯單調(diào),可適當(dāng)增加換膚功能。