自然語言交互技術(shù)植入到可穿戴設(shè)備是否可行
掃描二維碼
隨時(shí)隨地手機(jī)看文章
如同時(shí)尚一樣,科技的每一次進(jìn)步,都會(huì)掀起一場產(chǎn)品變革的颶風(fēng),從某一處出發(fā),然后迅速席卷全球。智能可穿戴設(shè)備的流行便是如此。
從日常使用的智能手環(huán)、智能手表、到高端的智能眼鏡、智能珠寶,再到別具一格的智能T恤、智能手套等等,智能可穿戴設(shè)備已經(jīng)占領(lǐng)了我們的生活。
據(jù)國際數(shù)據(jù)公司(IDC)預(yù)計(jì),整個(gè)可穿戴設(shè)備市場的出貨量將從今年的1.132億件增加到2021年的約2.223億件,前景無限。但在整個(gè)市場欣欣向榮的同時(shí),陰影也隨之逼近。
在經(jīng)過2015年的大爆發(fā)之后,智能手表不但沒有應(yīng)廠商的期望,成為人手一只的潮流,出貨量反而開始大幅下降,一些老牌的可穿戴設(shè)備比如智能手環(huán)鼻祖Jawbone則破產(chǎn)倒閉,整個(gè)行業(yè)更是被預(yù)測未來四年都將不會(huì)出現(xiàn)明顯的增長。
那些被媒體熱炒的產(chǎn)品諸如智能服裝、智能珠寶等,更像是業(yè)內(nèi)一場狂歡獨(dú)角戲,真正推廣向大眾結(jié)果還未可知。智能可穿戴設(shè)備似乎進(jìn)入了一個(gè)緩和的瓶頸期,要想走出困境,繼續(xù)高歌猛進(jìn),或許需要一個(gè)與眾不同的突破點(diǎn)。
在此背景下,近些年一直在進(jìn)步的語音交互技術(shù),就成為了眾多廠商的關(guān)注點(diǎn)。并提出了一種新的想法:將自然語言交互技術(shù)植入到可穿戴設(shè)備中。
這種想法并不是空穴來風(fēng),而是基于語音交互技術(shù)自身的特點(diǎn)和發(fā)展來構(gòu)想的。
比起文字來說,語音識別的普遍適用性更強(qiáng),不管用戶識不識字,只要能說話,系統(tǒng)在識別之后,應(yīng)用基本就能聽懂他的需求并給予滿足。這樣的話,不管是老人、青年還是有小孩都能輕松使用。
而且如今的語音技術(shù)發(fā)展可謂日新月異,就拿人機(jī)交互領(lǐng)域的服務(wù)商歐拉蜜來說,識別的準(zhǔn)確率已經(jīng)達(dá)九成以上,應(yīng)用甚至能夠和用戶進(jìn)行稍微復(fù)雜的多輪對話。照這樣的發(fā)展速度,
在未來,人機(jī)交互會(huì)是一個(gè)普遍現(xiàn)象。所以,將語音技術(shù)植入可穿戴設(shè)備并不是幻想。
其次,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,萬事萬物皆可互聯(lián),用智能語音技術(shù)來統(tǒng)一操控設(shè)備是當(dāng)前的一個(gè)流行趨勢,如智能音箱等等。但人們不可能隨身攜帶智能音箱出門,擁有語音助手的手機(jī)和平板電腦也不是時(shí)刻都方便使用。
因此,將語音交互技術(shù)植入最為方便攜帶的可穿戴設(shè)備里,是一個(gè)雙贏的選擇。
想象一下,如果智能手表里植入了語音系統(tǒng),當(dāng)你想要打車的時(shí)候,或許不再需要掏出手機(jī),只要抬手說一句:幫我打個(gè)車,語音系統(tǒng)會(huì)迅速識別你的指令,幫你尋找附近的車輛。
同樣的,如果智能眼鏡里加入了語音交互系統(tǒng),那么當(dāng)你因?yàn)檫^度用眼而疲憊的時(shí)候,智能眼鏡就可以掃描文本,并且?guī)湍恪澳睢背鰜?。這樣的方式或許還可以適用于盲人讀者。加入智能語音,能給可穿戴設(shè)備帶來更多的可能性。
而且智能可穿戴設(shè)備形式多樣,手表、項(xiàng)鏈、眼鏡、服裝都可以作為載體,可以讓更多的人體驗(yàn)到語音交互的魅力,讓語音交互更加普及。
當(dāng)然,要講語音系統(tǒng)植入可穿戴設(shè)備,也就涉及到了一個(gè)現(xiàn)實(shí)的問題:語音識別與語言理解能力要非常優(yōu)秀。但現(xiàn)實(shí)中,人機(jī)交互往往還存在不少問題。
比如說話要靠近、發(fā)音要標(biāo)準(zhǔn)、環(huán)境要安靜、不能連續(xù)對話、不能打斷等等。如果解決不好的話,只會(huì)成為另一個(gè)可穿戴設(shè)備發(fā)展的障礙。
對此,國內(nèi)新興的語音服務(wù)商歐拉蜜有自己獨(dú)到的解決辦法。
為了能夠達(dá)到良好的識別效果,歐拉蜜應(yīng)用了最先進(jìn)的深度學(xué)習(xí)算法及神經(jīng)網(wǎng)絡(luò)模型的自動(dòng)語音識別技術(shù),建立了大量的聲學(xué)模型,能輕松識別各類人群的聲音。
同時(shí),通過深度學(xué)習(xí)處理各類環(huán)境噪音,可以讓用戶在不需要特別優(yōu)化音頻或者處理噪聲的情況下就能獲得良好的識別效果。即使在嘈雜的環(huán)境里也能聽得清,聽的懂。
在自然語言理解方面,歐拉蜜可以根據(jù)用戶上下文的關(guān)系來理解語義,能有效的消除歧義,推薦相應(yīng)的答復(fù)或信息數(shù)據(jù)。而且通過歐拉蜜專利技術(shù)的結(jié)構(gòu)化知識庫,能自動(dòng)處理句法糾錯(cuò)與同義詞等問題,并提供結(jié)構(gòu)化的答復(fù)信息,用戶可以輕松詢問如天氣、百科、音樂、地圖等領(lǐng)域的各種信息。
除此之外,歐拉蜜還提供語音喚醒和離線命令詞識別,即使沒有網(wǎng)絡(luò),只要通過指定的語音指令,也就是預(yù)先設(shè)置的喚醒詞,就能喚醒配備的智能硬件產(chǎn)品或者應(yīng)用。如果把這一功能加入可穿戴設(shè)備里,那么開啟設(shè)備的過程將大大簡化。
隨著人工智能技術(shù)的日新月異,技術(shù)不斷的更新迭代,未來在移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能AI的支持下,智能產(chǎn)品也將會(huì)不斷朝著解決用戶痛點(diǎn)的方向邁進(jìn)。如果還一味地固守自封,必然只能遭到市場的淘汰。
或許,攜手智能語音交互技術(shù),會(huì)是已經(jīng)開始沒落的智能可穿戴設(shè)備再次煥發(fā)生機(jī)的一次機(jī)遇?