自然語言交互技術(shù)植入到可穿戴設(shè)備是否可行

時(shí)間：2020-05-11 08:27:01

關(guān)鍵字：智能手表可穿戴設(shè)備智能可穿戴設(shè)備語音技術(shù)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 如同時(shí)尚一樣，科技的每一次進(jìn)步，都會(huì)掀起一場(chǎng)產(chǎn)品變革的颶風(fēng)，從某一處出發(fā)，然后迅速席卷全球。智能可穿戴設(shè)備的流行便是如此。從日常使用的智能手環(huán)、智能手表、到高端的智能眼鏡、智能珠寶，再

如同時(shí)尚一樣，科技的每一次進(jìn)步，都會(huì)掀起一場(chǎng)產(chǎn)品變革的颶風(fēng)，從某一處出發(fā)，然后迅速席卷全球。智能可穿戴設(shè)備的流行便是如此。

從日常使用的智能手環(huán)、智能手表、到高端的智能眼鏡、智能珠寶，再到別具一格的智能T恤、智能手套等等，智能可穿戴設(shè)備已經(jīng)占領(lǐng)了我們的生活。

據(jù)國(guó)際數(shù)據(jù)公司（IDC）預(yù)計(jì)，整個(gè)可穿戴設(shè)備市場(chǎng)的出貨量將從今年的1.132億件增加到2021年的約2.223億件，前景無限。但在整個(gè)市場(chǎng)欣欣向榮的同時(shí)，陰影也隨之逼近。

在經(jīng)過2015年的大爆發(fā)之后，智能手表不但沒有應(yīng)廠商的期望，成為人手一只的潮流，出貨量反而開始大幅下降，一些老牌的可穿戴設(shè)備比如智能手環(huán)鼻祖Jawbone則破產(chǎn)倒閉，整個(gè)行業(yè)更是被預(yù)測(cè)未來四年都將不會(huì)出現(xiàn)明顯的增長(zhǎng)。

那些被媒體熱炒的產(chǎn)品諸如智能服裝、智能珠寶等，更像是業(yè)內(nèi)一場(chǎng)狂歡獨(dú)角戲，真正推廣向大眾結(jié)果還未可知。智能可穿戴設(shè)備似乎進(jìn)入了一個(gè)緩和的瓶頸期，要想走出困境，繼續(xù)高歌猛進(jìn)，或許需要一個(gè)與眾不同的突破點(diǎn)。

在此背景下，近些年一直在進(jìn)步的語音交互技術(shù)，就成為了眾多廠商的關(guān)注點(diǎn)。并提出了一種新的想法：將自然語言交互技術(shù)植入到可穿戴設(shè)備中。

這種想法并不是空穴來風(fēng)，而是基于語音交互技術(shù)自身的特點(diǎn)和發(fā)展來構(gòu)想的。

比起文字來說，語音識(shí)別的普遍適用性更強(qiáng)，不管用戶識(shí)不識(shí)字，只要能說話，系統(tǒng)在識(shí)別之后，應(yīng)用基本就能聽懂他的需求并給予滿足。這樣的話，不管是老人、青年還是有小孩都能輕松使用。

而且如今的語音技術(shù)發(fā)展可謂日新月異，就拿人機(jī)交互領(lǐng)域的服務(wù)商歐拉蜜來說，識(shí)別的準(zhǔn)確率已經(jīng)達(dá)九成以上，應(yīng)用甚至能夠和用戶進(jìn)行稍微復(fù)雜的多輪對(duì)話。照這樣的發(fā)展速度，

在未來，人機(jī)交互會(huì)是一個(gè)普遍現(xiàn)象。所以，將語音技術(shù)植入可穿戴設(shè)備并不是幻想。

其次，隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展，萬事萬物皆可互聯(lián)，用智能語音技術(shù)來統(tǒng)一操控設(shè)備是當(dāng)前的一個(gè)流行趨勢(shì)，如智能音箱等等。但人們不可能隨身攜帶智能音箱出門，擁有語音助手的手機(jī)和平板電腦也不是時(shí)刻都方便使用。

因此，將語音交互技術(shù)植入最為方便攜帶的可穿戴設(shè)備里，是一個(gè)雙贏的選擇。

想象一下，如果智能手表里植入了語音系統(tǒng)，當(dāng)你想要打車的時(shí)候，或許不再需要掏出手機(jī)，只要抬手說一句：幫我打個(gè)車，語音系統(tǒng)會(huì)迅速識(shí)別你的指令，幫你尋找附近的車輛。

同樣的，如果智能眼鏡里加入了語音交互系統(tǒng)，那么當(dāng)你因?yàn)檫^度用眼而疲憊的時(shí)候，智能眼鏡就可以掃描文本，并且?guī)湍恪澳睢背鰜怼＿@樣的方式或許還可以適用于盲人讀者。加入智能語音，能給可穿戴設(shè)備帶來更多的可能性。

而且智能可穿戴設(shè)備形式多樣，手表、項(xiàng)鏈、眼鏡、服裝都可以作為載體，可以讓更多的人體驗(yàn)到語音交互的魅力，讓語音交互更加普及。

當(dāng)然，要講語音系統(tǒng)植入可穿戴設(shè)備，也就涉及到了一個(gè)現(xiàn)實(shí)的問題：語音識(shí)別與語言理解能力要非常優(yōu)秀。但現(xiàn)實(shí)中，人機(jī)交互往往還存在不少問題。

比如說話要靠近、發(fā)音要標(biāo)準(zhǔn)、環(huán)境要安靜、不能連續(xù)對(duì)話、不能打斷等等。如果解決不好的話，只會(huì)成為另一個(gè)可穿戴設(shè)備發(fā)展的障礙。

對(duì)此，國(guó)內(nèi)新興的語音服務(wù)商歐拉蜜有自己獨(dú)到的解決辦法。

為了能夠達(dá)到良好的識(shí)別效果，歐拉蜜應(yīng)用了最先進(jìn)的深度學(xué)習(xí)算法及神經(jīng)網(wǎng)絡(luò)模型的自動(dòng)語音識(shí)別技術(shù)，建立了大量的聲學(xué)模型，能輕松識(shí)別各類人群的聲音。

同時(shí)，通過深度學(xué)習(xí)處理各類環(huán)境噪音，可以讓用戶在不需要特別優(yōu)化音頻或者處理噪聲的情況下就能獲得良好的識(shí)別效果。即使在嘈雜的環(huán)境里也能聽得清，聽的懂。

在自然語言理解方面，歐拉蜜可以根據(jù)用戶上下文的關(guān)系來理解語義，能有效的消除歧義，推薦相應(yīng)的答復(fù)或信息數(shù)據(jù)。而且通過歐拉蜜專利技術(shù)的結(jié)構(gòu)化知識(shí)庫(kù)，能自動(dòng)處理句法糾錯(cuò)與同義詞等問題，并提供結(jié)構(gòu)化的答復(fù)信息，用戶可以輕松詢問如天氣、百科、音樂、地圖等領(lǐng)域的各種信息。

除此之外，歐拉蜜還提供語音喚醒和離線命令詞識(shí)別，即使沒有網(wǎng)絡(luò)，只要通過指定的語音指令，也就是預(yù)先設(shè)置的喚醒詞，就能喚醒配備的智能硬件產(chǎn)品或者應(yīng)用。如果把這一功能加入可穿戴設(shè)備里，那么開啟設(shè)備的過程將大大簡(jiǎn)化。

隨著人工智能技術(shù)的日新月異，技術(shù)不斷的更新迭代，未來在移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能AI的支持下，智能產(chǎn)品也將會(huì)不斷朝著解決用戶痛點(diǎn)的方向邁進(jìn)。如果還一味地固守自封，必然只能遭到市場(chǎng)的淘汰。

或許，攜手智能語音交互技術(shù)，會(huì)是已經(jīng)開始沒落的智能可穿戴設(shè)備再次煥發(fā)生機(jī)的一次機(jī)遇？