當(dāng)前位置:首頁 > 消費(fèi)電子 > 音視頻及家電
[導(dǎo)讀] (文章來源:雷科技) ? ? ?? 從2011年蘋果在iPhone 4S上集成Siri開始算起,語音助手在智能手機(jī)上已經(jīng)出現(xiàn)快十年了。隨著語音識別、AI技術(shù)的日益成熟,如今這項(xiàng)功能在手機(jī)已經(jīng)

(文章來源:雷科技)
? ? ?? 從2011年蘋果在iPhone 4S上集成Siri開始算起,語音助手在智能手機(jī)上已經(jīng)出現(xiàn)快十年了。隨著語音識別、AI技術(shù)的日益成熟,如今這項(xiàng)功能在手機(jī)已經(jīng)完全普及,并且延展到了智能電視、智能家居等領(lǐng)域中,它的未來前景也被無限看好。實(shí)際上,語音AI技術(shù)帶來的功能也不再局限于簡單的虛擬助理,發(fā)展出了語音輸入、語音翻譯等更多實(shí)用的應(yīng)用,它對我們生活的滲透進(jìn)了方方面面。

蘋果語音助手Siri剛剛推出時,曾經(jīng)引起過一陣不小的熱潮。當(dāng)時甚至有民間開發(fā)者制作出了相應(yīng)的Cydia插件,讓沒有得到官方支持的iOS設(shè)備,也能在越獄后用上語音助手功能。語音助手通過語音來實(shí)現(xiàn)人機(jī)交互,并且具備虛擬助理的功能,這種形式當(dāng)時顯得非常新穎,一下子引起了很多用戶的好奇心。

蘋果開了頭,加上市場需求的強(qiáng)烈驅(qū)動下,其他科技廠商也紛紛發(fā)力語音助手功能。2011年,谷歌在Chrome瀏覽器的搜索引擎中加入了語音搜索功能,以滿足廣大使用者語音輸入的需求。2013年,微軟的語音助手Cortana在Windows Phone系統(tǒng)上線。Cortana展現(xiàn)出了微軟在語音識別領(lǐng)域多年累積的技術(shù)優(yōu)勢,就使用體驗(yàn)而言,“小娜”的語音效果極為接近真人發(fā)聲,幾乎能達(dá)到以假亂真的效果,一下子擁有了無數(shù)擁躉。

與此同時,國內(nèi)的語音AI公司也在積極推出類似的產(chǎn)品。例如科大訊飛就推出過語音助手App,而且它也是魅族、OPPO等國產(chǎn)手機(jī)廠商的合作商,很多用戶手機(jī)上的語音助手或智能助理都在用科大訊飛的語音識別技術(shù)。

不過,當(dāng)語音助手在手機(jī)上快速普及并且日漸成熟時,大家對它的熱情卻似乎在慢慢退卻。就我個人的體驗(yàn)而言,在公開場合極少能看到有人用手機(jī)的語音助手功能,盡管越來越多的廠商在大幅度地提升語音助手的優(yōu)先級,比如增加獨(dú)立的AI實(shí)體按鍵,把AI語音助理的開關(guān)放在桌面顯眼的位置等。

很多人包括我自己在內(nèi),不喜歡用語音助手,原因要么是不好用要么是不方便用?,F(xiàn)在主流語音助手的語音識別能力普遍比較強(qiáng),但仍然會有翻車的情況發(fā)生,尤其當(dāng)環(huán)境比較嘈雜、語音語義存在歧義(也可能是普通話發(fā)音不準(zhǔn))的情況下。很多時候,直接手動操作,會比呼出語音助手幫忙方便不少。

不方便用,就很好理解了。在公開場合下用語音助手,一方面要克服在大庭廣眾下對著手機(jī)說話的羞恥感,另一方面要可能要顧及自己的隱私不被暴露。就現(xiàn)在來說,智能手機(jī)相當(dāng)普及,我們對這種必需品的操作熟練度已經(jīng)非常高,很多時候不太需要語音這種交互形式來實(shí)現(xiàn)各項(xiàng)功能。這種情況下,手機(jī)上的語音功能有時候的確會給人一種比較雞肋的感覺。

語音AI技術(shù)并沒有止步于智能手機(jī),而是拓展到了其他產(chǎn)品上。現(xiàn)在,不管是智能音箱,還是智能電視,以及各類層出不窮的智能硬件產(chǎn)品,只要被冠于“智能”這個頭銜,就少不了語音控制的功能。有意思的是,到了家庭環(huán)境中,語音AI技術(shù)的優(yōu)勢似乎被更加充分地釋放出來了。更加私密的場景下,我們使用語音交互的意愿被大大增強(qiáng)。在相對封閉的環(huán)境下,用戶不用擔(dān)心隱私的問題,心理防備也會降低,自然嘗試語音交互的可能性也會增加。

像電視音箱這類產(chǎn)品,傳統(tǒng)的操控工具無非是實(shí)體按鍵或者遙控器。相比之下,語音的優(yōu)勢在于解放了使用者的雙手。家庭環(huán)境里,用戶在做家務(wù)等騰不開手的場景下,直接用語音命令來實(shí)現(xiàn)影音播放、家居控制等功能,無疑極大地提升了效率,使用體驗(yàn)也更進(jìn)一步。

近年,不管是智慧屏還是部分品牌的高端電視,都增強(qiáng)了大屏設(shè)備的拾音效果,通過增加收音麥克風(fēng)等方式,讓用戶隨時隨地都能喚醒作為智能控制中樞的電視設(shè)備。目前業(yè)界普遍認(rèn)為,未來5G、大寬帶的普及,以及AI技術(shù)的進(jìn)一步發(fā)展,會把我們帶入到一個萬物互聯(lián)的時代。

當(dāng)所有我們能接觸到的電器、設(shè)備都能連上網(wǎng)并且具有智能功能后,如何方便地操控它們,會成為最關(guān)鍵的問題。目前來看,語音是學(xué)習(xí)成本最低、使用最為便捷的交互方式。5G、AI、IoT、萬物互聯(lián)……關(guān)于未來,有點(diǎn)野心的科技廠商都不想錯過,蘋果、谷歌、小米等公司,不斷加強(qiáng)語音AI技術(shù)在手機(jī)系統(tǒng)中的存在感,很大程度上是在提前布局,持續(xù)培養(yǎng)用戶習(xí)慣,讓目標(biāo)群體在不知不覺中,融入廠商建立的生態(tài)圈中。

另外,不可否認(rèn)的是,對部分特定人群而言,語音AI相關(guān)技術(shù)在推動移動互聯(lián)網(wǎng)和智能生活上,發(fā)揮著舉足輕重的作用。對很多“高齡”用戶來說,在手機(jī)上用虛擬鍵盤打字,學(xué)習(xí)成本太高、難度太大。也正因?yàn)槿绱?,很多長輩在聊微信時,非常喜歡發(fā)送一長段一長段的語音信息,這讓很多人不勝其煩,恨不得讓微信砍掉語音功能。

但現(xiàn)在,微信等社交應(yīng)用,以及部分第三方輸入法,已經(jīng)支持語音輸入功能,可以把語音轉(zhuǎn)成文字。以目前的技術(shù)水平來看,主流語音輸入的識別準(zhǔn)確率和可用性已經(jīng)相當(dāng)高。像智能手表等小屏設(shè)備,語音控制很多時候也比觸控操作要方便得多。

此外,對部分視覺障礙人群而言,語音AI技術(shù)的發(fā)展,很大程度上降低了他們使用智能設(shè)備、享受移動互聯(lián)網(wǎng)生活的門檻。我們之前曾經(jīng)測試過一些日常生活中的主流應(yīng)用,通過語音和實(shí)體按鍵交互,盲人群體也能比較方便地完成很多操作、使用不少功能。

不管你愿不愿意接受,近年互聯(lián)網(wǎng)技術(shù)的發(fā)展,是一個不斷侵占用戶隱私空間的過程。即使是向來標(biāo)榜尊重用戶隱私的蘋果,也在2019年被曝出隱私問題,Siri上傳的用戶語音數(shù)據(jù),可能會被人工獲取和分析。隱私和技術(shù)之間的平衡,對研發(fā)語音AI的公司來說也是一個難題。理論上來說,想讓語音功能變得更加好用和智能,必然需要對用戶的語音數(shù)據(jù)進(jìn)行分析和優(yōu)化。而關(guān)鍵問題在于,這些被收集的信息,被泄露、非法利用的可能性有多大。

去年,咨詢公司埃森哲曾對中國用戶進(jìn)行過一次調(diào)查。數(shù)據(jù)顯示,中國用戶對語音助手的滿意度高達(dá)97%,但信任度依然不高。中國用戶對語音助手的最主要的擔(dān)憂分別為安全顧慮、用戶需求不被理解和隱私。而且,在發(fā)生過網(wǎng)絡(luò)攝像頭被竊取、開房數(shù)據(jù)被販賣等負(fù)面事情后,國內(nèi)消費(fèi)者對隱私問題的警惕性并不低。

2018年,歐盟通過了史上最嚴(yán)苛的個人數(shù)據(jù)保護(hù)條例GDPR,明確了用戶對個人數(shù)據(jù)擁有絕對的掌控權(quán),對企業(yè)違規(guī)的懲罰也極重,最低罰款1000億歐元。站在用戶角度來看,這可能是好事,能遏制住企業(yè)對用戶數(shù)據(jù)濫用和對隱私的侵犯行為。但是,過于嚴(yán)格的限制,也會讓科技公司在推動語音AI等需要用到大數(shù)據(jù)的技術(shù)進(jìn)步上,面臨更大的困難。

如果把眼光放得更加長遠(yuǎn)的話,我們相信,未來科技生活中,語音在人機(jī)交互中的重要性將會大大增強(qiáng),在智能家居等場景下,甚至?xí)蔀樽钪饕牟僮鞣绞?。只是,在這個過程中,我們希望自己的個人數(shù)據(jù),也能得到更加妥善的處理。
? ??

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉