當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 物聯(lián)網(wǎng)技術(shù)文庫
[導(dǎo)讀] 通過語音控制技術(shù),更多型式的智能裝置得以在家中的生活空間取得更大的地位,更多物聯(lián)網(wǎng)裝置得以更容易地進(jìn)入家庭領(lǐng)域。未來,離線語音以及離線加在線語音等多種語音形式,將更加廣泛地應(yīng)用于智能家居、智能辦

通過語音控制技術(shù),更多型式的智能裝置得以在家中的生活空間取得更大的地位,更多物聯(lián)網(wǎng)裝置得以更容易地進(jìn)入家庭領(lǐng)域。未來,離線語音以及離線加在線語音等多種語音形式,將更加廣泛地應(yīng)用于智能家居、智能辦公等多種場景。

現(xiàn)在“會說話”的公共設(shè)施會越來越多,未來每一個空間都至少會有一個可以進(jìn)行語音交互的觸點。語音技術(shù)的需求也隨之提高,在線語音后的離線語音技術(shù)被視為智能家居新的增長引擎便不足為奇了。

智能語音是智能家居的起點

國外的IT巨頭已先后以智能家庭產(chǎn)品與語音相結(jié)合的方式進(jìn)入智能家庭領(lǐng)域:

·谷歌收購NEST布局智能家庭,不斷強(qiáng)化GoogleNow的語音入口;

·蘋果HomeKit智能家居平臺與Siri也不斷加強(qiáng)融合;

·微軟也發(fā)布了語音助手Cortana,為它在智能家庭領(lǐng)域擴(kuò)展交互入口。

而國內(nèi)2014年語音巨頭科大訊飛就宣布進(jìn)軍智能家庭市場,并發(fā)布了智能語音助手靈犀3.0來操控智能家居設(shè)備。

由于整個市場的價格競爭比較激烈,基于智能音箱通過藍(lán)牙mesh的方式推廣的智能音箱中心化控制的語音聲控類的產(chǎn)品價格競爭尤其明顯,利潤逐步被稀釋。無論是Google、Apple或是微軟等平臺業(yè)者,透過語音控制技術(shù)讓更多型式的智能裝置能在家中的生活空間取得更大的地位,讓更多物聯(lián)網(wǎng)裝置更容易進(jìn)入家庭的領(lǐng)域。所以語音助理的應(yīng)用不僅為家庭生活帶來更多的驚奇,也進(jìn)而帶動智能家居在目前有較明顯的進(jìn)展。

語音控制中的不良反饋

①智能音箱通過網(wǎng)絡(luò)在云端識別反饋的控制速度比較慢,通常網(wǎng)絡(luò)一般的情況下反饋時長為300—500ms,網(wǎng)絡(luò)情況良好的情況下也有300ms左右。

②智能音箱通過半徑3米—5米內(nèi)才可以語音控制其他設(shè)備。假設(shè)智能音箱放在客廳,那控制臥室的燈必須要在客廳實現(xiàn),如果身處臥室想控制臥室的燈就比較麻煩。

③絕大多數(shù)的云端識別都會在后臺錄音,相當(dāng)于用戶在家里不知不覺的情況下聲音的隱私已經(jīng)被侵犯,并上傳到云端做了保存。這點在歐美和日本客戶那里的反饋比較明顯,國人也對聲音的隱私開始重視起來。

市場成熟后的需求變化

目前,智能家居已經(jīng)進(jìn)入市場推廣階段,并且有很多成熟項目不斷落地,行業(yè)發(fā)展前景可謂是日趨明朗。但是隨著智能門鈴、智能貓眼、智能廚房電器以及睡眠跟蹤記錄傳感器等設(shè)備的廣泛應(yīng)用,現(xiàn)在智能家居甚至已經(jīng)延伸到家庭中最私密的區(qū)域。

智能家居技術(shù)給人們?nèi)粘I顜砹藰O大的便利,比如讓你知道加熱器是否打開或門有沒有上等等,但這些連接的設(shè)備也帶來了許多安全問題。語音控制作為智能家居入口,在控制過程中牽涉到網(wǎng)絡(luò)傳輸?shù)牟糠郑瑢τ谥悄芗揖酉到y(tǒng)是否安全起到至關(guān)重要的作用。

智能語音后的離線語音

離線的簡單語音控制應(yīng)用在這幾個問題上得到了有效的解決,通常家電和小家電的應(yīng)用場景的控制也只有幾個功能性動作就能解決。應(yīng)用場景就是切入到用戶的這個需求點,分布式地提供給用戶單個產(chǎn)品的針對性的聲音控制。不需要基于手機(jī)、智能音箱和網(wǎng)絡(luò)就可以通過聲音進(jìn)行控制。

·TOC領(lǐng)域包括高性價比智能音箱、全雙工網(wǎng)絡(luò)電話、AIOT智能家電、后裝車載智能語音助手等。家電控制(空調(diào)、洗衣機(jī)、冰洗、熱水器、風(fēng)扇等)并支持分布式語音控制和聯(lián)動。

在網(wǎng)絡(luò)狀況不好或者沒有網(wǎng)絡(luò)的情況下,可以使用基礎(chǔ)控制的本地命令詞進(jìn)行離線控制。

·TOB領(lǐng)域包括酒店智能語音助手(云端語義針對酒店服務(wù)應(yīng)用可定制化,如:客房服務(wù)、訂餐服務(wù))包括可植入酒店空調(diào)、酒店控制面板、酒店客房電話等設(shè)備應(yīng)用。智能校園宿舍管理(云端可針對宿舍房間號定點推送上課通知、語音控制、網(wǎng)絡(luò)電話等)。

實際上,全屋智能的控制類產(chǎn)品都是離線語音的主戰(zhàn)場。離線主打控制,在線主打交互,是目前智能家居落地比較親民的一種模式。

各家不同的離線語音方案

·啟英泰倫:

CI110X 系列基于 NPU+MCU 架構(gòu)設(shè)計,內(nèi)置升級了的腦神經(jīng)網(wǎng)絡(luò)處理器 BNPU v2,并新增了語音加速傳感器。CPU 主頻也較上一代的 100 MHz 提升到了 160MHz。

同時該芯片還集成多路 UART、I2C、SPI、PWM、GPIO 等外圍控制接口,可以開發(fā)低成本的單芯片智能語音離線識別方案?;?CI110X 系列芯片開發(fā)的產(chǎn)品,語音交互的基本功能可通過離線語音實現(xiàn),而語音內(nèi)容和服務(wù)則可以通過聯(lián)網(wǎng)實現(xiàn)。

·杭州國芯:

GX8008芯片是專為智能語音前端信號處理而設(shè)計的嵌入式SoC芯片,支持麥克風(fēng)陣列,集成專用于語音信號處理的DSP處理器,內(nèi)置處理前端信號的語音算法,可以讓傳統(tǒng)的設(shè)備保留其原先硬件的基礎(chǔ)上,通過一個簡單的USB口實現(xiàn)語音能力的升級。

GX8009芯片是專為AI語音應(yīng)用設(shè)計的嵌入式SoC芯片,擁有獨特的多核異構(gòu)架構(gòu),集成自主產(chǎn)權(quán)的NPU神經(jīng)網(wǎng)絡(luò)處理器,用于語音信號處理的DSP處理器等模塊,使得產(chǎn)品能處理深度神經(jīng)網(wǎng)絡(luò)計算,離線運行麥克風(fēng)陣列信號。

·思必馳:

TH1520主要面向智能家居、智能終端、車載、手機(jī)、可穿戴設(shè)備等各類終端設(shè)備。解決方案包含算法+芯片,具有完整語音交互功能,能實現(xiàn)語音處理、語音識別、語音播報等功能,支持離線語音交互。

·君正:

采用君正 X1000E 處理器,最高1GHz主頻,支持硬件浮點,支持SIMD指令加速??蛇\行各類語音識別、圖像識別、降噪、消回音、APE/FLAC解碼等算法。待機(jī)功耗2mW,平均運行功耗200mW,最高運行功耗700mW。

·互問:

LS416 是一顆高度集成化的語音處理芯片,內(nèi)置互問離線語音識別引擎,支持多命令詞本地語音控制應(yīng)用。 內(nèi)置spi flash 和高性能codec,使用低成本輕量化神經(jīng)網(wǎng)絡(luò)語音處理單元,以及低功耗MCU,支持多種邏輯應(yīng)用開發(fā)。

W02x芯片是一款高度集成的本地語音系統(tǒng)級芯片(SoC),自研基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的本地喚醒和前端降噪算法,無需額外license。

離線語音技術(shù)需克服重重困難

離線語音解決的基本問題包括本地語音識別、本地計算、部分的數(shù)據(jù)訓(xùn)練。相應(yīng)的,對于硬件的要求就是低功耗、低成本、快速響應(yīng)。

由于語音交互類的設(shè)備本身在產(chǎn)品形態(tài)上差異化很大,使用場景也呈現(xiàn)出碎片化的特點,要為用戶提供自然的本地語音交互體驗,就要對不同的產(chǎn)品做出不同的語音控制命令,這些都需要通過修改代碼實現(xiàn),工作量可想而知。

再進(jìn)一步的讓設(shè)備達(dá)到用戶所需要的體驗,還要做效果調(diào)優(yōu)的工作,這就需要熟練的工程師??偠灾怯胁簧匍_發(fā)門檻和開發(fā)成本的。

結(jié)尾:

到2023年,21%將擁有遠(yuǎn)程監(jiān)控和控制,設(shè)備支出將占智能家居設(shè)備總支出的52%。未來,離線語音以及離線加在線語音等多種語音形式,將更加廣泛地應(yīng)用于智能家居、智能辦公等多種場景。

智能家居以家庭為單元,運用多種信息技術(shù),達(dá)到監(jiān)控與信息交互的目的,在未來,居住更加智能、消費者的居住體驗更加舒適,一場由語音交互的變革看起來勢在必行了。

來源:維科號

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉