小米電視4A核心技術(shù)之語音識(shí)別淺析
大屏電視成流量入口,語音識(shí)別成核心競爭力。近年來,大屏智能電視市場銷量持續(xù)走俏,基于語音識(shí)別功能的互聯(lián)網(wǎng)電視更是備受消費(fèi)者青睞,小米電視4A便是其中之一。
據(jù)有關(guān)數(shù)據(jù)發(fā)布的2017W15液晶電視線上零售額排名統(tǒng)計(jì)顯示,近幾周小米電視銷量持續(xù)排名第一,相關(guān)人士認(rèn)為,小米電視近幾周之所以穩(wěn)居銷冠寶座,這與近段時(shí)間發(fā)布的小米電視4A所具備的人工智能語音功能有關(guān)。
有人認(rèn)為,小米電視4A人工智能語音識(shí)別功能解決最大的痛點(diǎn)就是老人和小孩的節(jié)目難搜索問題,但在精準(zhǔn)識(shí)別技術(shù)上并未達(dá)到100%識(shí)別,而這也是目前市面上人工智能語音識(shí)別領(lǐng)域的一大通病難題。
精準(zhǔn)度雖未達(dá)100%,但在智能電視行業(yè)中,小米電視4A的語音識(shí)別技術(shù)仍走在前列。
前不久,小米電視4A的發(fā)布會(huì)上,小米王川進(jìn)行了現(xiàn)場演示,分別從5個(gè)等級測試詮釋了人工智能語音識(shí)別技術(shù)的魅力和不足點(diǎn)。其主要魅力特點(diǎn)表現(xiàn)在完美實(shí)現(xiàn)了前4個(gè)等級測試:元素拼加類型的搜索、模糊形容搜索、混亂人物關(guān)系排序、根據(jù)內(nèi)容跳轉(zhuǎn)電影,但在第5個(gè)等級測試中用“同音詞語”指令識(shí)別失誤時(shí)展示了語音識(shí)別的缺陷。
現(xiàn)在智能電視大部分都已進(jìn)軍人工智能語音電視領(lǐng)域,雖然在技術(shù)識(shí)別精準(zhǔn)實(shí)現(xiàn)上有所差異,但在技術(shù)邏輯上卻如出一轍。
以小米電視為例,當(dāng)我們通過小米電視4A的語音識(shí)別系統(tǒng)發(fā)送語音控制指令時(shí)候,電視系統(tǒng)收集信號(hào)后,通過其自身的模擬數(shù)據(jù)預(yù)處理,將其轉(zhuǎn)換為數(shù)字語音信號(hào),再根據(jù)模塊需求將數(shù)字語音信號(hào)數(shù)據(jù)發(fā)送至云端,經(jīng)由云端語音識(shí)別分析處理并發(fā)送控制指令給到云端,這樣我們就可以通過語音來控制電視機(jī)收看想要的媒體視頻內(nèi)容。
小米電視4a的高精準(zhǔn)語音識(shí)別與電視系統(tǒng)的模塊設(shè)計(jì)完善程度密不可分,據(jù)了解,人工智能語音電視系統(tǒng)結(jié)構(gòu)分為三個(gè)模塊。
模塊一:語音識(shí)別系統(tǒng)
這一模塊主要是將電視收集到的模擬語音信號(hào)轉(zhuǎn)換成云端的數(shù)字語音信號(hào)。這一階段所利用到的語音IC處理技術(shù)能夠幫助模擬信號(hào)進(jìn)行預(yù)處理,然后再通過語音波形的特征參數(shù)抓取反饋至電視操作系統(tǒng)。
圖片為中文的小詞匯量孤立詞語音識(shí)別波形圖,來源:網(wǎng)絡(luò)
模塊二:電視系統(tǒng)處理
電視系統(tǒng)是連接語音識(shí)別系統(tǒng)和云端處理系統(tǒng)的橋梁。在接入互聯(lián)網(wǎng)狀態(tài)下,電視系統(tǒng)通過接收語音并對其進(jìn)行預(yù)處理,針對特定電視系統(tǒng)則擁有特定模塊特征,將模塊特征和語音數(shù)據(jù)傳輸至云端。
模塊三:云端處理系統(tǒng)
正如馬云所說:“人算不如天算,天算就是云計(jì)算”。云端處理系統(tǒng)就是通過云計(jì)算對數(shù)字語音數(shù)據(jù)進(jìn)行分析處理,并進(jìn)行云端智能識(shí)別,以此來完成相應(yīng)語音指令功能。
分析人士認(rèn)為,智能電視的語音識(shí)別技術(shù)在今后仍然會(huì)是眾多智能電視品牌的核心競爭力,除此之外,諸如VR等場景應(yīng)用也將成為智能電視重要入口。