智能語音識(shí)別何時(shí)能廣泛應(yīng)用
作為一個(gè)時(shí)代的代名詞,人工智能備受矚目,從世界范圍內(nèi)參與其中的知名公司就可窺見一斑。在80年代,以數(shù)理邏輯為核心的體制瓦解后,人工智能分化出了五大獨(dú)立學(xué)科。在這五大學(xué)科中,由深度學(xué)習(xí)推動(dòng),并順利從科研實(shí)驗(yàn)室走到人們身邊的智能語音,某種程度上承擔(dān)了人工智能這兩年的大部分熱度。智能語音在2016年被美國權(quán)威雜志《麻省理工科技評(píng)論》評(píng)為當(dāng)年的十大突破科技,根據(jù)易觀·工信部數(shù)據(jù),2017年中國語音產(chǎn)業(yè)規(guī)模就將突破百億。
說到智能語音就不能不提智能家居。在當(dāng)下的智能家居行業(yè),語音基于其交互的自然性,被認(rèn)為是未來人與家居交互的主要入口路徑,以致業(yè)內(nèi)普遍認(rèn)為,“以語音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。
作為人工智能應(yīng)用最成熟的技術(shù)之一,目前語音交互的核心環(huán)節(jié)也取得重大突破,語音識(shí)別環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場(chǎng)識(shí)別,到語音分析和語義理解有了重大突破,呈現(xiàn)一種整體的交互方案。自動(dòng)語音識(shí)別(ASR)和前端語音處理的最新發(fā)展已使得語音控制相當(dāng)成熟和有效。ASR引擎可以理解多種語言和口音,而語音生物辨識(shí)可用于辨識(shí)系統(tǒng)中預(yù)先登錄的特定用戶,以在智能家居環(huán)境中提供不同的權(quán)限。
不過,雖然大多數(shù)家居可以用語音開啟導(dǎo)航,進(jìn)行信息查詢,實(shí)現(xiàn)一些諸如空調(diào)、開燈等功能控制,但距離“以語音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”的理想仍然較遠(yuǎn)。目前的技術(shù)仍然限制在5公尺的范圍內(nèi),并且難以在多人同時(shí)交談或吵雜的環(huán)境中操作。
影響語音控制技術(shù)進(jìn)入到智能家居或其他應(yīng)用領(lǐng)域的原因很多,包括使用者的習(xí)慣是否被建立、是否提供更多“控制”功能以外的附加價(jià)值、是否有更“特別”的應(yīng)用出現(xiàn),以及安全性的問題。其中,安全性可說是消費(fèi)者最為關(guān)注的部分。
就像著名電影《蜘蛛俠》中的那句臺(tái)詞:“力量越大,責(zé)任越重。”語音識(shí)別能量越大,就越需要安全閥門。首先是聲紋的采集。不管是人工識(shí)別,還是依靠深度學(xué)習(xí)算法進(jìn)行自動(dòng)化識(shí)別,聲紋庫的建立都是進(jìn)行一切行動(dòng)的前提。當(dāng)前,公安的聲紋鑒別庫最全,但如果是企業(yè)要想研究聲紋識(shí)別,從公安處入手顯然不可能,因而,企業(yè)智能自行收集聲紋并建立聲紋庫,這是一項(xiàng)十分艱巨的任務(wù)。更重要的是,企業(yè)還要注意如何保障聲紋不被非法利用。
其次,我們都聽說過“無用輸入,無用輸出”的說法,但你想過這句話同樣適用于負(fù)責(zé)業(yè)務(wù)的語音識(shí)別嗎?企業(yè)是否有建立污染數(shù)據(jù)安全策略(它能確保攻擊者不會(huì)利用篡改過的數(shù)據(jù)欺騙人工智能并讓它推薦錯(cuò)誤的決策)嗎?如果設(shè)備根據(jù)錯(cuò)誤的數(shù)據(jù)做出了錯(cuò)誤的決策,那么,企業(yè)需要多長(zhǎng)時(shí)間才能發(fā)現(xiàn)?數(shù)據(jù)污染已經(jīng)是網(wǎng)絡(luò)安全世界中的一個(gè)關(guān)注點(diǎn)。例如,反惡意軟件根據(jù)多重來源提交的標(biāo)記和樣本進(jìn)行工作,而反惡意軟件供應(yīng)商必須保持警惕,防止攻擊者愚弄這一系統(tǒng)。
盡管如此,與其他生物特征相比,聲紋識(shí)別的應(yīng)用仍然具有特殊優(yōu)勢(shì),比如聲紋提取可在不知不覺中完成,因此使用者的接受程度也相對(duì)較高目前,聲紋識(shí)別在全球市場(chǎng)中的占有率達(dá)到15.8%,僅次于指紋和掌紋識(shí)別,并呈現(xiàn)出不斷上升的趨勢(shì),因此,我們有理由相信,聲紋識(shí)別或?qū)⒊蔀檎Z音交互的下一個(gè)風(fēng)口。
結(jié)語:在今天這個(gè)快節(jié)奏的社會(huì)中,語音識(shí)別技術(shù)的誕生,可以說是一次偉大的技術(shù)變革。隨著高質(zhì)量數(shù)據(jù)的不斷積累、技術(shù)的不斷突破及硬件平臺(tái)算力的提升,語音識(shí)別正在向我們期待的方向快速發(fā)展。