2019年語音識別技術(shù)行業(yè)市場發(fā)展現(xiàn)狀分析
(文章來源:前瞻網(wǎng))
語音識別以語音為研究對象,它是語音信號處理的一個重要研究方向,是模式識別的一個分支,涉及到生理學(xué)、心理學(xué)、語言學(xué)、計算機科學(xué)以及信號處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語言(如人在說話時的表情、手勢等行為動作可幫助對方理解),其最終目標是實現(xiàn)人與機器進行自然語言通信。
中國語音識別研究工作一直緊跟國際水平,國家也很重視,并把大詞匯量語音識別的研究列入“863”計劃,由中科院聲學(xué)所、自動化所及北京大學(xué)等單位研究開發(fā)。自上世紀四五十年代以來,經(jīng)過長時間的探索實踐,聲紋識別技術(shù)終于逐漸走向成熟,迎來了歷史上最佳的應(yīng)用發(fā)展期。2018年全球語音識別技術(shù)市場規(guī)模達6.83億美元。
2018年可以說是語音識別邁向產(chǎn)業(yè)化的分水嶺,其標志性事件莫過于中國人民銀行頒布的《移動金融基于聲紋識別安全應(yīng)用技術(shù)規(guī)范》。這是我國金融行業(yè)第一個生物識別技術(shù)標準,其影響之深之廣,遠超預(yù)期。它不僅為聲紋識別技術(shù)進入金融領(lǐng)域突破了標磚難題,也為多年來一直堅持初心的業(yè)界同仁注入了一針強心劑,2018年因此被稱之為“聲紋元年”。
據(jù)了解,這一標準由中國建設(shè)銀行、清華大學(xué)、北京得意音通技術(shù)有限責(zé)任公司發(fā)起,歷時3年研證,由央行批準頒布。標準修訂期間,在央行科技司主導(dǎo)下,發(fā)起單位聯(lián)合工、農(nóng)、中、交等國內(nèi)各大銀行,國家級測評機構(gòu)及第三方支付平臺等共同對標準報批稿進行了進一步完善。這是央行頒布的我國金融行業(yè)第一個生物識別技術(shù)標準。
對于技術(shù)的要求和管理,央行也給出了嚴格的劃定。據(jù)介紹,標準中重點在幾個方面做了強調(diào):功能方面,明確了聲紋注冊、驗證、變更、注銷等環(huán)節(jié)的基本需求;性能方面,提出了采樣、抗噪音、防攻擊、抗時變等技術(shù)要求;安全方面,對聲紋信息采集、傳輸、存儲、處理、刪除等全生命周期進行了規(guī)范。
從時間軸上可以看出,聲紋識別行業(yè)市場競爭大致可以分為三個階段:2000年前后:第一批公司成立,主要是老牌語音廠商。2005年前后:第二批公司成立,主要是深耕聲紋的專業(yè)廠商。2015年前后:第三批公司成立,主要是貼著AI標簽的創(chuàng)業(yè)公司。最近兩年,BAT等大公司也相繼在聲紋領(lǐng)域開始布局。
2018年5月,花旗銀行宣布正式在中國市場推出“聲紋驗證”服務(wù),其技術(shù)供應(yīng)商曾為蘋果提供Siri技術(shù)支持的國際語音行業(yè)老牌廠商Nuance。之后,ValidSoft、Nice等外企開始進入中國金融業(yè)市場,但市場份額有限,總體來看,國內(nèi)金額市場的深紋供應(yīng)商里,以得意通為代表的中資企業(yè)占有絕對優(yōu)勢。