靈云科技訊:7月21日,捷通華聲靈云聲紋識別技術重磅出擊,劍指身份認證等安全領域,致力全面推動聲紋識別技術產(chǎn)業(yè)化進程。
靈云聲紋識別(VPR)技術采用國際最先進的第二代i-vector算法,聲紋模型大小僅有2K字節(jié),占用存儲空間非常小,可實現(xiàn)大規(guī)模聲紋采集、存儲和檢索。靈云聲紋識別技術準確率高,模型占用資源小,用戶僅需要最少的輸入音頻文件即可生成個人的專有身份標識。 相較于其他生物特征識別技術,聲紋識別技術具有獲取方便、成本低廉、支持遠程身份確認、使用簡單等優(yōu)勢??蓮V泛用于金融、國安、社保、電信等需要語音通信和交互的系統(tǒng)中,滿足不同客戶對利用簡單設備,高可靠、低成本進行身份認證的需求。
聲紋識別(VPR) ,也稱說話人識別,簡單講就是根據(jù)人的聲音特征,識別出某段語音是誰說的。聲紋是生物特征的一種,同人的指紋、掌紋、虹膜、人臉的特征一樣,由于每個人的生理差異,很難找到兩個聲紋完全一樣的人,因而可以利用其唯一性這種特性進行身份認證。
靈云聲紋識別支持說話人辨識和說話人確認。所謂說話人辨識,是一對多的分析過程, 即判斷出某段語音是若干人中哪一個所說, 目前主要應用于刑偵破案、罪犯跟蹤、國防監(jiān)聽、個性化應用等。而說話人確認是一對一的確定過程, 即確認某段語音是否屬于指定的某人, 主要應用于證券交易、銀行交易、個人計算機聲控鎖、汽車聲控鎖、身份證、信用卡等領域和應用場景的身份確認。在安全認證方面, 聲音不涉及隱私問題, 相關設備造價低廉, 利用聲紋進行身份識別是最自然又經(jīng)濟的方法, 使用者接受程度相對較高。例如銀行、證券系統(tǒng)的密碼可用聲音來代替, 即利用聲紋技術, 使聲音轉化為密鑰, 這樣人們不需要記住復雜的密碼, 也不需隨身攜帶鑰匙、智能卡之類的東西。另外特別值得提及的一個應用場景是,在電話勒索一類的案件中, 最容易獲得的證據(jù)就是電話錄音, 通過聲紋識別技術, 就能根據(jù)電話錄音獲得線索, 可以有效縮小刑偵范圍,縮短破案周期。雖然現(xiàn)在大多數(shù)國家還沒有把聲音列入法庭審判的有效證據(jù)范圍, 但是聲音樣本在刑偵和司法上的應用已經(jīng)日漸受到重視。當然,靈云聲紋識別將重點對日益火爆的互聯(lián)網(wǎng)金融安全提供最強有力的保護。
靈云聲紋識別技術的推出,標志著靈云平臺智能語音形成了以語音識別、語音合成、聲紋識別、自然語言理解四大核心技術組成的完整的智能語音技術生態(tài)閉環(huán),為金融、電信等領域廣大企業(yè)提供了更加全面的智能語音交互與豐富的身份認證技術服務。
捷通華聲:中國智能語音產(chǎn)業(yè)領軍企業(yè)
靈云聲紋識別技術的研發(fā)成功,是清華靈云人工智能研究中心所取得的最新科研成果,也是對捷通靈云團隊夜以繼日工作的豐碩回報。
捷通華聲成立于2000年,是一家長期專注智能語音、智能圖像、語義理解等人工智能技術的研究與開發(fā),全面發(fā)展人工智能技術云服務與產(chǎn)業(yè)應用的高新技術企業(yè)。捷通華聲是國內(nèi)最早從事智能語音技術研究與應用的企業(yè),目前,捷通華聲擁有自主知識產(chǎn)權的靈云語音合成(TTS)、靈云語音識別(ASR)技術,電話端和手機端準確率均達到國內(nèi)領先水平;捷通華聲靈云多語種語音合成支持的語言已達19種,覆蓋了全球90%以上的國家和地區(qū),為。此次,推出靈云聲紋識別技術,使捷通華聲在中國智能語音產(chǎn)業(yè)發(fā)展的道路上又邁出了堅實的一步。
2015年,捷通華聲在靈云語音合成(TTS),語音識別(ASR)等智能語音技術產(chǎn)品的基礎上,全面支持國內(nèi)各主流語音質(zhì)檢系統(tǒng),并相繼推出了靈云電話版智能客服、靈云機器人版智能客服等面向客戶服務領域的全智能解決方案。捷通華聲憑借在中國智能語音產(chǎn)業(yè)多年的深厚研究基礎并通過與廣大合作伙伴的精誠合作,在國內(nèi)語音市場占有超過50%的市場份額,在“第六屆中國行業(yè)信息化獎項評選活動”中一舉奪得“中國智能語音產(chǎn)業(yè)領軍企業(yè)”大獎。
未來發(fā)展,捷通華聲將加快合作共贏步伐,努力不斷為廣大合作伙伴提供最好的智能語音技術,滿足各行業(yè)特別是對有效提升系統(tǒng)安全認證級別的迫切需求,助力聲紋識別技術在金融、證券、通信、國安、刑偵、社保以及其他民用安全認證系統(tǒng)中的應用達到新的高度,擴大服務對象,更全面提升安全水平,使社會大眾都能夠享受更好、更便捷的客戶服務!
靈云聲紋識別體驗與更多信息請訪問靈云:hcicloud.com