前言:聲音識別的迅速發(fā)展以及高效可靠的應用軟件的開發(fā),使聲音識別系統(tǒng)在很多方面得到了應用、這種系統(tǒng)可以用聲音指令擬應用特定短句實現(xiàn)“不用手”的數(shù)據(jù)采集、其最大特點就是不用手和眼睛,這對那些采集數(shù)據(jù)同時還要完成手腳并用的工作場合尤為適用。由于每個人的聲音千差萬別,因此聲音可以用作安全認證的依據(jù)之一。
別人可以模仿你的簽字,猜測你的密碼,甚至能留下你的指紋,但要模仿你的聲音就有點太苛刻了。美國的一座智能化大廈就采用了聲音識別的方式。到達公司門口,你必須通過安全檢查。電子聲控門衛(wèi)將問候“早上好!”你也該回答“你好!”或“早上好!”之類的禮貌用語。此時電子門衛(wèi)通過你的聲音來辨別你是不是該公司的工作人員,如果確認你是,它將主動為您打開門,但如果不是,電子門衛(wèi)將客氣地將你“拒之門外”。
如果你視力不好或行走不便,聲控設備也可助一臂之力。比如,你可以通過說話控制洗衣機、電視機、電腦等設備。讓它們執(zhí)行開啟、關閉等簡單的任務。裝有聲控設備的電腦還能為你朗讀新收到的電子郵件,告訴你最新的消息。荷蘭飛利浦公司還研制出了一種新型音響設備,如果你想聽音樂,不用走到音響前找按鈕,也用不著遙控器,目口使你在廚房,只要喊一聲“開始放音樂吧!”遠在客廳的音響就能自動開啟,再說出歌曲的名字,音響就能在幾秒鐘之內(nèi)找到這首歌自動播放。更為神奇的是,如果你想不起來歌曲的名字,只要哼幾句歌曲的旋律,音響就能辨別出是哪首歌,然后播放給你聽。
在2003年9月的CeBIT大展上,SONY亮出了他們QRIO家庭娛樂機器人。為強化對話功能,這款機器人配備了專門用于聲音識別與聲音合成的CPU。這樣,在原機型“SDR-4X”中通過外部PC實現(xiàn)的大詞匯量連續(xù)聲音識別可以由機器人獨立完成。機器人可使用的詞匯量約2萬條。為擴展記憶對話功能,不僅能記住對話者的面部與姓名,還能記住對話者在對話寸使用的單詞。因此,當新款機器人與同一個人第二次碰面寸,不僅能認出對方是誰,還能想起過去的對話內(nèi)容。這樣就能對曾經(jīng)遇到過的人“產(chǎn)生一定的感情”,原型號的機器人只能想起面部與姓名。
美國中央情報局一直在秘密開發(fā)“聲音自動處理系統(tǒng)”,并用“經(jīng)典故事”來命名代替。這是一種可以“實寸自動鑒別語言、說話人和武器平臺”的系統(tǒng),聾校教學,這種系統(tǒng)不需要人工的介入,也不管說話人的語言是什么,即可以通過語音識別技術確認該人的身份,并鎖定他說話時所在的地理位置。
每個人的聲音束、嘴型、喉嚨、鼻道以及發(fā)音肌肉都各不相同,這些有差異的物理特性,決定了每個人聲音的獨一性。聲音識別也是一種非接觸的識別技術,噪音和聽力保護,用戶可以很自然地接受。但聲音識別和其他的行為識別技術一樣,聲音因為變化的范圍太大,故而很難進行一些精確的匹配;聲音會隨著音量、速度和音質(zhì)的變化(例如當你感冒時)而影響到采集與比對的結(jié)果。為此,聾校教學,近年來美國中情局在識別聲音時還采用了聲紋技術,目口將聲音信號以時間、頻率及振幅的形式顯示出來,極大地提高了識別效率。