人工控制的語音識別系統(tǒng)電路設計
語音識別芯片很多,下面以756410為例介紹語音識別集成電路。TSC410語音識別芯片能識別40個字段,并產生40個不同的控制信號(以二進制的形式出現(xiàn)),可以滿是 大部分語音控制的需要。此芯片廣泛應用于聲音的自動控制、多媒體技術應用和電腦的語音指令輸人等方面。
756410語音識別芯片內部由CPU、A/D轉換、ROM、語音放大電路、壓縮電路、濾波電路、振蕩器和接口界 面等部分組成。TSC410語音識別芯片的特點是:采用單片結構,外圍元件少,識別容量大,保密性強,響 應時間短,操作方式多樣和分段方式靈活等。756410一般由兩種操作方式,即人工控制方式和CPU控制方式。CPU控制方式需要接單片機及其擴展電路 ,限于篇幅在此不予介紹,請參閱其他書目。下面以人工控制方式為例介紹756410的應用電路及其工作原 理,如圖1所示為756410人工控制的電路原理圖。
語音識別電路的工作過程通常分為兩步:①建立樣本;②識別樣本。所謂建立樣本是指將特定的語音輸 人的過程。如可以對著話筒輸人“請進”等語音,語音芯片接收“請進”這個語音后,先對其進行放大、 整形,再對其進行帶通濾波,濾除不必要的高頻和低頻成分,經壓縮后,再送入A/D轉換器,將其變成數字信號。這樣做可以保證在有足夠鑒別精度的前提下,減少CPU對數據的處理量,以節(jié)約RAM的空間和提高 芯片對語音識別的速度。經過以上過程,在CPU的控制下,將所輸人的語音信號以數字信號的形式存人了 語音樣本區(qū),即完成了第一步建立樣。
人工控制的語音識別系統(tǒng)電路設計

圖1 756410人工控制的電路原理圖
輸人語音時需注意,人在講話時,不能離話筒太近,也不能離話筒太遠,說話時音量不能太大,也不能太小,以免引起失真,而不利于建立樣本。當樣本建立后,如果有語音再輸入話筒,芯片就開始識別樣 本。如再說“請進”,芯片便將這個語音進行處理(放大、整形、濾波、壓縮、A/D轉換),轉換成數字 信號后,將它與所建立的樣本逐個進行比較,當找到這個語音信號與某個樣本信號相同時,芯片便輸出該 區(qū)的區(qū)號,即可以從芯片的數據總線上得到一個數據,對這個數據進行相應的處理后,便可以驅動相應的 執(zhí)行機構動作,如這時門就自動開了,請客人進人房間內。當將所輸人的語音信號與所建立的樣本逐個進 行比較,比較后找不到與這個語音信號相同的樣本信號時,芯片就發(fā)出識別失敗的信號。這就是第二步識 別樣本。