ARM為核心的嵌入式語音識別電路模塊設(shè)計(jì)
服務(wù)機(jī)器人以服務(wù)為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機(jī)器人交互,而不再滿足于復(fù)雜的鍵盤和按鈕操作?;诼犛X的人機(jī)交互是該領(lǐng)域的一個重要發(fā)展方向。目前主流的語音識別技術(shù)是基于統(tǒng)計(jì)模式。然而,由于統(tǒng)計(jì)模型訓(xùn)練算法復(fù)雜,運(yùn)算量大,一般由工控機(jī)、PC機(jī)或筆記本來完成,這無疑限制了它的運(yùn)用。嵌入式語音交互已成為目前研究的熱門課題。 嵌入式語音識別系統(tǒng)和PC機(jī)的語音識別系統(tǒng)相比,雖然其運(yùn)算速度和內(nèi)存容量有一定限制,但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點(diǎn),特別適用于智能家居、機(jī)器人及消費(fèi)電子等領(lǐng)域。
模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心,通過以LD3320芯片為核心的硬件單元實(shí)現(xiàn)語音識別功能,采用嵌入式操作系統(tǒng)μC/OS-II來實(shí)現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,本文設(shè)計(jì)的語音識別模塊具有高實(shí)時性、高識別率、高穩(wěn)定性的優(yōu)點(diǎn)。
語音識別電路
圖3為語音識別部分原理圖,參照了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊進(jìn)行設(shè)計(jì)。LD3320的內(nèi)部集成了快速穩(wěn)定的優(yōu)化算法,不需外接Fla-sh、RAM,不需要用戶事先訓(xùn)練和錄音而完成非特定人語音識別,識別準(zhǔn)確率高。圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數(shù)據(jù)段還是地址段;控制信號,復(fù)位信號以及中斷返回信號INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統(tǒng)穩(wěn)定工作;和STM32F103C8T6采用同一個外部8 MHz時鐘;發(fā)光二極管D1、D2用于復(fù)位后的上電指示;MBS(引腳12)作為麥克風(fēng)偏置,接了一個RC電路,保證能輸出一個浮動電壓給麥克風(fēng)。