當前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導(dǎo)讀]摘要:結(jié)合語音識別技術(shù)、嵌入式技術(shù)設(shè)計了智能家居語音控制系統(tǒng),根據(jù)智能家居控制的特點以及人機自然交互的理念,設(shè)計了一種利用S3C2410設(shè)計的智能家居語音控制器,給出了整體設(shè)計框圖、硬件電路的各部分具體構(gòu)成以

摘要:結(jié)合語音識別技術(shù)、嵌入式技術(shù)設(shè)計了智能家居語音控制系統(tǒng),根據(jù)智能家居控制的特點以及人機自然交互的理念,設(shè)計了一種利用S3C2410設(shè)計的智能家居語音控制器,給出了整體設(shè)計框圖、硬件電路的各部分具體構(gòu)成以及相應(yīng)的軟件設(shè)計思想。該方案設(shè)計并研制出的語音控制器具有成本低,且既能進行本地控制又能通過PSTN實現(xiàn)遠程控制的特點。實驗表明,該語音控制系統(tǒng)的語音識別效率高,可靠性強。
關(guān)鍵詞:遠程控制;語音識別;PSTN;MFCC;HMM

0 引言
    隨著科技的發(fā)展,越來越多的智能家居產(chǎn)品進入人們的家庭,如何對它們進行簡單、有效的控制是擺在人們面前的一個難題。另一方面,人們渴望用電話在需要時遠程控制各種家電以方便生活之需。目前,針對智能家居的遠程控制往往采用類似于計算機網(wǎng)絡(luò)的分層體系結(jié)構(gòu),成本較高。由于家電控制網(wǎng)絡(luò)傳送的信息量是很少的,不必像計算機網(wǎng)絡(luò)那樣進行分層設(shè)計,故結(jié)合語音識別技術(shù)、PSTN(公共交換電話網(wǎng))等實現(xiàn)了智能家居的本地及遠程控制。

1 整體方案設(shè)計
    目前,常用的語音識別方法有DTW(動態(tài)時間規(guī)整)、HMM(隱馬爾科夫模型)、VQ(矢量量化)和人工神經(jīng)網(wǎng)絡(luò),考慮到數(shù)據(jù)量、實時性、識別率及控制人為多數(shù)的問題,采用了VQ和HMM相結(jié)合的方式。
    語音控制系統(tǒng)主要有預(yù)處理、特征提取、語音識別及控制程序組成,其原理框圖如圖1所示,圖1中碼書是輸入矢量的近似矢量的集合。


    當前控制技術(shù)正從傳統(tǒng)控制向現(xiàn)場總線控制以及網(wǎng)絡(luò)控制跨越,RS 485是現(xiàn)場總線中使用較廣泛的一種,本文結(jié)合語音識別技術(shù)、嵌入式技術(shù)和現(xiàn)場總線技術(shù),采用ARM(三星公司生產(chǎn)的S3C2410)作為語音控制器的處理器,設(shè)計了智能家居語音控制系統(tǒng),其系統(tǒng)框圖如圖2所示。



2 硬件設(shè)計
    硬件部分包括預(yù)處理模塊設(shè)計、振鈴檢測電路、總線接口設(shè)計以及電器控制電路設(shè)計。其中,預(yù)處理模塊包括功率放大電路、自增益控制電路(AGC)、低通濾波器和A/D變換電路。
    預(yù)處理包括自增益控制電路、低通濾波器及A/D變換電路。自增益控制電路是為了把輸入的語音信號控制在一定的幅度內(nèi),低通濾波器是為了濾除高頻(大于濾波器截止頻率)噪聲。自增益控制電路采用M51304L芯片實現(xiàn);低通濾波器采用4節(jié)巴特沃思型低通濾波器,其截止頻率為4.8 kHz;預(yù)加重電路采用集成運算放大器來實現(xiàn)。A/D變換電路采用UDA1341芯片,采樣頻率設(shè)置為8 kHz,通過S3C2410的IIS接口與處理器相連。
2.1 振鈴檢測電路設(shè)計
    如圖3所示,電鈴檢測信號通過C8,D1,R3~R5和C9共同構(gòu)成的整形電路整形后輸入光電耦合器TLP521,在光耦的后端轉(zhuǎn)化為TTL電平,然后送到ARM的UART1的RXD端進行檢測。


2.2 自動摘機電路設(shè)計
    如圖4所示,摘機信號由ARM中UART1的TXD腳發(fā)出,當TXD發(fā)送高電平時,驅(qū)動晶體管VT2導(dǎo)通,這又使VT1導(dǎo)通,相當于在電話線路上并人了一個330Ω的電阻,同時加上并在其上的發(fā)光二極管的消耗,一方面使模擬摘機電流達到30 mA,另一方面用于指示摘機。因為VT1的電流大于30mA時,控制電路向交換機發(fā)出模擬摘機信號,交換機響應(yīng)摘機信號,完成電話線路的接通。


2.3 總線接口設(shè)計
    RS 485接口常用的通信方式有半雙工通信和全雙工通信2種。在大多數(shù)情況下,RS 485的端口連接都采用半雙工通信方式。結(jié)合家庭控制網(wǎng)絡(luò)的特點,本系統(tǒng)也采用半雙工通信方式。圖5為RS 485端口半雙工連接的電路圖。其中,RS 485差動總線收發(fā)器采用SN75176,圖中有一個UART是ARM的,其余為單片機的。
2.4 電器控制電路的設(shè)計
    該控制電路主要由單片機、晶閘管組成,如圖6所示。


    當單片機接收到相應(yīng)的控制命令時,向P1.0發(fā)送相應(yīng)的占空比脈沖信號,可實現(xiàn)連續(xù)控制或開關(guān)量的控制。
    例如,當從本地或從電話發(fā)出打開熱水器時,經(jīng)過語音控制器識別后,語音控制器通過URAT0的TXD端口向總線上發(fā)送打開熱水器命令,連接在總線上的單片機通過RXD端口識別該命令,然后向P1.0發(fā)送占空比為∞的信號,既是高電平,則熱水器被打開。

3 軟件設(shè)計
    軟件部分的設(shè)計包括特征提取模塊、矢量量化模塊、HMM模塊。
    特征提取采用MFCC。首先做預(yù)加重處理,然后進行加窗,窗函數(shù)的寬度采用120點。將加窗處理過的時域信號x(n)后補若干0,形成長為256點的序列,然后經(jīng)過256點FFT(快速傅里葉變換)后得到線性頻譜X(k),然后將X(k)通過26維的MEL帶通濾波器組并通過對數(shù)能量的處理得到對數(shù)頻譜S(m),將S(m)進行離散余弦變換(DCT)就得到26維的MFCC。取MFCC的前12維作為語音特征矢量。
    矢量量化采用LBG算法。碼字搜索則采用最近鄰搜索算法。該算法的思想把待識別的矢量與碼字逐一比較,計算其失真,然后把該矢量歸類為失真最小的碼字所屬的類(胞腔)。
    HMM采用離散從左到右無跳轉(zhuǎn)的HMM,HMM訓練采用Baum-Welch算法,識別過程采用前向一后向算法。

4 結(jié)語
    本文結(jié)合語音識別技術(shù)、嵌入式技術(shù)以及現(xiàn)場總線技術(shù)設(shè)計了智能家居語音控制系統(tǒng)的方案,獲得了較高的識別率。結(jié)合振鈴檢測及自動摘機電路實現(xiàn)了智能家居語音控制系統(tǒng)的遠程控制,由于采用嵌入式技術(shù),大大降低了系統(tǒng)成本。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉