當(dāng)前位置:首頁 > 消費電子 > 消費電子
[導(dǎo)讀]本文設(shè)計了一款由主機W90P710、從機凌陽SPCE061A單片機及其外圍電路組成的智能音樂播放器。硬件上重點介紹了音頻模塊;軟件上簡單說明了 MP3解碼過程及給出了相關(guān)接口函數(shù),并詳細講述了播放主流程。最后在測試了按鍵能夠?qū)崟r、正確響應(yīng)的基礎(chǔ)上,又分別在安靜、嘈雜的環(huán)境下,進行了語音模式的響應(yīng)測試,實驗結(jié)果說明,該播放器不僅能按鍵控制也能語音控制,且語音控制效果良好。

  引 言

  隨著多媒體的發(fā)展,音樂播放器作為消費類電子產(chǎn)品,其不斷增長的消費要求促使生產(chǎn)廠家采用更先進的技術(shù)來提高自己產(chǎn)品的競爭力。近幾年來語音識別技術(shù)迅速發(fā)展,專門用于語音識別的芯片層出不窮,如凌陽大學(xué)計劃推出的SPCE061A單片機,性價比高,應(yīng)用廣泛。結(jié)合語音識別技術(shù)與當(dāng)前盛行的嵌入式技術(shù),設(shè)計一款不僅具有傳統(tǒng)的按鍵控制功能且能控制語音的音樂播放器,具有一定的市場前景。

  1 系統(tǒng)整體方案設(shè)計

  音頻解碼方式分為硬件解碼和軟件解碼,硬件解碼根據(jù)在系統(tǒng)硬件的安排又有單芯片和雙芯片形式之分。雙芯片形式在于分離解碼芯片與控制芯片,解碼效果出色,但價格昂貴;單芯片形式為簡化結(jié)構(gòu)犧牲了音質(zhì),但性價比高。軟件解碼功能實現(xiàn)起來比較靈活,成本低,但對微控制器的運行速度和內(nèi)存要求較高。兩種解碼方式皆有利弊。本文提出了一個比較折中的方案,即采用ARM7微處理器的單芯片形式和軟件解碼方式,使性能優(yōu)化,同時符合市場需求。此外考慮到語音識別需實時響應(yīng),可采用語音識別專用芯片來完成,同時也保證了識別率。基于以上分析,主機采用華邦公司生產(chǎn)的W90P710套件,從機采用凌陽公司的 SPCE061A作為語音識別芯片?;赪90P710的智能音樂播放器框架如圖1所示。播放器的運行流程是:用戶打開機器首先進入功能界面,功能界面分音樂模式、錄音模式、訓(xùn)練模式和文件管理。若打開機器時用戶沒有語音庫,則只能用按鍵控制機器,同時LCD屏提示用戶進入訓(xùn)練模式訓(xùn)練語音命令而獲得自己的語音庫;若訓(xùn)練成功則可以語音控制播放器進入各個模式。進入音樂模式,在播放音樂時,LCD屏顯示歌曲的基本信息,如歌名、演唱者、專輯名等,同時可以按鍵和語音控制音樂的播放,如上一首、下一首、暫停、播放、退出等。在其他3種模式下,只能靠按鍵控制。

  2 硬件設(shè)計

  按照模塊化設(shè)計原則,將整個智能音樂播放器分成主控模塊、語音識別模塊、音頻模塊、顯示模塊和鍵盤。

  2.1 主、從機控制器

  W90P710主機是系統(tǒng)控制和管理的核心,實現(xiàn)音樂播放,錄音,音樂文件和錄音文件的存儲、刪除、顯示,以及與單片機的串口通信等功能。該處理器以ARM7TDMI為內(nèi)核,具有以下特性:

①片內(nèi)集成LCD控制器,方便實現(xiàn)顯示功能;
②外部總線接口具有豐富的片選資源,可擴展NAND Flash等大容量存儲設(shè)備;
③具有4個串口,可方便實現(xiàn)與凌陽單片機的串口通信及程序調(diào)試。

  同時,W90P710主頻能達到80 MHz,功耗低,有著十分優(yōu)秀的性價比,特別適用于系統(tǒng)控制領(lǐng)域。

  系統(tǒng)的語音識別芯片為SPCE061A,是凌陽科技公司推出的針對語音識別領(lǐng)域的16位單片機,具有體積小、功耗低、性能好且易于開發(fā)等特點。該芯片使用凌陽音頻編碼SACM_S240方式(2.4 kbps),能容納210 s的語音數(shù)據(jù);具備串行設(shè)備接口;7通道10位電壓A/D轉(zhuǎn)換器(ADC)和1個單通道的聲音專用A/D轉(zhuǎn)換器。聲音A/D轉(zhuǎn)換器輸入通道,內(nèi)置麥克風(fēng)放大器和自動增益控制(AGC)電路。語音模式成功啟動或處于訓(xùn)練模式下,單片機自行采集語音信號并進行識別,識別結(jié)果通過串行接口傳給主機。

  2.2 音頻模塊

  音頻模塊在整個系統(tǒng)中起著舉足輕重的作用,不但要實現(xiàn)錄音功能,而且還需播放MP3音樂、提示音和錄音文件。本系統(tǒng)的音頻接口由AC97音頻接口總線接口和ALC203音頻編解碼器組成。ALC203是Realtek公司推出的一款經(jīng)濟型音頻編解碼器,它通過AC97數(shù)字音頻接口實現(xiàn)音頻信號的數(shù)字化處理。圖2是關(guān)于音頻編解碼的具體實現(xiàn)電路,ALC203的2、3腳接1個24.576 MHz的晶振;5、6、7、10腳和華邦W90P710的AC97數(shù)字音頻接口AC97-DATO、AC97-BCLK、AC97-DATI、AC97- SYNC相連;MIC1和MIC2接麥克風(fēng)兩端;HP-OUT-L和HP-OUT-R腳分別通過一個有極電容接到耳機插口處;GPIO1和GPIO0可以硬件調(diào)節(jié)音量,但本設(shè)計采用軟件進行音量調(diào)節(jié)。

  2.3 其他模塊設(shè)計

  LCD顯示屏選用的是AUO公司的A030DL01(320×240)工業(yè)級液晶屏。該液晶屏的彩色格式為RGB656格式,彩色色深可達到64K色,顯示文件名和歌曲基本信,同時因屏幕空間較大,可添加彩色背景畫面。漢字顯示是通過添加字庫軟件實現(xiàn)的。鍵盤有4×1個按鍵,方便用戶控制播放器,同時也保證在語音模式不能正確工作時可以按鍵控制機器。

MPEGDEC_STREAM*MPEGDEC_open(char*filename,MPEGDEC_CTRL*ctrl);
功能描述:打開MPEG音頻文件。
參數(shù):filename為待打開的音頻文件,ctrl為控制數(shù)據(jù)解碼信息的結(jié)構(gòu)體。
返回值:打開成功,則返回包含數(shù)據(jù)流信息和解碼信息的結(jié)構(gòu)體指針;失敗,則返回NULL。

  void MPEGDEC_dose(MPEGDEC_STREAM*mpds);
功能描述:關(guān)閉MPEG音頻文件。
參數(shù):mpds指向待關(guān)閉的音頻文件。
無返回值。

  unsigned long MPEGDEC_decode_frame(MPEGDEC_STREAM*mpds,short*pcm[MPEGDEC_MAX_CHANNELS]);;
功能描述:為當(dāng)前打開的音頻文件的一幀解碼。
輸入:mpds指向打開的音頻文件。
輸出:pcm[]存放解碼后的16位音頻數(shù)據(jù);pcm[0]中存放單聲道或左聲道或聲道1的數(shù)據(jù);pcm[1]中存放右聲道或聲道2的數(shù)據(jù)。
返回值:返回解碼一幀的音頻數(shù)據(jù)數(shù)目;返回MPEG-DEC_ERR_EOF,則說明當(dāng)前幀是最后一幀;返回MPEG-DEC_ERR_BADFRAME,則說明該幀已損壞。

  3.2.2 歌曲基本信息結(jié)構(gòu)體

  按照MP3的ID3 V1.0標(biāo)準(zhǔn)定義,MP3文件的最后128字節(jié)用來存放標(biāo)簽頭、歌曲名、演唱者等信息。為了在LCD屏上顯示當(dāng)前播放歌曲的基本信息,給出了一個結(jié)構(gòu)體來讀取并存放這些信息。這個結(jié)構(gòu)體定義如下:

  3.2.3 播放主流程

  當(dāng)用戶選中歌曲進入播放界面時,ARM7主機首先通過串口給單片機發(fā)一個命令字0x01,通知從機進入識別“播放器”這組命令的函數(shù)。從機接收到命令后,首先判斷“播放器”這組命令是否已經(jīng)訓(xùn)練。若訓(xùn)練,則返回0x04,同時播放器的語音模式啟動成功;若未訓(xùn)練,則返回0x06,LCD屏顯示提醒用戶訓(xùn)練該庫;若從機在規(guī)定時間內(nèi)(因?qū)崟r性要求,這里“規(guī)定時間”指200 ms)返回其他值或未返回值,則播放器的語音模式啟動失敗。若成功啟動語音模式,音樂是分幀解碼后播放,在幀一幀循環(huán)中,主機需查詢鍵盤和串口,來實現(xiàn)“ 上一首”、“下一首”、“播放”、“暫?!?、“退出”和調(diào)節(jié)音量的功能。若語音模式啟動失敗,則只需查詢鍵盤。每次接收到“退出”命令時,主機在退出音樂模式前需通過串口發(fā)送0x05給單片機,通知單片機同步退出該模式;單片機接收到命令后,需返回0x04告知主機已退出。播放的主流程如圖4所示。關(guān)于語音命令如何訓(xùn)練,可見參考文獻[5],這里不再贅述。

  4 實驗結(jié)果

  以W90P710開發(fā)套件+凌陽SPCE061A為硬件,采用嵌入式操作系統(tǒng)μClinux,在實驗室安靜和嘈雜的情況下(安靜時室內(nèi)噪聲為50 dB,嘈雜時為60 dB),測試播放器語音模式的工作效率。在測試語音模式的工作效率前,先進行了按鍵測試,測試通過率為100%,且音樂播放流暢,響應(yīng)滿足實時性要求。

  要使語音模式有效工作,首先需訓(xùn)練“播放器”的語音命令,即“播放”、“暫?!?、“上一首”、“下一首”、“退出”這5個命令。訓(xùn)練時環(huán)境至關(guān)重要,必須處于實驗室安靜環(huán)境下。訓(xùn)練的5個命令并不一定是上述5個詞,只要表達出相應(yīng)意思即可,如“上一首”、“下一首”命令直接訓(xùn)練成“上”、“下”。筆者在實驗室安靜環(huán)境下訓(xùn)練后,分別在安靜、嘈雜的環(huán)境下進行語音測試,結(jié)果分別為96.8%、77.8%。實驗結(jié)果顯示,在安靜環(huán)境下,語音通過率很高;在嘈雜環(huán)境下,語音通過率稍微低些,但可以和按鍵同時使用。

  結(jié) 語

  本文設(shè)計了一款由主機W90P710、從機凌陽SPCE061A單片機及其外圍電路組成的智能音樂播放器。硬件上重點介紹了音頻模塊;軟件上簡單說明了 MP3解碼過程及給出了相關(guān)接口函數(shù),并詳細講述了播放主流程。最后在測試了按鍵能夠?qū)崟r、正確響應(yīng)的基礎(chǔ)上,又分別在安靜、嘈雜的環(huán)境下,進行了語音模式的響應(yīng)測試,實驗結(jié)果說明,該播放器不僅能按鍵控制也能語音控制,且語音控制效果良好。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉