LD3320是非特定人(不用針對指定人)語音識別芯片,即語音聲控芯片。最多可以識別50條預先內置的指令。
工作模式:
LD3320(LDV7)語音模塊可以工作在以下三種模式:普通模式:直接說話,模塊直接識別;按鍵模式:按鍵觸發(fā)開始ASR進程;口令模式:需要一級喚醒詞(口令);推薦使用口令模式,這樣避免嘈雜環(huán)境下誤動作。
應用場景:
家居智能控制
智能小車DIY設計
畢業(yè)設計創(chuàng)新功能
個人DIY設計
語音控制嵌入式產品設計
我購買的LDV7語音識別模塊,內置單片機,LD3320語音識別芯片的驅動是靠模塊上自帶的STC11L08單片機驅動的,我們可以修改模塊自帶工程的Demo程序,修改里面的關鍵詞,然后將識別的結果通過串口打印出來,我們使用另外一個MCU與該模塊進行串口通信,解析收到的串口指令,進而做響應的指令動作。
例如
我們說口令:當前時間(dang qian shi jian)
》》 模塊識別之后,串口輸出:PrintCom("{\"VoiceCommandCode\":2}");
》》 MCU接收串口信息之后,對該串口指令進行解析(可以使用cJSON解析此字符串);
》》 然后通過TTS文字轉語音模塊播放當前時間,即完成本次語音識別控制過程。
識別原理:
就是你說一句話,然后模塊用拼音去和你的發(fā)音做比較,在關鍵詞中找出哪些預設值的詞語與發(fā)音的接近程度大于多少的(假定50%),然后再從一堆大于(50% )里面輸出一個最接近的。
這里就會造成一個問題,容易造成誤識別太多。
如果你只有一個關鍵詞:時間
然后你說了一句:‘時刻’,他識別到‘時’這個發(fā)音,所以有50% 以上的相似,但是候選詞中沒有‘時刻’這個比他更接近的關鍵詞,所以他就會輸出‘時間’的結果。這樣子他就是錯誤了。
如果你設置一些擬聲詞,有可能隨隨便便就觸發(fā)了。
解決方案:
在設定好要識別的關鍵詞語后,為了進一步降低誤識別率,可以再添加一些其他的任意詞匯進識別列表,用來吸收錯誤識別,從而達到降低誤識別率的目的。我們把這樣一些關鍵詞語稱之為“垃圾關鍵詞語”。
比如,某個應用場景中,需要識別的關鍵詞語是 4 條,“前進”,“后 退”,“開門”,“關門”。在把這 4 個關鍵詞語設置進 LD3320 后,可以再另外設置10~30個詞語進LD3320,比如“前門”,“后門”,“阿阿阿”,“嗚 嗚”等等。所以最好把一些擬聲詞或者容易混淆的詞語設置為垃圾關鍵詞,即,識別后不進行輸出。
只有識別結果是 4 個關鍵詞語之內的,才認為識別有效。如果識別結果是 “垃圾關鍵詞語”,則說明是其他的聲音導致的誤識別,產品應該重新開始一 次識別過程。這樣,可以非常有效地降低誤識別率。極大地提高終端用戶的主觀使用體驗。
移植過程:
1、向LD模塊中添加關鍵詞
2、用戶執(zhí)行函數User_handle(nAsrRes); 處理語音識別結果
3、根據不同結果,串口打印不同的指令
PrintCom("{\"VoiceCommandCode\":1}");
4、MCU根據指令不同,執(zhí)行不同的動作
以JSON格式發(fā)送數據至串口,與語音識別模塊相連的MCU接收此結果,然后對此字符串進行解析,進而得到當前識別的命令是什么,進而做相應的動作。
//LD3320
if(USART5_RX_STA&0x8000)
{
uart5Len=USART5_RX_STA&0x3f; //得到此次接收到的數據長度
receive_json = cJSON_Parse(USART5_RX_BUF); //創(chuàng)建JSON解析對象,返回JSON格式是否正確
if (!receive_json)
{
printf("JSON格式錯誤:%s \r\n", cJSON_GetErrorPtr()); //輸出json格式錯誤信息
}
else
{
printf("JSON格式正確:%s \r\n",cJSON_Print(receive_json) );
item_obj = receive_json->child; //獲取name鍵對應的值的信息
while(item_obj)
{
char * string = item_obj->string;
if(!strcmp(string,"VoiceCommandCode"))
{
if(item_obj->valueint==0)
{
printf("收到一級口令 智能報時 ... \r\n");
}
else if(item_obj->valueint==1)
{
printf("“現在幾點了”命令識別成功 \r\n");
m_nCurrentVoicePlayTimes++;
while(U5152_BSY){}
if(m_nCurrentVoicePlayTimes%2==0)
{
sprintf((char*)dtbuf,"[v5][s5][m3]當前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
}
else
{
sprintf((char*)dtbuf,"[v5][s5][m51]當前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
}
printf((char*)dtbuf);
XFS_FrameInfo((char*)dtbuf) ;
delay_ms(10);while(U5152_BSY){delay_ms(500);printf("while(U5152_BSY) \r\n");}
}
}
item_obj = item_obj->next;
printf("while(item_obj) \r\n");
}
}
cJSON_Delete(receive_json);
USART5_RX_STA=0;
memset(USART5_RX_BUF, 0, sizeof(USART5_RX_BUF)); //清空數組
}
LDV7模塊固件下載:
1、打開編譯后的.hex文件
2、選對串口號,芯片型號后,選擇“下載/編程”按鈕,然后給STC單片機上電或者復位。
3、發(fā)出語音,測試語音識別結果
然后其他與LDV7模塊相連的MCU只要解析接收到的串口數據即可。
喜歡請關注微信公眾號:程序員小哈
有啥想玩的模塊,留言給我,咱們一起玩
如果有其他的問題可以評論區(qū)指出,有問必答,知無不言。
免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯系我們,謝謝!