當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀]在這篇文章中,小編將為大家?guī)碚Z音識別系統(tǒng)的相關報道。如果你對本文即將要講解的內容存在一定興趣,不妨繼續(xù)往下閱讀哦。

在這篇文章中,小編將為大家?guī)?a href="/tags/語音識別" target="_blank">語音識別系統(tǒng)的相關報道。如果你對本文即將要講解的內容存在一定興趣,不妨繼續(xù)往下閱讀哦。

一、語音識別系統(tǒng)主要包含哪四大部分

1.特征提取和信號處理

在科學和工程中,遇到的大多數(shù)信號都是連續(xù)的模擬信號,而計算機只能處理離散的信號,因此,必須對這些連續(xù)的模擬信號進行轉化,通過采樣和量化,轉化成數(shù)字信號。

2.聲學模型(Acoustic Model)

聲學模型是語音識別系統(tǒng)中最為重要的部分之一,主流系統(tǒng)多采用隱馬爾科夫模型進行建模。 隱馬爾可夫模型的概念是一個離散時域有限狀態(tài)自動機,隱馬爾可夫模型HMM是指這一馬爾可夫模型的內部狀態(tài)外界不可見,外界只能看到各個時刻的輸出值。

對語音識別系統(tǒng),輸出值通常就是從各個幀計算而得的聲學特征。用HMM刻畫語音信號需作出兩個假設,一是內部狀態(tài)的轉移只與上一狀態(tài)有關,另一是輸出值只與當前狀態(tài)(或當前的狀態(tài)轉移)有關,這兩個假設大大降低了模型的復雜度。HMM的打分、解碼和訓練相應的算法是前向算法、Viterbi算法和前向后向算法。

3.語言模型(Language Model)

語言模型用來表示詞序列出現(xiàn)的可能性,用文本數(shù)據(jù)訓練而成,是語音識別系統(tǒng)重要的組成部分

基于規(guī)則的語言模型,其數(shù)據(jù)的主要來源是人類社會中語言學家掌握的語言學知識和領域知識,以及特定語法規(guī)則的約束下,受限領域內的句子。

統(tǒng)計語言模型,通過對大量文本語料進行處理,獲取給定詞序列的概率分布,客觀描述隱含的規(guī)律,適合于處理大規(guī)模真實文本。

4.解碼搜索

解碼器是將語音中的信息解碼識別并輸出的一個關鍵結構。針對輸入的語音信號,根據(jù)己經(jīng)訓練好的聲學模型、語言模型及字典建立一個識別網(wǎng)絡, 使用搜索算法在該網(wǎng)絡中尋找最佳的一條路徑 ,輸出最大概率的情況下的文字。

二、語音識別系統(tǒng)有哪些功能特點

對比語音識別技術的兩個發(fā)展方向,由于基于不同的運算平臺,因此具有不同的特點。大詞匯量連續(xù)語音識別系統(tǒng)一般都是基于PC機平臺,而語音識別專用芯片的中心運算處理器則只是一片低功耗、低價位的智能芯片,與一臺甚至多臺PC機相比起來,其運算速度,存儲容量都非常有限,因而這些由專用芯片實現(xiàn)的語音識別系統(tǒng)有如下幾個特點:

1、多為中、小詞匯量的語音識別系統(tǒng),即只能夠識別10~100詞條。只有近一兩年來,才有連續(xù)數(shù)碼或連續(xù)字母語音識別專用芯片實現(xiàn)。

2、一般僅限于特定人語音識別的實現(xiàn),即需要讓使用者對所識別的詞條先進行學習或訓練這一類識別功能對語種、方言和詞條沒有限制。有的芯片也能夠實現(xiàn)非特定人語音識別,即預先將所要識別的語句碼本訓練好而裝入芯片,用戶使用時不需要再進行學習而直接應用。但這一類識別功能只適用于規(guī)定的語種和方言,而且所識別的語句只限于預先已訓練好的語句。

3、由此芯片組成一個完整的語音識別系統(tǒng)。因此,除了語音識別功能以外,為了有一個好的人機界面和識別正確與否的驗證,該系統(tǒng)還必須具備語音提示(語音合成)及語音回放(語音編解碼記錄)功能。

4、多為實時系統(tǒng),即當用戶說完待識別的詞條后,系統(tǒng)立即完成識別功能并有所回應,這就對電路的運算速度有較高的要求。

5、除了要求有盡可能好的識別性能外,還要求體積盡可能小、可靠性高、耗電省、價錢低等特點。

以上便是小編此次想要和大家共同分享的有關語音識別系統(tǒng)的內容,如果你對本文內容感到滿意,不妨持續(xù)關注我們網(wǎng)站喲。最后,十分感謝大家的閱讀,have a nice day!

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權不予轉載,侵權必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉