中文語音處理技術(shù)在數(shù)字助聽器中的開發(fā)和應(yīng)用
目前國外對助聽器研究發(fā)展的一個(gè)熱點(diǎn)則是集中在中國,確切地講是基于對漢語語言和語音研究,開發(fā)相關(guān)的語音識別技術(shù)和產(chǎn)品。為中心的中文聽力學(xué)也不例外。我們已經(jīng)知道聽覺科學(xué)是一門發(fā)展迅速、知識更新很快的一門學(xué)科,它所研究的對象以人的聽覺為中心,現(xiàn)在我們將介紹和討論科學(xué)家和聽力學(xué)家更關(guān)心的是怎樣將聽覺科學(xué)運(yùn)用到中國人的聽覺和言語實(shí)際中去。
漢語是具有特征化的音調(diào)性語言,與其他以拼音字母為主的語系,如斯拉夫語系等具有很明顯的語音學(xué)差別。這種差別不僅僅在語言特征上非常明確,在具體使用時(shí),區(qū)別也很大。是否不同語系的不同語音特征會影響聽覺受損患者對言語的理解,尤其是在使用基于不同語系研究成果制作成的助聽器時(shí),這種語音的差異是否起到重要作用,最近已成為學(xué)術(shù)和科研的一個(gè)熱門課題。比如國內(nèi)研制的人工耳蝸的一個(gè)特點(diǎn)便是在設(shè)計(jì)其算法時(shí)考慮到中文語音特點(diǎn)。國外助聽器廠商將在近期推出以中文語音為特征算法的助聽器。加拿大在中國的一語音實(shí)驗(yàn)室通過多年的研究和實(shí)驗(yàn),早在 2000 年運(yùn)用領(lǐng)先的數(shù)字信號處理 (DSP) 技術(shù),在其數(shù)字助聽器中加入中文語音算法,并同時(shí)申請了相關(guān)專利。目前他們率先推出的以中文語音處理技術(shù)為核心的全新數(shù)字助聽器 —Intelligia ,在臨床試驗(yàn)中得到受試者的認(rèn)可,初步證明這種新型助聽器對說以中文為母語的患者有益處。
目前研究的結(jié)果表明,不同的語系,如漢語和英語有各自特點(diǎn),在聽覺感知過程中有很大差別。英文和漢語在語音和口語上有重要區(qū)別, Ming-Xi Tsai el al ( 2000 )認(rèn)為漢語和英文語音在結(jié)構(gòu)上特征區(qū)別很大。漢語的詞、字、音節(jié)和聲、韻母分節(jié)含有不同層次的信息,并保持復(fù)雜的關(guān)系。在口語中,漢語發(fā)音差異也很大,在不同會話條件下,受到這些結(jié)構(gòu)中不同層次信息的影響。
對中文語音識別和中文語音音調(diào)的研究表現(xiàn)在人工耳蝸的算法上面。言語處理策略是人工耳蝸幫助患者理解語言核心技術(shù),已有大量研究。但對于言語聲尤其是聲調(diào)、語調(diào)的研究,比如對以語調(diào)為基礎(chǔ)的漢語研究還是很少。在最近的一個(gè)試驗(yàn)中,他們用澳大利亞人工耳蝸來觀察對漢語語音理解的影響。結(jié)果表明在某些言語處理策略中漢語的使用的理解度要高于其他時(shí)間策略。如果能提高刺激率,加強(qiáng)對語音和音調(diào)的理解,他們也認(rèn)為不同的言語處理策略對漢語說法也有理解。研究再次證明,漢語應(yīng)該有一定的語音系統(tǒng)處理自己的語言,尤其是對聽障人士尤為重要。
美國麻省理工學(xué)院研究者 Michael Qin 在其《在噪音背景發(fā)音和音調(diào)的辨認(rèn)》的試驗(yàn)中,對漢語普通話音調(diào)的辨認(rèn)和噪音的關(guān)系進(jìn)行了研究。他認(rèn)為不同的語言利用不同類型的聲調(diào)使我們口語富于不同的意義,在噪音環(huán)境下這些有意義的聲調(diào)會受到影響,因此他需要發(fā)現(xiàn)說普通話的中國人怎樣在噪音環(huán)境里辨認(rèn)不同的聲調(diào)。在試驗(yàn)中他使用 6 個(gè)輔元音的音位,同時(shí)使用 4 個(gè)聲調(diào):陰陽上去。其結(jié)果表明在信噪比降低的情況下,對漢語聲調(diào)和元音的識別受到很大影響,從而影響降低言語的理解能力。因此信噪比影響理解中文很重要的因素。這個(gè)試驗(yàn)對聽覺康復(fù)和設(shè)計(jì)有針對性的助聽器具有重要意義。
同時(shí),最近美國成立了一個(gè)綜合性專家研究小組,開始研制適合中文語音的助聽器。該小組成員包括世界聞名的豪斯耳研究院、香港中文大學(xué)耳鼻喉科等。與上述研究類似。他們認(rèn)為在聆聽以聲調(diào)作為識別語音和語義的語言時(shí),如普通話、廣東話和泰國語等,可能聽覺更重要的是依靠基頻相關(guān)的信息來理解語言,這是與別的語言不同的。因此,在研制助聽器時(shí),我們應(yīng)該考慮到這些患者的語言特點(diǎn)。
當(dāng)然,筆者最感興趣的是最近由威耳康研究基金 (Wellcome Trust) 贊助的一項(xiàng)題為《中文普通話會話者在理解語言時(shí)比英文會話者用腦更多》的試驗(yàn),其目的是使用影像技術(shù)來觀察和研究中文母語和英文母語說話者大腦出現(xiàn)的不同活動。主持該項(xiàng)研究的心理學(xué)家索菲斯高特博士發(fā)現(xiàn),當(dāng)英語的受試者聽到英文時(shí),其左顳葉變得異常活躍,研究者認(rèn)為這個(gè)區(qū)是把言語聲組合在一起形成獨(dú)立的字詞。但是當(dāng)中文受試者聽到普通話時(shí),其左右顳葉同時(shí)活躍起來。顯然,由于說不同語言的受試者用他們大腦的不同區(qū)域?qū)Σ煌Z言的刺激進(jìn)行解碼。這對我們理解這些理論產(chǎn)生了很大的影響。他們進(jìn)一步認(rèn)為中文受試者的左顳葉處理語音信號,而他們的右顳葉則處理聲調(diào),同時(shí)產(chǎn)生意義。言語聲是非常復(fù)雜的聲音,而正確理解言語傳遞的意思,在這種情況下,大腦會充分利用說話者抑揚(yáng)頓挫的聲調(diào)來對其言語進(jìn)行解碼,從而將口語變成有意義的信號。
大腦聽覺區(qū)域很容易受外部影響,而改變對聲音的分辯能力。一旦聽覺受到損傷,必需進(jìn)行康復(fù),大腦需要重新連接和編碼。大腦的可塑性是很強(qiáng)的。了解大腦對不同語言的反應(yīng),可以有效地幫助聽覺患者重新恢復(fù)對語言的理解。重要的是基于這些研究,我們可以清楚地看到研制出具有中文語音特征的聽力康復(fù)設(shè)備。記得在 2002 年北京大學(xué)和中國殘聯(lián)成立言語聽覺中心的開幕式上,鄧樸方先生在發(fā)言中專門談到:他第一次聽說中文語音處理特征對助聽器使用者的影響,他認(rèn)為這是一個(gè)重要課題,需做大量工作,而研制出以中文語音為特征的聽覺康復(fù)設(shè)備將會有重要的意義。根據(jù)國際確認(rèn)的聽損發(fā)病率,中國有 10 %的人口,即一億三千萬人有不同程度聽力損失,因此,利用中文語音處理技術(shù)更有效地幫助聽殘患者具有非常重要的作用。
更多醫(yī)療電子信息請關(guān)注:21ic醫(yī)療電子