德累斯頓工業(yè)大學(xué)在人類語音識別領(lǐng)域的創(chuàng)新
(文章來源:生物幫)
在許多家庭中,沒有語言助理的生活是不可想象的 - 他們可以打開或關(guān)閉設(shè)備,報道來自世界各地的新聞或知道明天的天氣情況。這些系統(tǒng)的語音識別主要基于機器學(xué)習(xí),這是人工智能的一個分支。機器從重復(fù)的數(shù)據(jù)模式中生成其知識。近年來,人工神經(jīng)網(wǎng)絡(luò)的使用大大改善了基于計算機的語音識別。
然而,來自德累斯頓工業(yè)大學(xué)的神經(jīng)科學(xué)家Katharina von Kriegstein教授認為,人類大腦仍然是“最令人欽佩的語音處理機器”。von Kriegstein教授說:“它比基于計算機的語音處理效果要好得多,而且可能會在很長一段時間內(nèi)繼續(xù)這樣做?!币驗榇竽X中語音處理的確切過程仍然很大程度上未知。
在最近的一項研究中,來自德累斯頓的神經(jīng)科學(xué)家和她的團隊發(fā)現(xiàn)了人類語音處理之謎的另一個組成部分。在該研究中,使用功能磁共振成像(MRI)檢查了33名測試人員。測試人員接收來自不同發(fā)言者的語音信號。他們被要求以隨機順序執(zhí)行語音識別的語音任務(wù)或控制任務(wù)??茖W(xué)家團隊使用MRI記錄了實驗過程中測試人員的大腦活動。對記錄的評估表明,左側(cè)聽覺通路中的結(jié)構(gòu) - 腹側(cè)內(nèi)側(cè)膝狀體(vMGB) - 當(dāng)測試人員執(zhí)行語音任務(wù)(與控制任務(wù)相反)和測試人員時具有特別高的活動性。承認言語特別擅長。
以前,假設(shè)所有聽覺信息都是通過從耳朵到大腦皮層的聽覺通路同等傳播的。目前對vMGB活動增加的記錄表明,聽覺信息的處理在聽覺通路到達大腦皮層之前開始。Katharina von Kriegstein解釋了結(jié)果如下:“一段時間以來,我們首先有跡象表明聽覺路徑比以前假設(shè)的更專注于語音。這項研究表明情況確實如此:vMGB的一部分是當(dāng)要識別語音時,將信息從耳朵傳送到大腦皮層處理聽覺信息的方式與識別通信信號的其他組成部分時的信息不同,例如說話者的聲音。
聽覺言語的識別對于人際交往至關(guān)重要。理解潛在的神經(jīng)元過程不僅對于進一步開發(fā)基于計算機的語音識別很重要。
這些新結(jié)果也可能與發(fā)育性閱讀障礙的某些癥狀有關(guān)。眾所周知,左側(cè)MGB在誦讀困難者中的功能與其他人不同。左側(cè)MGB在語音中的特化可以解釋為什么閱讀困難的人通常難以在嘈雜的環(huán)境(例如餐館)中理解語音信號。Katharina von Kriegstein和她的團隊現(xiàn)在將進行進一步研究,以便科學(xué)地證明這些適應(yīng)癥。