新浪科技訊 北京時(shí)間9月25日早間消息,人工智能機(jī)器人和自動(dòng)駕駛汽車可能是媒體關(guān)注焦點(diǎn),但谷歌搜索業(yè)務(wù)負(fù)責(zé)人本·戈麥斯(Ben Gomes)表示,科技的下個(gè)飛躍將是語音技術(shù)的發(fā)展。他認(rèn)為,更好地理解普
語音識(shí)別(Speech Recognition)是機(jī)器通過訓(xùn)練和匹配過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。關(guān)于語音識(shí)別技術(shù),先后出現(xiàn)了動(dòng)態(tài)時(shí)間彎折(DTW)、隱馬爾可夫和人工神經(jīng)網(wǎng)絡(luò)三種主要方法[1]。由于每種方法都涉及大量的乘加運(yùn)算,并且計(jì)算精度是算法性能的有效保障,因此對(duì)處理器的運(yùn)算能力要求較高。近年大規(guī)模集成電路的快速發(fā)展,為
據(jù)國外媒體報(bào)道,雖然人工智能機(jī)器人和自動(dòng)駕駛汽車可能成為未來的頭條新聞,但谷歌搜索負(fù)責(zé)人本·戈麥斯(Ben Gomes)表示,技術(shù)領(lǐng)域的下一個(gè)重大飛躍將是語音服務(wù)的進(jìn)步。戈麥斯表示,更好地理解通用語言對(duì)互聯(lián)網(wǎng)的未來發(fā)展至關(guān)重要。
語音識(shí)別研究的根本目的是研究出一種具有聽覺功能的機(jī)器,能直接接受人的口呼命令,理解人的意圖并做出相應(yīng)的反映。語音識(shí)別系統(tǒng)的研究涉及微機(jī)技術(shù)、人工智能、數(shù)字信號(hào)處理、模式識(shí)別、聲學(xué)、語言學(xué)和認(rèn)知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域。近年來,高性能數(shù)字信號(hào)處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)提供了可能,其中,AD公司的數(shù)字信號(hào)處理芯片以其良好的性價(jià)比和代碼的可移植性被廣泛地應(yīng)用于各個(gè)領(lǐng)域。因此,我們采用AD公司的定點(diǎn)DSP處理芯片ADSP
“未來人工智能的研究領(lǐng)域會(huì)體現(xiàn)在兩個(gè)方向,這兩個(gè)方向與人類大腦相吻合。”在2018世界人工智能大會(huì)“AI前沿與行業(yè)賦能主題論壇”上,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋表示,其中一個(gè)是探索人腦機(jī)制對(duì)AI技術(shù)的改善,另一個(gè)則是AI應(yīng)用于人腦研究中,“在這些方向背后,需要進(jìn)行大量的基礎(chǔ)研究。”
戈麥斯說:“語音識(shí)別和對(duì)語言的理解是未來搜索和信息的核心。但是有很多難題,比如理解引用語是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在語音服務(wù)角度,這只是其面臨的數(shù)以百萬計(jì)的問題之一。
9月25日消息,谷歌搜索業(yè)務(wù)負(fù)責(zé)人本·戈麥斯(Ben Gomes)在接受記者采訪時(shí)做出了一次驚人的預(yù)言,他表示科技的下一個(gè)轉(zhuǎn)折點(diǎn)將是語音識(shí)別技術(shù)。戈麥斯認(rèn)為如何讓機(jī)器更好的對(duì)普通語言進(jìn)行認(rèn)知將決定著互聯(lián)網(wǎng)時(shí)代未來的發(fā)展。
近年來機(jī)器翻譯發(fā)展越來越成熟,機(jī)器翻譯和語音助手結(jié)合是不是能成為超級(jí)令人敬佩的同傳了呢,顯然沒有那么簡單??拼笥嶏w為了凸顯自家的AI同傳多厲害,竟然把人類翻譯的內(nèi)容當(dāng)作AI的勞動(dòng)成果。
隨著DSP技術(shù)的進(jìn)步,計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語音識(shí)別(ASR)功能成為可能。目前,基本ASR應(yīng)用可以分成三大類:1. 語音-文本轉(zhuǎn)換(語音輸入);2. 講者識(shí)別;3. 語音命令控制(語音控制)。
羅文指出,要從四個(gè)方面推動(dòng)深圳市人工智能芯片產(chǎn)業(yè)加快發(fā)展,一是對(duì)接國家戰(zhàn)略。國家已經(jīng)在人工智能領(lǐng)域發(fā)布了系列規(guī)劃,企業(yè)應(yīng)按照國家的規(guī)劃部署要求,積極將產(chǎn)品規(guī)劃和國家戰(zhàn)略相結(jié)合。
本文介紹了一種采用ARM處理器作為控制核心的非特定人語音識(shí)別系統(tǒng)的設(shè)計(jì)方案。方案中的系統(tǒng)利用IC Route公司的非特定語音識(shí)別芯片LD3320與ARM Cortex M3內(nèi)核ST公司的32位高性能單片機(jī)STM32F103C8T6組成功能主體,在系統(tǒng)中實(shí)現(xiàn)SD卡文件系統(tǒng)。
一種基于DSP芯片的語音識(shí)別和數(shù)字錄音系統(tǒng)。在該系統(tǒng)中,DSP(單片ADSP2185)完成語音識(shí)別和數(shù)字錄音功能,MCU完成用戶界面處理。該系統(tǒng)可以實(shí)現(xiàn)語音名片(電路號(hào)碼、工作單位、地址等)存儲(chǔ)及聲控查詢、記事錄音及聲控回放、日歷、簡單計(jì)算器等功能。
自從IBM的Shoebox和Worlds of Wonder的玩具娃娃Julie doll發(fā)布以來,語音識(shí)別技術(shù)一直在不斷地發(fā)展。到2018年底,Google Assistant支持超過30種不同的語言。
服務(wù)機(jī)器人以服務(wù)為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機(jī)器人交互,而不再滿足于復(fù)雜的鍵盤和按鈕操作?;诼犛X的人機(jī)交互是該領(lǐng)域的一個(gè)重要發(fā)展方向。目前主流的語音識(shí)別技術(shù)是基于統(tǒng)計(jì)模
盡管困難重重,但這并不會(huì)阻止技術(shù)的發(fā)展,時(shí)代巨輪的前進(jìn)。比如在語音識(shí)別率方面,目前一些主流平臺(tái)的識(shí)別率可以達(dá)到95%以上,這無疑為語音技術(shù)落地提供了大大的技術(shù)支持。
文中闡述的是家庭監(jiān)護(hù)機(jī)器人項(xiàng)目中語音識(shí)別系統(tǒng)設(shè)計(jì)的部分,通過DSP、DMA和ARM Cortex-A8的并行處理,利用雙緩沖的方法,在嵌入式Linux上實(shí)現(xiàn)了基于ATK的實(shí)時(shí)語音識(shí)別系統(tǒng)。文中對(duì)該系統(tǒng)的軟硬件進(jìn)行了設(shè)計(jì)。在硬件方面,給出語音識(shí)別系統(tǒng)的硬件組成原理,并提供了關(guān)鍵部分原理圖;在軟件方面,提出實(shí)時(shí)語音識(shí)別的方法,給出應(yīng)用程序?qū)崿F(xiàn)
摘要:采用VC++和Matlab混合編程搭建了一個(gè)高效的基于HMM的語音識(shí)別實(shí)驗(yàn)驗(yàn)證平臺(tái)。結(jié)合FPGA的特點(diǎn),直接使用加法器、乘法器、比較器等建立一個(gè)Viterbi算法結(jié)構(gòu),采用改進(jìn)方法計(jì)算Viterbi得分,實(shí)現(xiàn)一種簡單的基于HMM的語
物聯(lián)網(wǎng) (IoT) 改變生活的每一個(gè)角落,特別是在家庭中——家電物聯(lián)網(wǎng)裝置讓我們更智能地控制門鎖、燈光和電器,串連個(gè)人生活與外在系統(tǒng)和環(huán)境。而當(dāng)進(jìn)一步加入目前最熱門的語音助理功能后,智能家居在 2018 年的發(fā)展可望更上一層樓。
法國國家科學(xué)研究院/泰雷茲集團(tuán)聯(lián)合物理研究組及納米科學(xué)與納米技術(shù)中心(法國國家科學(xué)研究院/巴黎第十一大學(xué))的研究人員與美日研究人員合作,開發(fā)出世界上第一個(gè)能夠識(shí)別出不同人說出的數(shù)字的人造納米神經(jīng)元。這與《自然》雜志中的一篇文章描述的電子突觸的最新發(fā)展一樣,該電子納米神經(jīng)元是人工智能及其潛在應(yīng)用的一個(gè)突破。
該設(shè)計(jì)運(yùn)用三星公司的S3C2440,結(jié)合ICRoute公司的高性能語音識(shí)別芯片LD3320,進(jìn)行了語音識(shí)別系統(tǒng)的硬件和軟件設(shè)計(jì)。在嵌入式Linux操作系統(tǒng)下,運(yùn)用多進(jìn)程機(jī)制完成了對(duì)語音識(shí)