當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 音頻技術(shù)
[導(dǎo)讀]   11月22日,百度語(yǔ)音開(kāi)放平臺(tái)三周年主題活動(dòng)在北京召開(kāi),本次大會(huì)百度公開(kāi)宣布開(kāi)放四大語(yǔ)音技術(shù)——情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期、長(zhǎng)語(yǔ)音方案,為開(kāi)發(fā)者提供免費(fèi)接入入口。百

  11月22日,百度語(yǔ)音開(kāi)放平臺(tái)三周年主題活動(dòng)在北京召開(kāi),本次大會(huì)百度公開(kāi)宣布開(kāi)放四大語(yǔ)音技術(shù)——情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期、長(zhǎng)語(yǔ)音方案,為開(kāi)發(fā)者提供免費(fèi)接入入口。百度首席科學(xué)家吳恩達(dá)在主題演講中表示,“語(yǔ)音是人類交流、人機(jī)交互最自然的方式,通過(guò)開(kāi)放語(yǔ)音技術(shù),百度希望可以推動(dòng)語(yǔ)音功能產(chǎn)品繁榮的浪潮。”

  (百度公司首席科學(xué)家吳恩達(dá)進(jìn)行現(xiàn)場(chǎng)演講)

  在演講中吳恩達(dá)詳細(xì)解讀了百度人工智能核心成果“百度大腦”及其核心組成部分,包括語(yǔ)音、圖像、自然語(yǔ)言處理、用戶畫(huà)像、機(jī)器學(xué)習(xí)五大重要組成部分。在百度語(yǔ)音開(kāi)放平臺(tái)三周年之際,吳恩達(dá)還向外界公開(kāi)介紹百度語(yǔ)音技術(shù)最新數(shù)據(jù)情況:注冊(cè)開(kāi)發(fā)者數(shù)量達(dá)到14億,在線識(shí)別請(qǐng)求量2016年每天達(dá)到1.4億次,在線語(yǔ)音合成請(qǐng)求量則達(dá)到2億次,再次證明了語(yǔ)音開(kāi)放平臺(tái)開(kāi)放給開(kāi)發(fā)者帶來(lái)的實(shí)用價(jià)值。

  此外,吳恩達(dá)還對(duì)人工智能的未來(lái)充滿信心,他認(rèn)為,人工智能的未來(lái)會(huì)體現(xiàn)在方方面面,例如陪伴機(jī)器人,個(gè)性化私教,音樂(lè)作曲,機(jī)器人醫(yī)生等。

  以下是吳恩達(dá)演講實(shí)錄:

  大家好,非常高興大家今天來(lái)參加我們的語(yǔ)音開(kāi)放平臺(tái)三周年發(fā)布會(huì)。

  我是“百度大腦”的項(xiàng)目負(fù)責(zé)人吳恩達(dá),在百度大腦的項(xiàng)目中有一部分非常重要的工作,就是把最領(lǐng)先的技術(shù)輸出給大家使用。在百度大腦開(kāi)放平臺(tái)(ai.baidu.com)上,我們不僅輸出人工智能技術(shù),也有很多有關(guān)人工智能技術(shù)的培訓(xùn)資料。

  那么,百度大腦到底是什么呢?它最核心的幾個(gè)技術(shù)部分為:語(yǔ)音、圖像、自然語(yǔ)言處理、用戶畫(huà)像、機(jī)器學(xué)習(xí)平臺(tái)。我發(fā)現(xiàn)很多人使用百度的語(yǔ)音技術(shù)有兩大原因,第一個(gè)原因,百度有非常領(lǐng)先的技術(shù)為他們的用戶提供更好的體驗(yàn);第二個(gè)原因,我個(gè)人做了好幾十年有關(guān)人工智能的項(xiàng)目,發(fā)現(xiàn)通常你剛開(kāi)始做一個(gè)項(xiàng)目的時(shí)候,只是需要語(yǔ)音技術(shù),當(dāng)做了幾個(gè)月以后,你發(fā)現(xiàn)還需要圖像技術(shù)或者自然語(yǔ)言處理技術(shù)等等。如果你是使用百度大腦開(kāi)放平臺(tái),你可以比較容易的選擇真正需要的技術(shù)部分把它放進(jìn)來(lái),把它融合,為你做到最好的效果。再比如說(shuō)你想服務(wù)一個(gè)智能客戶,開(kāi)始的時(shí)候覺(jué)得只需要語(yǔ)音識(shí)別、語(yǔ)音合成技術(shù),但是做了幾個(gè)月以后,發(fā)現(xiàn)你需要最領(lǐng)先的自然語(yǔ)言處理技術(shù)。如果你是使用百度大腦開(kāi)放平臺(tái),希望你比較容易拿到這些技術(shù)放到自己的產(chǎn)品中。

  我個(gè)人對(duì)人工智能的未來(lái)充滿信心,我希望未來(lái)我們會(huì)有陪伴機(jī)器人、個(gè)性化私教、音樂(lè)作曲、機(jī)器人醫(yī)生等等。這些年人工智能技術(shù)發(fā)展的非???,這給我們,也給你們帶來(lái)很多新的機(jī)會(huì),在百度是沒(méi)有辦法探索這么多非常有潛力的機(jī)會(huì),所以我們的目標(biāo)就是把我們的人工智能技術(shù)輸出給大家,希望可以支持你們?cè)诜浅S袧摿Φ捻?xiàng)目上探索,而且支持你們?cè)谶@些項(xiàng)目中獲得非常好的結(jié)果。

  今天大會(huì)的主題就是語(yǔ)音技術(shù)。大家可能已經(jīng)知道,在很多最重要的百度產(chǎn)品中,我們已經(jīng)支持語(yǔ)音輸入,包括手機(jī)百度、百度地圖、百度輸入法。如果你還沒(méi)有試過(guò)百度輸入法,我希望你試一試,我輸入信息時(shí)就挺喜歡用百度輸入法。還有度秘,最近我們把度秘放入各類硬件中,比如小度機(jī)器人。度秘系統(tǒng)可以為客戶點(diǎn)餐,把度秘和機(jī)器人融合,也可以讓各種用戶有新的體驗(yàn)。

  這幾年來(lái),我們的團(tuán)隊(duì)在不斷地優(yōu)化語(yǔ)音識(shí)別系統(tǒng),在2012年開(kāi)始使用DNN模型,后來(lái)有比較好的特征,之后開(kāi)始用Sequence DiscriminaTIve Training,也開(kāi)始使用LSTM模型,加上CTC,今年我們的團(tuán)隊(duì)開(kāi)發(fā)了Deep CNN模型,效果在不斷進(jìn)步,這就是我們的語(yǔ)音識(shí)別系統(tǒng)。

  此外,我們的語(yǔ)音合成模型也變得越來(lái)越好,這幾年來(lái)我們?cè)诤脦讉€(gè)技術(shù)方面有比較大的突破,我們的語(yǔ)音合成效果也變得越來(lái)越好。現(xiàn)在百度在中國(guó)語(yǔ)音合成的能力是遠(yuǎn)遠(yuǎn)超過(guò)其他公司的,今天下午我們的語(yǔ)音團(tuán)隊(duì)負(fù)責(zé)人也會(huì)和大家分享更多細(xì)節(jié)。

  因?yàn)槲覀兊恼Z(yǔ)音技術(shù)、自然語(yǔ)言處理技術(shù)、我們的人機(jī)交互技術(shù)進(jìn)步的這么快,2016年MIT科技評(píng)論我們的技術(shù)是2016年十大突破性技術(shù)之一,我們覺(jué)得這些技術(shù)有很大的潛力,可以改變?nèi)藱C(jī)交互的效率和辦法。

  未來(lái)語(yǔ)音技術(shù)在很多應(yīng)用場(chǎng)景有很好的機(jī)會(huì),為人機(jī)交互帶來(lái)巨大的改變。舉個(gè)例子,在智能家居的場(chǎng)景,我們希望未來(lái)你回家以后可以使用語(yǔ)音跟你的電視、遙控器、音箱、窗簾講話,比如說(shuō)希望你未來(lái)可以向你的電燈說(shuō),“電燈請(qǐng)打開(kāi)”,它就明白你的命令,或者對(duì)遙控器說(shuō)話,它就能非常方便的滿足你的需求。其實(shí)智能家居只是一個(gè)應(yīng)用場(chǎng)景,我覺(jué)得在很多應(yīng)用場(chǎng)景中,語(yǔ)音技術(shù)都可以帶來(lái)人機(jī)交互非常大的改變,這包括手機(jī)、音箱、電視等等。希望語(yǔ)音能讓你做更好的智能客服中心。在汽車領(lǐng)域語(yǔ)音也是一個(gè)非常重要的人機(jī)交互的場(chǎng)景,我們有很多合作伙伴正在使用我們的語(yǔ)音技術(shù)探索這些應(yīng)用場(chǎng)景。

  最后,今天我們已經(jīng)知道,尤其是在手機(jī)端,我們知道語(yǔ)音輸入比鍵盤打字更快、更方便、更準(zhǔn)確。下一位進(jìn)行演講的是我的好朋友,也是斯坦福大學(xué)James Landay教授,他也會(huì)為大家分享有關(guān)這方面的研究,就是使用百度的語(yǔ)音識(shí)別系統(tǒng),如果你使用這個(gè)系統(tǒng),在手機(jī)端輸入就可以更快、更方便、更自然。

  語(yǔ)音輸入這么方便,希望未來(lái)語(yǔ)音輸入會(huì)變得更普及。大家想一想,如果你跟我想交流,最自然的辦法就是你跟我講一句話,或者我跟你講一句話,所以人和人交流最自然的辦法還是語(yǔ)音。這幾年來(lái),語(yǔ)音和自然語(yǔ)言處理和度秘這種技術(shù)進(jìn)步這么快,今天很多場(chǎng)景,人機(jī)交互最自然的辦法已經(jīng)是語(yǔ)音。人機(jī)交互不只是你跟電腦或者和設(shè)備講話,你的電腦和設(shè)備也需要告訴你它的意見(jiàn),所以我們的語(yǔ)音技術(shù)也可以讓這些設(shè)備非常自然的告訴你它的意見(jiàn)。

  最后,因?yàn)槿斯ぶ悄?,尤其是語(yǔ)音技術(shù)這幾年發(fā)展的很快。在百度大腦已經(jīng)有好幾種不同的人工智能技術(shù),其中比較成熟的,就是我們的語(yǔ)音技術(shù)。所以語(yǔ)音技術(shù)已經(jīng)給我們,也給大家,也給你們,給你的公司,給開(kāi)發(fā)者很多新的機(jī)會(huì)。所以,我希望我們輸出語(yǔ)音技術(shù),希望它可以為大家提供非常好的服務(wù),也希望我們可以使用我們的技術(shù)支持你們探索這些新機(jī)會(huì),希望你們可以使用這些技術(shù),支持你們?cè)谶@些新機(jī)會(huì)中獲得非常好的成果。

  謝謝大家!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉