微軟語(yǔ)音技術(shù)不斷突破,助力加速各行業(yè)發(fā)展
(文章來(lái)源:環(huán)球網(wǎng))
人工智能如今已經(jīng)家喻戶曉,從日常生活到行業(yè)賦能,都可見(jiàn)其存在。在這之中,伴隨著智能音箱等單品的爆發(fā)、語(yǔ)音交互的普及,AI語(yǔ)音技術(shù)也走進(jìn)大眾視野。歷經(jīng)近30年的探索,微軟AI語(yǔ)音性能已達(dá)到全球領(lǐng)先水平,AI語(yǔ)音技術(shù)服務(wù)遍及140個(gè)國(guó)家和地區(qū)。
從2017年在Switchboard語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中以低至5.1%詞錯(cuò)率創(chuàng)造當(dāng)時(shí)對(duì)話語(yǔ)音識(shí)別錯(cuò)誤率最低紀(jì)錄以來(lái),微軟AI語(yǔ)音技術(shù)不斷解鎖新成就:成為首個(gè)在中譯英新聞報(bào)道的翻譯質(zhì)量和準(zhǔn)確率上媲美人工翻譯的翻譯系統(tǒng);帶來(lái)媲美人類專業(yè)發(fā)音人水平的基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音合成技術(shù);2019年,在斯坦福文本理解任務(wù)中,微軟機(jī)器閱讀理解系統(tǒng)刷新記錄,成為排行榜上唯一一個(gè)超過(guò)人類分?jǐn)?shù)的模型。
談及此,微軟(亞洲)互聯(lián)網(wǎng)工程院資深產(chǎn)品總監(jiān)丁秉公說(shuō)道:“對(duì)于微軟來(lái)說(shuō),我們要讓更多的研究成果走出實(shí)驗(yàn)室,不僅要輸入到微軟的各個(gè)產(chǎn)品中,而且還要通過(guò)提供先進(jìn)的工具和平臺(tái)服務(wù),讓合作伙伴和開(kāi)發(fā)者獲得可打造自己的人工智能產(chǎn)品和解決方案的能力,這也是微軟語(yǔ)音研發(fā)的一個(gè)定位。”
疫情當(dāng)下,為助力企業(yè)高效恢復(fù)生產(chǎn),微軟圍繞Azure、Office 365、Dynamics365 智能云服務(wù)和Surface硬件,推出了多項(xiàng)免費(fèi)及優(yōu)惠措施。本次微軟還在疫情期間面向有需要的企業(yè)、政府機(jī)構(gòu)和開(kāi)發(fā)者推出免費(fèi)語(yǔ)音服務(wù),包括語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音評(píng)估服務(wù)。
微軟AzureAI語(yǔ)音服務(wù)平臺(tái)的功能已經(jīng)滲透到各個(gè)領(lǐng)域和應(yīng)用場(chǎng)景。據(jù)悉, AI語(yǔ)音在疫情期間可以有著廣泛應(yīng)用,譬如可以應(yīng)用于通過(guò)防疫智能外呼,進(jìn)行社區(qū)情況排查和通知,回訪協(xié)助政府排查疫情;利用智能語(yǔ)音導(dǎo)航與智能客服,解答用戶的問(wèn)題,協(xié)助用戶辦理業(yè)務(wù),同時(shí)啟動(dòng)智能客服表單服務(wù),幫助企業(yè)和政府收集和記錄信息。
實(shí)現(xiàn)智能醫(yī)療,助力醫(yī)院智慧化建設(shè),通過(guò)圖片分析/人臉識(shí)別,聲音合成,語(yǔ)音識(shí)別/聲紋識(shí)別,語(yǔ)言理解/信息搜索等功能,實(shí)現(xiàn)患者與醫(yī)務(wù)人員、醫(yī)療機(jī)構(gòu)、醫(yī)療設(shè)備之間的互動(dòng)??膳c多種醫(yī)療數(shù)據(jù)整合,構(gòu)建智慧醫(yī)療體系;以及在疫期利用AI語(yǔ)音合成系統(tǒng)將文字內(nèi)容轉(zhuǎn)成有聲書(shū),提高學(xué)習(xí)娛樂(lè)體驗(yàn)。
對(duì)此,丁秉公也表示:“我們?cè)谟墒兰o(jì)互聯(lián)運(yùn)營(yíng)的微軟Azure云上推出了面向中國(guó)用戶的語(yǔ)音服務(wù),助力復(fù)工復(fù)產(chǎn)復(fù)學(xué),讓企業(yè)可以更好地把握未來(lái)數(shù)字化轉(zhuǎn)型機(jī)遇,讓公共部門(mén)更有效率,讓個(gè)人成為技術(shù)創(chuàng)新的受益者?!?/p>
幾十年來(lái),微軟一直從事著與人工智能相關(guān)的技術(shù)研發(fā),微軟全球人工智能首席技術(shù)官,原微軟首席語(yǔ)音科學(xué)家黃學(xué)東此前更是在采訪中指出,語(yǔ)音和語(yǔ)言技術(shù)是AI皇冠上的明珠。在萬(wàn)物互聯(lián)的5G時(shí)代下,隨著低延時(shí)、低功耗、高帶寬的到來(lái),語(yǔ)音交互也將會(huì)成為一個(gè)主流。
“伴隨語(yǔ)音技術(shù)更加成熟,應(yīng)用場(chǎng)景越來(lái)越豐富,語(yǔ)音交互通過(guò)定制也將可以達(dá)到更加卓越的效果。這里包括兩個(gè)層面,就語(yǔ)音識(shí)別來(lái)說(shuō),一個(gè)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別精度會(huì)受到領(lǐng)域相關(guān)的詞匯影響很大。通過(guò)定制,就可以針對(duì)某一個(gè)領(lǐng)域的專業(yè)詞匯,讓它的識(shí)別精度在原有通用模型的技術(shù)上變得很高,還可以針對(duì)每一個(gè)人的這個(gè)口音進(jìn)行定制。另外一個(gè)方面來(lái)說(shuō),微軟語(yǔ)音合成的定制可以為企業(yè)定制從男女,到不同年齡的豐富音色,甚至對(duì)于同一個(gè)音色我們可以定制各種的風(fēng)格。” 在談到不斷優(yōu)化的語(yǔ)音交互體驗(yàn)時(shí)丁秉公說(shuō)道,“因?yàn)?G時(shí)代的網(wǎng)絡(luò)會(huì)比現(xiàn)在更加快更加好,聯(lián)上網(wǎng)一定會(huì)有很好的網(wǎng)絡(luò)服務(wù),所以基于這兩點(diǎn),我相信整個(gè)語(yǔ)音的應(yīng)用會(huì)有一個(gè)爆發(fā)式增長(zhǎng)?!?/p>
作為一家全球公司,微軟語(yǔ)音也是支持了世界上的主要語(yǔ)種,其中語(yǔ)音識(shí)別技術(shù)支持39個(gè)國(guó)家與地區(qū)的語(yǔ)言、語(yǔ)音合成技術(shù)支持80個(gè)多語(yǔ)言發(fā)音以及翻譯支持60種語(yǔ)言互譯。同時(shí),Azure擁有全球覆蓋最廣的數(shù)據(jù)中心,所以微軟語(yǔ)音語(yǔ)種的全球覆蓋加上Azure云的全球覆蓋保證了微軟和其生態(tài)伙伴能夠一起賦能世界上的每一個(gè)人和每一個(gè)組織。
丁秉公認(rèn)為,中國(guó)AI語(yǔ)音創(chuàng)新無(wú)論是在技術(shù)、產(chǎn)品上,還有商業(yè)模式上都會(huì)有特別大的潛力。語(yǔ)音技術(shù)也將因此走進(jìn)千家萬(wàn)戶讓普羅大眾,特別是包括視障和聽(tīng)障人士,都可以享受到技術(shù)帶來(lái)的益處。并且,未來(lái)語(yǔ)音技術(shù)也將越來(lái)越會(huì)像空氣一樣,融入日常生活。只要對(duì)著一個(gè)東西,一個(gè)設(shè)備,一個(gè)服務(wù)去說(shuō)話,就能夠被理解并得到響應(yīng)和互動(dòng)。
微軟CEO薩提亞·納德拉曾在微軟Ignite大會(huì)上寫(xiě)了一個(gè)公式叫 technologyintensity (技術(shù)密集)= (tech adoption 技術(shù)落地x tech capability技術(shù)能力)^ Trust(信任)。所謂的技術(shù)密集就是隨著數(shù)字化的不斷深入,企業(yè)可以利用數(shù)字工具和平臺(tái)結(jié)合行業(yè)和自身的特點(diǎn)開(kāi)發(fā)專有技術(shù)、產(chǎn)品和服務(wù),以迎接不斷涌現(xiàn)的新機(jī)遇和新突破。為了打造一流的技術(shù)密集未來(lái),微軟語(yǔ)音研發(fā)團(tuán)隊(duì)的目標(biāo)是讓語(yǔ)音技術(shù)的能力能夠?qū)崿F(xiàn)跨領(lǐng)域、跨語(yǔ)言、跨用戶的不斷提高同時(shí)增加技術(shù)落地賦能,讓每個(gè)企業(yè)和個(gè)人能通過(guò)技術(shù)實(shí)現(xiàn)繁榮發(fā)展;最后是發(fā)展可信賴和負(fù)責(zé)任的技術(shù),這也是其最珍視的技術(shù)底線。
丁秉公表示:“希望微軟語(yǔ)音技術(shù)可以幫助中國(guó)的AI生態(tài)走得更遠(yuǎn)更好。幫助更多的中國(guó)企業(yè)走出去,也可以幫助國(guó)外的企業(yè)走進(jìn)中國(guó),享受無(wú)縫的語(yǔ)音服務(wù),沒(méi)有語(yǔ)言的障礙。這次疫情也讓我們更加感受到世界各國(guó)的聯(lián)系其實(shí)遠(yuǎn)比許多人所想象得更緊密。在這個(gè)地球村,我們需要來(lái)共同應(yīng)對(duì)和解決關(guān)乎人類共同命運(yùn)的問(wèn)題。我們也希望微軟的語(yǔ)音技術(shù)能夠幫到大家。”