科大訊飛童劍軍:用人工智能建設(shè)美好城市 | CCF-GAIR 2019
記者(公眾號(hào):記者)按:7 月 12 日-7 月 14 日,2019 第四屆全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR 2019)于深圳正式召開(kāi)。峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,記者、香港中文大學(xué)(深圳)承辦,深圳市人工智能與機(jī)器人研究院協(xié)辦,得到了深圳市政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流博覽盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域極具實(shí)力的跨界交流合作平臺(tái)。
7 月 14 日,在「智慧城市專場(chǎng)」論壇上,企業(yè)界、學(xué)術(shù)界的 14 位嘉賓共聚一堂,就城市數(shù)據(jù)智能、數(shù)據(jù)治理、數(shù)字孿生、數(shù)字仿真等前沿技術(shù)做了深度探討。其中,科大訊飛智慧城市 BG 副總裁/總工程師童劍軍博士帶來(lái)了主題為《用人工智能建設(shè)美好城市》的演講。
童劍軍從城市信息化建設(shè)路程談起,講述了科大訊飛對(duì) AI 城市的暢想。他認(rèn)為,對(duì)于城市而言,經(jīng)歷過(guò)電子化、網(wǎng)絡(luò)化、數(shù)據(jù)化、智慧化,下一個(gè)將迎來(lái) AI 時(shí)代;AI 走過(guò)了 20 年的發(fā)展之路,到目前已經(jīng)上升為國(guó)家戰(zhàn)略,對(duì)未來(lái)城市的形態(tài)構(gòu)建會(huì)產(chǎn)生巨大影響,其中,語(yǔ)音技術(shù)是其中特別重要的一環(huán)。
童劍軍還展示了多個(gè)視頻,包括翻譯機(jī)如何識(shí)別方言、地圖導(dǎo)航如何合成明星語(yǔ)音、虛擬主播如何模仿名人聲音等。他指出,人工智能浪潮的來(lái)臨已經(jīng)深入到我們生活的方方面面,進(jìn)入了實(shí)用階段。不過(guò) AI 是幫助各行各業(yè)的人提高勞動(dòng)效率,機(jī)器無(wú)法從根本上取代人類。
以下是童劍軍演講的全部?jī)?nèi)容,記者作了不改變?cè)獾恼砼c編輯:
大家上午好!我演講的題目是“用人工智能建設(shè)美好城市”。今天,各個(gè)專家都提到了城市信息化建設(shè)的路徑,比如從電子化、信息化再到現(xiàn)在的智慧化;雖然我們尚不清楚未來(lái)究竟會(huì)是什么樣子,但已經(jīng)有很多的暢想。
目前,人工智能日益上升為國(guó)家戰(zhàn)略。從 2017 年至今,包括政府工作報(bào)告在內(nèi)的各類政府文件中都曾多次提到“人工智能”這一關(guān)鍵詞。實(shí)際上,這個(gè)概念本身并不陌生,只不過(guò)最近幾年突然熱了起來(lái)。1956 年達(dá)特茅斯會(huì)議一般被公認(rèn)為人工智能元年,經(jīng)過(guò)幾十年的發(fā)展,人工智能進(jìn)步緩慢,但在進(jìn)入新世紀(jì)之后發(fā)展速度加快。
就拿語(yǔ)音技術(shù)來(lái)說(shuō),1995 年,語(yǔ)音合成作為經(jīng)典人工智能方向,效果仍然不好,機(jī)器在發(fā)音時(shí)會(huì)逐字往外蹦,一聽(tīng)就不舒服。過(guò)了 20 年,現(xiàn)在的語(yǔ)音合成技術(shù)已經(jīng)非常接近人類的自然語(yǔ)言發(fā)聲,比如,現(xiàn)在的導(dǎo)航聲音,常見(jiàn)的有聲似“林志玲”“郭德綱”等名人的,它們的聲音都是合成的,但已經(jīng)難以區(qū)分是機(jī)器發(fā)聲了。
為什么人工智能突然就火起來(lái)了?因?yàn)槭兰o(jì)初深度學(xué)習(xí)理論的出現(xiàn),眾多人工智能技術(shù)已逐漸達(dá)到實(shí)用化的程度。
大家知道科大訊飛是做語(yǔ)音的,在語(yǔ)音領(lǐng)域,算得上是全球相對(duì)領(lǐng)先的企業(yè),2018 年在 12 項(xiàng)國(guó)際權(quán)威賽事中拿到第一名的成績(jī)。而語(yǔ)音技術(shù)是人工智能技術(shù)的一個(gè)重要分支,科大訊飛在除了語(yǔ)音技術(shù)之外的眾多方向都有相應(yīng)的探索和應(yīng)用成果,也就是說(shuō),科大訊飛的核心是自有的人工智能技術(shù)和成果,而且是國(guó)內(nèi)人工智能領(lǐng)域的重要一極。
在剛剛過(guò)去的“618”中,科大訊飛在京東和天貓雙平臺(tái)上兩個(gè)產(chǎn)品雙雙拿到銷量第一,一個(gè)是翻譯機(jī),另一個(gè)是陪伴機(jī)器人阿爾法蛋。科大訊飛翻譯機(jī)銷量是第一名,但價(jià)格也是最貴的,為什么這么貴還能賣得最好?因?yàn)檎嬲軞g迎的是具有一流核心技術(shù)的產(chǎn)品,用戶是要看實(shí)用效果的。
科大訊飛的翻譯機(jī),從方言識(shí)別來(lái)說(shuō),已經(jīng)可以識(shí)別粵語(yǔ)、四川話、東北話等國(guó)內(nèi) 20 多種方言并進(jìn)行準(zhǔn)確翻譯;甚至網(wǎng)絡(luò)上的一些故意刁難的段子也能順利翻譯出來(lái),比如那個(gè)“我要過(guò)過(guò)過(guò)過(guò)過(guò)過(guò)的生活”,還有“好在我一把把把把住了”等等。為什么能夠準(zhǔn)確翻譯,因?yàn)闄C(jī)器翻譯的過(guò)程需要有強(qiáng)大的語(yǔ)義理解來(lái)支撐,而在這方面,訊飛毫無(wú)疑問(wèn)擁有重大技術(shù)成果。
除此之外,目前的語(yǔ)音技術(shù)在模仿配音員、虛擬主播方面也有了新進(jìn)展。在中央電視臺(tái) 《創(chuàng)新中國(guó)》節(jié)目里的配音,是使用 AI 技術(shù)模仿現(xiàn)已逝世的李易老師,效果幾可亂真;而使用 AI 語(yǔ)音合成技術(shù),可以設(shè)計(jì)出一位虛擬主播,同一時(shí)間在不同頻段上使用不同的外語(yǔ)、方言進(jìn)行新聞播報(bào),基本看不出破綻,甚至連主播的嘴型也能和“它”的發(fā)音完美匹配。
我們可以大膽預(yù)測(cè)一下,按照這種發(fā)展趨勢(shì),或許在將來(lái),電影不再需要真人演員參與,而是通過(guò)創(chuàng)造虛擬演員的方式來(lái)合成電影;又或許,以后到電影院去看電影,票賣得最貴的,并不是特效最好的電影,而是由真人出境的“原生態(tài)”電影了。
語(yǔ)音技術(shù)還應(yīng)用到了很多具體行業(yè)和場(chǎng)景,比如在司法領(lǐng)域,庭審現(xiàn)場(chǎng)中可以利用語(yǔ)音技術(shù)進(jìn)行文字轉(zhuǎn)換,這樣一來(lái),無(wú)論是被告人、法官、還是公訴律師,他們的對(duì)話都能夠快速轉(zhuǎn)成文字,在很短時(shí)間內(nèi)形成庭審內(nèi)容的紀(jì)錄文檔。這一工作目前是由書(shū)記員人工完成的,工作量很大,任務(wù)很繁重,在這一點(diǎn)上完全可以被機(jī)器所取代。其次,利用人工智能大數(shù)據(jù)技術(shù),對(duì)公辯雙方的內(nèi)容和案件數(shù)據(jù)進(jìn)行匹配,還可以及時(shí)發(fā)現(xiàn)控辯雙方陳述內(nèi)容中的漏洞和沖突內(nèi)容,加快審案進(jìn)程,充當(dāng)法官助手的角色。
智能語(yǔ)音技術(shù)在客服領(lǐng)域的應(yīng)用也比較多,通過(guò)強(qiáng)大的語(yǔ)義理解技術(shù),可以實(shí)現(xiàn)對(duì)話過(guò)程中上下文意思連貫的交互對(duì)話,這在單句理解的基礎(chǔ)上又更進(jìn)了一步,還需要實(shí)現(xiàn)上下文邏輯的串接和延伸。也許大家并不了解,有時(shí)候電話里傳來(lái)客服姑娘甜美的聲音,但實(shí)際上與你對(duì)話的也許只是一個(gè)機(jī)器人,而你還渾然不覺(jué)。
在會(huì)議同傳領(lǐng)域,我們已經(jīng)有機(jī)器能夠做到將語(yǔ)音轉(zhuǎn)換成中文顯示的同時(shí),進(jìn)行多語(yǔ)種翻譯,能夠根據(jù)上下文進(jìn)行自動(dòng)校正,這種翻譯結(jié)果只需要安排人進(jìn)行簡(jiǎn)單的確認(rèn)即可上屏顯示,這種“人機(jī)耦合”的工作模式,極大地降低了同傳翻譯工作者的工作強(qiáng)度。
上述很多例子都能夠說(shuō)明人工智能的浪潮已經(jīng)來(lái)臨,深入到了我們生活的方方面面,很多都達(dá)到了實(shí)用化的水平。但這也引發(fā)了社會(huì)的擔(dān)憂——人工智能會(huì)不會(huì)代替人類?答案是:不會(huì)。
正如演講最后我們看到的那個(gè)視頻所說(shuō),人工智能技術(shù),它擁有全世界的知識(shí),卻不能替代老師;它能診斷疾病,卻不能替代醫(yī)生;它了解成長(zhǎng)的秘密,卻不能替代母親??拼笥嶏w一直秉承一個(gè)理念,即“人工智能是技術(shù),技術(shù)是為人服務(wù)的”。人類有同理心,想象,感動(dòng),熱愛(ài),會(huì)寫故事,能創(chuàng)造美味,會(huì)發(fā)明,會(huì)孕育生命,這都是機(jī)器所不能做到的。人工智能,可以幫助各行各業(yè)的人提高勞動(dòng)效率,更有效,更精準(zhǔn),更智能,它只是人類的“超能力”。
人工智能確實(shí)走進(jìn)了我們的生活,我們城市的未來(lái)將越來(lái)越智慧化。謝謝大家!
在大會(huì)演講結(jié)束之后,童劍軍接受了記者的采訪,精彩內(nèi)容節(jié)選如下:
記者:科大訊飛用技術(shù)去賦能產(chǎn)業(yè)的時(shí)候會(huì)考慮哪些因素?
童劍軍:具體應(yīng)用場(chǎng)景首先要看市場(chǎng)需求,因?yàn)橹腔鄢鞘袑儆诔鞘薪ㄔO(shè)的一個(gè)階段,許多領(lǐng)先的城市已經(jīng)進(jìn)入到智能化、智慧化,一些城市仍然停留在信息化、網(wǎng)絡(luò)化,不同城市有不同的情況;其次,要看數(shù)據(jù)量夠不夠大,能不能滿足技術(shù)對(duì)數(shù)據(jù)的需求;最后要看企業(yè)有沒(méi)有耐心去攻克可能出現(xiàn)的技術(shù)難題。以上的三個(gè)條件都滿足了之后,才有可能在某一個(gè)行業(yè)領(lǐng)域取得成果。目前,我們?cè)诮逃?、司法和醫(yī)療等領(lǐng)域進(jìn)行了嘗試,并取得了不錯(cuò)的成果。如果沒(méi)有上述考慮,企業(yè)盲目地選擇賦能的產(chǎn)業(yè),到頭來(lái)可能毫無(wú)意義。
記者:您的演講中也提到了科大訊飛的智慧政法項(xiàng)目,目前,這方面的應(yīng)用已經(jīng)到了何種層面呢?
童劍軍:科大訊飛的智慧政法相關(guān)產(chǎn)品,是和最高法、最高檢聯(lián)合立項(xiàng)開(kāi)展的項(xiàng)目,我們稱之為 206 工程。主要的成果包括實(shí)現(xiàn)庭審過(guò)程的全語(yǔ)音記錄轉(zhuǎn)寫,利用司法大數(shù)據(jù)來(lái)幫助公安機(jī)關(guān)或檢查機(jī)關(guān)來(lái)判斷證據(jù)鏈的完整性和合理性。就證據(jù)鏈而言,信息量太大,人類容易產(chǎn)生疏漏;就案件而言,類似的案件在量刑和處罰方面都具有極大的參考意義;大數(shù)據(jù)分析能夠幫助法官精準(zhǔn)地獲取信息,同時(shí)又減輕了其工作量,相當(dāng)于一個(gè)非常有經(jīng)驗(yàn)的專家站在法官旁邊,隨時(shí)指導(dǎo)和幫助法官完成繁重的工作;這些都說(shuō)明了技術(shù)賦能司法領(lǐng)域的必要性和價(jià)值。
記者:除了司法領(lǐng)域的智慧政法,科大訊飛在醫(yī)療領(lǐng)域的具體應(yīng)用表現(xiàn)如何?
童劍軍:科大訊飛在醫(yī)療方面一個(gè)重要成果就是智醫(yī)助理。科大訊飛參與的醫(yī)考機(jī)器人課題,機(jī)器人與人類考生同時(shí)參加臨床執(zhí)業(yè)醫(yī)師綜合筆試,最終考了 456 分,及格線為 360 分,超過(guò)了 96% 以上的人類考生。如果它是一個(gè)人,就已經(jīng)完全可以有資格拿到執(zhí)業(yè)證書(shū),可以給人看病了。
基于醫(yī)考機(jī)器人的研究成果開(kāi)發(fā)出來(lái)的智醫(yī)助理產(chǎn)品,就像剛剛提到的智慧政法項(xiàng)目,可以幫助醫(yī)生進(jìn)行醫(yī)療診斷。假如一個(gè)人有了病,自己并不太懂,結(jié)果去掛了血液科,而血液科的醫(yī)生對(duì)其他科室的病癥不熟悉,到最后可能就會(huì)產(chǎn)生誤診,這是我們智醫(yī)助理應(yīng)用中的一個(gè)真實(shí)的案例;此時(shí)智醫(yī)助理就相當(dāng)于一個(gè)全科醫(yī)生,會(huì)根據(jù)患者的癥狀以百分比的形式給出分析結(jié)果,比如患者得血液病的概率是多大,得其他疾病的概率是多大;然后再分別給出再次檢查的建議,建議患者應(yīng)該要做哪些檢查。智醫(yī)助理“診病”的整個(gè)邏輯就和人類醫(yī)生一模一樣,不過(guò)會(huì)比人類醫(yī)生更加全面詳盡,畢竟它在所有專項(xiàng)科室方面都相當(dāng)于專家水平,能夠幫助人類醫(yī)生填補(bǔ)空缺的醫(yī)療知識(shí)。
而且,科大訊飛的智醫(yī)助理已經(jīng)建立了網(wǎng)上能力平臺(tái),在安徽建設(shè)了全國(guó)首家互聯(lián)網(wǎng)醫(yī)院,它的能力對(duì)外提供,無(wú)論是村級(jí)、市級(jí),還是縣級(jí)醫(yī)院,使用起來(lái)都不會(huì)有任何區(qū)分,這種“專家級(jí)”的能力服務(wù),在很大程度上彌補(bǔ)了相對(duì)落后地區(qū)的醫(yī)療水平,對(duì)我國(guó)整體醫(yī)療水平的建設(shè)和提升,是一個(gè)非常重大的成果。
記者:科大訊飛在打造智慧城市方面做了不少努力,那么,我國(guó)目前智慧城市的發(fā)展在國(guó)際上到了怎樣的水平?
童劍軍:這個(gè)話題,我只能表達(dá)我個(gè)人的一些觀點(diǎn)和看法了。從國(guó)家層面來(lái)說(shuō),中國(guó)的智慧城市建設(shè)應(yīng)該是走在世界前列的。我這個(gè)結(jié)論基于三點(diǎn)原因:第一,打造智慧城市,人工智能永遠(yuǎn)是核心技術(shù),而中國(guó)的人工智能技術(shù)在世界上屬于相對(duì)領(lǐng)先的水平;第二,中國(guó)擁有巨大的市場(chǎng),海量的數(shù)據(jù)和豐富的應(yīng)用場(chǎng)景,這些因素都賦予中國(guó)智慧城市建設(shè)無(wú)限的可能性。第三,中國(guó)城市的多樣性和復(fù)雜性比國(guó)外更大,因此要解決這些問(wèn)題也會(huì)更難。中國(guó)既然能夠?qū)⑦@些難題解決好,它的成果在國(guó)外很多不那么復(fù)雜的城市應(yīng)用,就有一種“殺雞用牛刀”的感覺(jué)。不管怎么說(shuō)吧,我個(gè)人認(rèn)為,我國(guó)智慧城市建設(shè)的成果,以及我國(guó)企業(yè)在這方面的實(shí)力,在國(guó)際上都可能處于,也應(yīng)該處于較為領(lǐng)先的水平。