捷通華聲:靈云開發(fā)者社區(qū)即將開放 智能人機(jī)交互產(chǎn)業(yè)需開放合作
7月16日消息(李明)隨著移動(dòng)互聯(lián)網(wǎng)、智能終端、云計(jì)算的飛速發(fā)展,智能人機(jī)交互(HCI)技術(shù)也迎來了大爆發(fā)的時(shí)代。那么,新的產(chǎn)業(yè)變革給智能人機(jī)交互技術(shù)帶來了哪些新的挑戰(zhàn)和機(jī)遇?智能人機(jī)交互技術(shù)如何才能更好地實(shí)現(xiàn)產(chǎn)業(yè)化發(fā)展?中國(guó)企業(yè)為迎接智能人機(jī)交互時(shí)代的到來又做了哪些準(zhǔn)備呢?
對(duì)于上述問題,北京捷通華聲語音技術(shù)有限公司(下稱“捷通華聲”)董事長(zhǎng)張連毅在接受C114專訪時(shí)為我們進(jìn)行了詳細(xì)解讀。
HCI技術(shù)大爆發(fā):捷通華聲推靈云平臺(tái)
當(dāng)前,語音合成、語音識(shí)別和手寫識(shí)別已經(jīng)成為智能人機(jī)交互的三項(xiàng)核心技術(shù),正在悄悄地影響和改變著人們的生活。其中,語音合成技術(shù)可以讓各種設(shè)備“開口講話”,把各種文本信息以語音的方式播報(bào);語音識(shí)別技術(shù)可以讓各種設(shè)備“聽懂”我們的話;手寫識(shí)別技術(shù)可以幫助人們從各種設(shè)備中繁瑣的按鍵操作中解脫出來,輕松輸入文字。
而在張連毅看來,隨著移動(dòng)互聯(lián)網(wǎng)、智能終端、云計(jì)算的飛速發(fā)展,智能人機(jī)交互技術(shù)也迎來了大爆發(fā)的時(shí)代。他認(rèn)為,“智能人機(jī)交互技術(shù)是各大技術(shù)產(chǎn)業(yè)變革的畫龍點(diǎn)睛之作,也是我國(guó)由‘中國(guó)制造’向‘中國(guó)創(chuàng)造’轉(zhuǎn)型的巨大機(jī)遇,中國(guó)在智能人機(jī)交互技術(shù)領(lǐng)域的起步絕不輸于外國(guó)企業(yè)。”
據(jù)張連毅介紹,捷通華聲憑借十多年來在智能人機(jī)交互技術(shù)、移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的雄厚積累,于2011年推出了全球第一個(gè)全方位智能人機(jī)交互感知云——靈云平臺(tái),為從“中國(guó)制造”向“中國(guó)創(chuàng)造”的全面升級(jí)提供了一個(gè)強(qiáng)大的“發(fā)動(dòng)機(jī)”引擎;隨后,又經(jīng)過各方面的應(yīng)用探索,于2012年再次推出了靈云平臺(tái)2.0版本。
目前,靈云平臺(tái)主要有語音合成(TTS)、語音識(shí)別(ASR)、手寫識(shí)別(HWR)、光學(xué)字符識(shí)別(OCR)、自然語言理解(NLU)這五項(xiàng)核心技術(shù),為不同領(lǐng)域、行業(yè)、企業(yè),乃至個(gè)人用戶,提供了多種智能人機(jī)交互解決方案,包括無紙化辦公方案、電子簽批方案、電子表單處理方案、語音技術(shù)方案、智能客服系統(tǒng)方案等,為企業(yè)高效辦公、人們便捷生活提供強(qiáng)有力的技術(shù)保障。
靈云平臺(tái)的客戶不僅涵蓋了政府、教育、金融、電信、能源、交通、醫(yī)療等傳統(tǒng)行業(yè)領(lǐng)域的客戶,更有智能家電、智能家居、互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)、智慧城市等新興領(lǐng)域的用戶。例如,目前捷通華聲已將靈云平臺(tái)與中國(guó)電信正在開發(fā)的EMP平臺(tái)實(shí)現(xiàn)無縫銜接,成為其開放平臺(tái)的重要組成部分,而捷通華聲則負(fù)責(zé)提供其中的人機(jī)交互技術(shù)支持;此外,捷通華聲靈云平臺(tái)技術(shù)還應(yīng)用到了百度語音助手等軟件平臺(tái)。
推動(dòng)技術(shù)成熟完善:靈云開發(fā)者社區(qū)即將開放
相關(guān)數(shù)據(jù)顯示,捷通華聲已在國(guó)內(nèi)語音識(shí)別、手寫識(shí)別、模式識(shí)別技術(shù)市場(chǎng)占有了較大的市場(chǎng)份額,2010年世博會(huì)廣播系統(tǒng)的語音技術(shù)80%是由捷通華聲提供支持,全國(guó)的高鐵所有站臺(tái)的信息播報(bào)系統(tǒng),都是采用捷通華聲的語音合成技術(shù)。
雖然,捷通華聲在智能人機(jī)交互技術(shù)領(lǐng)域已經(jīng)成為領(lǐng)先廠商,但捷通華聲在該領(lǐng)域的耕耘遠(yuǎn)不止于此。張連毅指出,“雖然智能人機(jī)交互技術(shù)已經(jīng)取得了非常廣泛的應(yīng)用,但其技術(shù)本身還存在一些不完善的地方,例如語音識(shí)別率還不能做到百分之百,語音合成雖然已經(jīng)可以流利地學(xué)習(xí)人講話,但講話的語氣及感情色彩相比真人還有一定差距。”
因此,業(yè)界還需要去不斷學(xué)習(xí)、了解、應(yīng)用、完善好這些智能人機(jī)交互技術(shù),這需要整個(gè)產(chǎn)業(yè)來推動(dòng)其發(fā)展。張連毅透露,“為此,捷通華聲的靈云開發(fā)者社區(qū)決定在今年7月18日向整個(gè)社會(huì)全方位開放各項(xiàng)能力,所有的企業(yè)和個(gè)人開發(fā)者都可以免費(fèi)加入到靈云開發(fā)者社區(qū)。”
“在靈云開發(fā)者社區(qū),企業(yè)和個(gè)人開發(fā)者均可直接下載語音合成(TTS)、語音識(shí)別(ASR)、手寫識(shí)別(HWR)、光學(xué)字符識(shí)別(OCR)等多項(xiàng)HCI核心技術(shù)。與此同時(shí),捷通華聲還將加強(qiáng)技術(shù)指導(dǎo),幫助開發(fā)者把不同的智能人機(jī)交互技術(shù)應(yīng)用到產(chǎn)品上,與企業(yè)和個(gè)人開發(fā)者共同了解、學(xué)習(xí)、切磋、完善各種智能人機(jī)交互技術(shù)。”張連毅說。
據(jù)了解,靈云開發(fā)者社區(qū)作為捷通華聲靈云平臺(tái)的門戶,是整個(gè)靈云平臺(tái)非常重要的一部分。開發(fā)者社區(qū)將靈云平臺(tái)的所有能力全部開放給用戶,讓用戶可以自主的選擇需要的能力去創(chuàng)造想要的產(chǎn)品,大到平臺(tái)級(jí)智能人機(jī)交互多種能力的需求,小到個(gè)人開發(fā)者擁有的開發(fā)夢(mèng)想,靈云平臺(tái)都可以滿足。
“在這里,開發(fā)者可以享受多能力支持服務(wù)、相互交流開發(fā)心得、創(chuàng)造多能力集合產(chǎn)品并上線產(chǎn)品。更為重要的是,通過開發(fā)者社區(qū)利用靈云平臺(tái)的多種能力,開發(fā)者可結(jié)合自己的創(chuàng)造力,創(chuàng)造出各種新型的智能人機(jī)交互產(chǎn)品,這不僅有利于服務(wù)大眾創(chuàng)造價(jià)值,還能夠共同推動(dòng)智能人機(jī)交互技術(shù)產(chǎn)業(yè)的發(fā)展。”張連毅強(qiáng)調(diào),開發(fā)者社區(qū)是一個(gè)充滿創(chuàng)造的世界,在這里通過我們共同的努力能夠完成由“中國(guó)制造”到“中國(guó)創(chuàng)造”的完美轉(zhuǎn)變,靈云開發(fā)者社區(qū)歡迎每一位企業(yè)和個(gè)人開發(fā)者的加入。
面對(duì)競(jìng)爭(zhēng):開放與合作可獲雙贏
除了通過靈云開發(fā)者社區(qū)來不斷完善智能人機(jī)交互技術(shù)以外,捷通華聲對(duì)于整個(gè)產(chǎn)業(yè)的發(fā)展也有著自己的獨(dú)到見解。當(dāng)前,智能人機(jī)交互技術(shù)早已不是什么新鮮事,微軟、百度、谷歌、騰訊等公司都已進(jìn)入這個(gè)領(lǐng)域并有很強(qiáng)的研發(fā)實(shí)力,而作為專業(yè)的HCI技術(shù)提供商,科大訊飛、漢王等公司在各單項(xiàng)技術(shù)領(lǐng)域也獲得了不錯(cuò)的成績(jī),智能人機(jī)交互產(chǎn)業(yè)迎來了群雄并起的時(shí)代。
在張連毅看來,智能人機(jī)交互技術(shù)正在迎來產(chǎn)業(yè)新的發(fā)展機(jī)遇。面對(duì)競(jìng)爭(zhēng)對(duì)手的沖擊,捷通華聲會(huì)坦然面對(duì)這種競(jìng)爭(zhēng),并且繼續(xù)開放智能人機(jī)交互技術(shù)的各種能力,憑借近20年在這個(gè)領(lǐng)域的積累繼續(xù)完善技術(shù),同時(shí)與業(yè)界保持密切的合作,以保持自身技術(shù)的領(lǐng)先性。
“毫無疑問,采取排斥和封閉的態(tài)度并不有利于智能人機(jī)交互技術(shù)產(chǎn)業(yè)的良性發(fā)展。”張連毅表示,“正如靈云平臺(tái)定位于智能人機(jī)交互技術(shù)的能力開放服務(wù)平臺(tái)一樣,我們希望通過靈云平臺(tái)向所有能夠使用智能人機(jī)交互技術(shù)的廠商和開發(fā)者,提供全方位的核心技術(shù)能力;此外,捷通華聲還會(huì)加強(qiáng)與業(yè)界合作伙伴乃至競(jìng)爭(zhēng)對(duì)手的溝通與合作,共同把產(chǎn)業(yè)做大做強(qiáng)。”[!--empirenews.page--]
例如,一直以來捷通華聲與百度公司都保持著良好的合作伙伴關(guān)系。前不久,為促進(jìn)雙方在智能人機(jī)交互核心技術(shù)與產(chǎn)品等方面的合作,百度公司投資入股捷通華聲。張連毅認(rèn)為,此次戰(zhàn)略合作,不僅對(duì)百度廣泛應(yīng)用語音合成、手寫識(shí)別等技術(shù)形成支撐,也將對(duì)捷通華聲智能人機(jī)交互技術(shù)的廣泛應(yīng)用與市場(chǎng)拓展產(chǎn)生非常大的促進(jìn)作用。
北京捷通華聲語音技術(shù)有限公司董事長(zhǎng) 張連毅