不論是不溫不火的智能穿戴、智能家居類產(chǎn)品,還是最近大火的各種用途的智能機器人。我們明顯感受到在硬件智能化的過程中,語音交互已成為一項普遍并且關(guān)鍵的交互、控制技術(shù),只需動一下“嘴巴”,在我們生活周圍的智能產(chǎn)品就會實時改變所處環(huán)境的溫度、濕度、亮度等,機器人還會給你唱歌、跳舞,陪伴孩子。無可厚非語音交互是一項極具無限前景的人工智能交互技術(shù)。
作為中國最大的智能語音技術(shù)提供商,科大訊飛一直積極耕耘智能語音產(chǎn)業(yè),推出了全球首個移動互聯(lián)網(wǎng)智能交互平臺“訊飛開放平臺”, 它是一個以語音交互為核心的人工智能開放平臺,為移動互聯(lián)網(wǎng)、智能硬件、機器人等領(lǐng)域的開發(fā)伙伴提供開放技術(shù)服務和解決方案。
訊飛開放平臺產(chǎn)品總監(jiān) 張良春
據(jù)來到2016中國硬件創(chuàng)新大賽深圳實戰(zhàn)對接會的訊飛開放平臺產(chǎn)品總監(jiān)張良春介紹,目前平臺日服務量近15億人次,為13萬開發(fā)伙伴和8終端用戶提供語音及人工智能交互服務,普通話識別準確率突破95%,并開放多達十八種方言。
訊飛開放平臺作為全球首個開放的智能交互技術(shù)服務平臺,致力于為開發(fā)者打造一站式智能人機交互解決方案。用戶可通過互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng),使用任何設(shè)備、在任何時間、任何地點,隨時隨地享受訊飛開放平臺提供的“聽、說、讀、寫……”等全方位的人工智能服務。目前,開放平臺以“云+端”的形式向開發(fā)者提供語音合成、語音識別、語音喚醒、語義理解、人臉識別、個性化彩鈴、移動應用分析等多項服務。
張總作為技術(shù)負責人參與構(gòu)建了具備面向十億級互聯(lián)網(wǎng)用戶提供語音交互服務能力的“訊飛開放平臺”及整個平臺的數(shù)據(jù)建設(shè)工作。他現(xiàn)在負責訊飛開放平臺智能硬件業(yè)務線產(chǎn)品相關(guān)工作,協(xié)助上百家機器人公司進行產(chǎn)品研發(fā)和落地,在人機交互方面有大量的實踐經(jīng)驗。
國內(nèi)外企業(yè)、中小創(chuàng)業(yè)團隊和個人開發(fā)者,均可在訊飛開放平臺直接體驗世界領(lǐng)先的語音技術(shù),并簡單快速集成到產(chǎn)品中,讓產(chǎn)品具備“能聽會說會思考會預測”的功能。“用戶在訊飛開放平臺體驗諸多免費服務的同時,也可以根據(jù)用戶自身的技術(shù)特點和產(chǎn)品性能,對自身的產(chǎn)品進行優(yōu)化,并且根據(jù)產(chǎn)品需求找到訊飛進行深度定制。”張總說。
目前,訊飛開放平臺針對運算能力較弱的設(shè)備,也提供了輕量級的MSCmini,小型設(shè)備的語音交互體驗依舊出色;針對家居場景的噪聲環(huán)境和遠距離對話情況,訊飛開放平臺推出完善的智能家居遠場語音交互方案。針對機器人的噪聲環(huán)境和遠距離對話情況,訊飛開放平臺推出軟硬一體化的機器人語音交互方案。
他表示,以前接入平臺移動應用比較多,訊飛開放平臺5年來為眾多移動應用提供了穩(wěn)定可靠的語音云服務,海量服務器輕松應對高并發(fā)訪問。隨著近幾年各種智能硬件的興起,接入訊飛開放平臺中智能家居類、可穿戴設(shè)備、機器人領(lǐng)域的設(shè)備居多。
當語音技術(shù)作為智能硬件的重要入口,讓人機交互內(nèi)容豐富,體驗自然簡潔。但目前的語音交互在實際應用中依然不盡如人意。你可能遇到過以下問題:交互需要按照雙方的發(fā)言順序來緩沖識別;距離、環(huán)境噪音等因素嚴重干擾語音識別的正確率;識別系統(tǒng)不能完全理解用戶的真實本意。
科大訊飛認為要真正實現(xiàn)流暢的人機交互,必須滿足四點:第一是遠場降噪;第二是方言識別;第三是全雙工,隨時隨地在聽;第四個自動糾錯,主動糾錯,支持多輪對話、打斷、上下文相關(guān)。只有這些都具備,才是萬物互聯(lián)時代真正的人機語音交互系統(tǒng)。
于是,科大訊飛“聰明”地以語音為主結(jié)合圖像視覺及手寫識別,以及整個人工智能功能集結(jié)在一起,推出了業(yè)界首個人工智能的用戶交互界面——AIUI。
AIUI它集成了包括雙全工技術(shù)、麥克風陣列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和和內(nèi)容服務。通過統(tǒng)一的交互接口,可以讓訊飛各種人工智能能力,非常方便的被用戶使用。在線離線能力的靈活搭配,并具備很強的服務拓展的功能,使得未來最新的人工智能成果都可以放到AIUI的統(tǒng)一界面下。
AIUI服務實現(xiàn)三個一體化,第一是軟硬件一體化,智能硬件可以直接采購訊飛的各種類型的麥克風陣列,使它360度使它五到八米之外都可以方便的來操控這個設(shè)備;
其次是云和端一體。有越來越多的家電設(shè)備智能家居它不聯(lián)網(wǎng),那么能聯(lián)網(wǎng)我們的能力在后臺,如果不能聯(lián)網(wǎng)或者我們要節(jié)約后臺運算資源可以直接有端的解決方案。
第三是技術(shù)服務一體化。通過這個AIUI界面,訊飛可以給開發(fā)伙伴各種應用差異化的定制。那么,當然也可以應用在各種語音識別場景,包括后臺的語義定制可以實現(xiàn)技術(shù)服務一體化。
他指出,未來人機交互方面,根據(jù)技術(shù)特點和產(chǎn)品需求訊飛會提更多方案,使得產(chǎn)品和技術(shù)融合的更好。他認為,智能家居想象空間很大。比如,未來居家所處環(huán)境可根據(jù)個人生活習慣、狀態(tài)做出即時改變,個性化的和多種控制結(jié)合是趨勢。當然這目前只是暢想啦!當下最重要的是結(jié)合技術(shù)進步,產(chǎn)出更多切實改善消費者生活的智能硬件。