智能語音應(yīng)該有顯示屏?蘋果全球副總裁最新解讀
拓?fù)洚a(chǎn)業(yè)研究所最新報告顯示,語音交互已經(jīng)成為智能時代的入口。2014年到2017年全球語音設(shè)備出貨量大幅度攀升,全球出貨量從2014年的不足500萬臺,到2017年出貨量將達到2500萬臺。2016年到2021年全球語音識別市場的年復(fù)合增長將達到43.6%。語音識別屬于人工智能的中間的基礎(chǔ)應(yīng)用層,這層分布有語音識別、NLP、機器視覺等。
圖1:語音識別市場的增長趨勢。
清華語音語言實驗室副主任王東認(rèn)為,語音識別其實是人工智能的一個分支,我們希望跟機器交互的時候能夠?qū)崿F(xiàn)比較自然的交流,而不是通過文本打字,這在未來是一個必不可少的智能交互手段。現(xiàn)在的語音識別與以往最大的不同,在于整個一套系統(tǒng)不再有那么多復(fù)雜的模塊,基本是由神經(jīng)網(wǎng)絡(luò)將從語音信號到說話內(nèi)容端到端的學(xué)習(xí)出來。由于深度學(xué)習(xí)的引入,語音識別系統(tǒng)的性能大幅提高。
圖2:現(xiàn)代語音識別系統(tǒng)
在智能手機和智能家居領(lǐng)域,語音識別是提高用戶體驗的一種手段,但不可忽視的是,顯示屏是智能手機體驗性能的關(guān)鍵特性,兩者之間的關(guān)系到底如何發(fā)展呢。蘋果副總裁的最新發(fā)言顯示,兩者不可獲取。智能語音可以為手機體驗、家居體驗插上翅膀,但是沒有顯示屏的語音識別似乎還是略顯單調(diào)。
5月6日報道,蘋果全球營銷副總裁菲爾·席勒表示,亞馬遜Echo等專用智能語音設(shè)備缺乏顯示屏在許多情況下是一種妨礙。就如人們習(xí)慣使用智能手機后,再拿起以前的諾基亞的功能手機,總覺得使用起來還是有諸多不便。
圖3:蘋果全球營銷副總裁菲爾·席勒
他說,蘋果堅定看好語音助理,稱蘋果持續(xù)開發(fā)Siri就是最好的例證。席勒還提到了迅速發(fā)展的純語音助理設(shè)備,這些設(shè)備沒有屏幕,僅支持語音操作,如亞馬遜Echo和谷歌Home。
“有時候,當(dāng)你不能使用顯示屏?xí)r,僅使用語音會更方便,比如你在開車時,或者在屋內(nèi)走動時,你希望Siri幫你切歌,而不用來回跑動。但即便如此,語音助理沒有屏幕仍會限制它的實用性,”席勒說。
“語音助理在許多時候都很方便,但這并不意味著你永遠(yuǎn)不需要屏幕,”他說,“因此我認(rèn)為,沒有屏幕在很多情況下并不適合。”
目前,Siri僅支持配備顯示屏的設(shè)備。去年,Siri作為macOS Sierra系統(tǒng)的一部分登陸了Mac電腦。
席勒拿蘋果地圖作為了例子,他說,當(dāng)在AppleWatch和CarPlay上進行導(dǎo)航時,語音助理能夠提供語音指示,但生動的地圖能夠幫助用戶更好地了解周圍環(huán)境。
席勒還提到了攝影,稱擁有顯示屏更有利于終端用戶。
“又比如攝影,它現(xiàn)在是人們購買我們產(chǎn)品最主要的原因之一,攝影就需要屏幕,”他說。“在我們分享的各種照片中,沒有屏幕的設(shè)備都不怎么實用。如今,社交應(yīng)用上的照片越來越多,因此它們在純語音設(shè)備上的使用體驗不會太好。”
對于最佳體驗,蘋果是相當(dāng)有發(fā)言權(quán)的,隨著中國制造的興起,特別是華為、騰訊這些本土企業(yè)在硬件和軟件系統(tǒng)方面的突破,相信未來在體驗的升級上面中國廠商會有自己的聲音。