在科技方面,我們總幻想著下一個偉大發(fā)明;新聞快訊:偉大發(fā)明已經(jīng)出現(xiàn)了。自從智能手機出現(xiàn)之后,智能喇叭迅速獲得消費者接受;光是在今年的第一季,全球智能喇叭的出貨量就達到了920萬個單位。
這個結(jié)果應(yīng)該在意料之中,智能手機讓我們能一手掌握電話、計算機、娛樂、文字瀏覽與更多功能,而智能助理能提供上述所有功能,但不需要我們親自拿著裝置或在裝置上打字,我們只要對著智能喇叭提出問題與指令就行。
在第一波的智能助理中,Amazon Echo與Google Home引進了全新的家用電器,并支持語音提示的網(wǎng)絡(luò)搜索,接著很快拓展為可以控制其他設(shè)備,包括電視、自動恒溫器與其他設(shè)備。便利性與競爭性推動了第二波的成本降低與多樣形式因子:出現(xiàn)在Amazon Echo Dot、Google Home mini、阿里巴巴的Tmall Genie,以及小米的小愛同學(xué)音箱。
科技公司積極追逐這個事業(yè),因為他們看見對于聲控智能家庭(以及讓其他所有物品智能化)的收入潛力。這個智能手機市場在去年底已逼近了5,000億美元,估計在2023年前,這個智能家庭市場將會達到1,550億美元,使其成為極有價值的下一個偉大發(fā)明。在這個市場中,智能喇叭的年復(fù)合成長率(CAGR)估計到了2020年將會接近50%,目前是由Amazon、Google與阿里巴巴占據(jù)鰲頭,他們都察覺到智能市場的快速發(fā)展,企業(yè)皆忙亂地想確保自己能分食與控制這個行動的一部份。
既然我們能看見可能的發(fā)展,因此注意力也轉(zhuǎn)向?qū)Υ丝萍嫉挠行Ю?。有一部份是拓展家庭控制:再也不需要遙控器、控制面版或手機應(yīng)用程序。用戶應(yīng)能全部透過語音互動就控制電視、音樂、微波爐、烤箱、空調(diào)、前門。透過更優(yōu)秀的自然語言處理(NLP)以及和更多服務(wù)聯(lián)機、回答天氣相關(guān)問題、確認(rèn)你的行事歷、完成網(wǎng)絡(luò)購物、代叫Uber,我們可以預(yù)見現(xiàn)代的云端型智能助理將有更多進展。
家中的隱形智能助理(來源:CEVA)
這個進化已經(jīng)推動了第三波變化:電視現(xiàn)在可以透過遙控器使用語音控制(一小步進展——你還是可以丟掉遙控器),我們有各種聲控設(shè)備,包括手表(遠優(yōu)于觸控接口)、耳塞式耳機、頭戴式耳機、鬧鐘、掃地機器人,甚至燈泡也能聲控?,F(xiàn)在,認(rèn)為任何電子設(shè)備都能透過語音指令控制是非常合理的想象(“微波爐,解凍5分鐘”)。三星在家電用品自動化方面已展現(xiàn)了優(yōu)秀表現(xiàn),他們宣布“希望在 2020年前每個家電都能跟使用者說話。”
這聽起來再自然不過了。通用型智能助理(客廳里的智能喇叭)應(yīng)該能控制所有這些裝置,但它們并不總是最佳選擇,或許是它們的位置正巧不在你想控制的裝置附近。在多種家電內(nèi)建聲控功能已變成強制選項,這些供貨商也能轉(zhuǎn)向第三方解決方案,讓云端型NLP(如Amazon語音服務(wù))增加用戶經(jīng)驗。
這個隱形智能助理無所不在的第三波發(fā)展,將不會只把智能控制加入我們的家中(還有辦公室與許多其他場所),隱形智能助理也將讓我們從中央控制中解放;再也不需要遙控器、不必操控智能手機上的應(yīng)用程序、甚至不需要四散在家里的第一波智能喇叭了。想控制某個家電?告訴附近的語音助理就好。到了那個時候,就再也不需要考慮智能控制中心了——智能助理變得隨處可用。
自動化隱形智能助理(數(shù)據(jù)源:CEVA)
想讓這一切想象成真需要有哪些進展?語音啟動與識別硬件、軟件,就從精密、低耗能的高效能DSP型科技開始。如同你現(xiàn)在使用的智能助理一樣,它必須支持多種麥克風(fēng),以及波束成型技術(shù)與精密噪聲及回音消除,才能有效地從背景噪音及其他說話聲中分辨出位于房間另一端的喇叭。它應(yīng)該要至少能識別出觸發(fā)用語(“Alexa”、“好,Google”、“微波爐”),甚至驗證使用者。要仰賴云端的信息往返,只會讓觸發(fā)識別與驗證耗費太多時間(及消耗太多電力)。這個解決方案也需要支持「干預(yù)」——讓你可以中途打斷正在播放音樂及響應(yīng)你的隱形智能助理。另外,若這個裝置是由電池供電,就需要以很低的待機電力運作。
例如,CEVA為這類型的解決方案建立及部署科技,在其CEVA-TeakLite-4與CEVA-X2音頻/語音DSP IP,以及提供跨不同市場需求算法支持,以分辨語音及啟動的ClearVox軟件之間,為客戶提供低功耗、低系統(tǒng)成本與高度可靠的解決方案。增加麥克風(fēng)、自動語音識別,以及和某些識別層級的聯(lián)機,產(chǎn)品就能擁有聲控功能,立即變得與眾不同。