人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學。 人工智能是計算機科學的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也不斷擴大,可以設(shè)想,未來人工智能帶來的科技產(chǎn)品,將會是人類智慧的“容器”。
如果說2017年科技圈什么最火,什么最熱,那一定是人工智能。但是人工智能這個概念實在太大,以至于但凡與之有一點點交集的產(chǎn)品都想冠以AI(Artificial Intelligence,即人工智能)的名頭。語音助手是人工智能;機器人是人工智能;甚至地圖導航也能是人工智能。那么貼近消費者生活的人工智能什么樣?我們從這款小雅AI音箱來一探究竟。
喜馬拉雅出品小雅AI音箱
這款小雅AI音箱來自喜馬拉雅FM,不過它的外觀設(shè)計由設(shè)計公司洛可可完成,而核心的語音技術(shù)則由人工智能公司獵戶星空提供。甚至在產(chǎn)品發(fā)布的時候,獵戶星空投資人、獵豹移動CEO傅盛為其站臺。陣仗是足夠大了,產(chǎn)品體驗我們慢慢來說。
外觀:好像現(xiàn)在的智能音箱都長這樣
現(xiàn)在的智能音箱產(chǎn)品似乎都長著一樣的面孔:一個圓筒,外面包裹一層音響喇叭金屬網(wǎng)似的設(shè)計。不過細節(jié)上,小雅AI音箱做了一些調(diào)整,它的外部不是金屬網(wǎng)而是一層織物,摸上去不像金屬那樣冰冰涼涼,而且手感不錯。不過也因為是織物的關(guān)系,表面容易沾上空氣中的白毛。
整個音箱可用的按鈕不多,因為大部分事兒都能通過語音完成,更何況還有配套的App可以使用。如果非要說有幾個按鈕,算上音量調(diào)節(jié),應(yīng)該是三個。小雅AI音箱的這三個按鈕都不顯得突兀,尤其是頂部的那兩個。
小雅AI音箱頂部的兩個按鈕,或者說一個按鈕加一個轉(zhuǎn)動調(diào)節(jié)器,可完成的事兒不多。中間那個是暫停/繼續(xù)開關(guān),有點類似于電源鍵,而在這個“電源鍵”外圍則是一圈可以手動調(diào)節(jié)的旋鈕,它的作用是調(diào)節(jié)音量。其實這兩個功能(暫停播放和音量調(diào)節(jié))也可以通過語音實現(xiàn),只不過對于一款音箱來說,最基礎(chǔ)的功能按鈕還是有必要的,不僅是因為語音的準確率問題,還和人們的使用習慣有關(guān)。
最后一個按鈕在音箱靠下的部分,上面畫著的標志很明確的告訴你它是用來關(guān)閉語音功能的。為什么一款基本靠語音操控的音箱需要一個關(guān)閉語音的按鈕呢?這大概是為了防止你有一個可愛的女友叫小雅而產(chǎn)生誤會吧。在開啟音箱的語音識別功能之前,一般都需要一個關(guān)鍵口令,比如Siri是“Hey,Siri”,然后Siri就會開啟語音識別模式,可以聽你叨叨叨地一直說,而小雅AI音箱的口令則是“小雅小雅”。
在關(guān)閉語音按鈕的另一側(cè)是“喜馬拉雅”四個字組成的logo,而再往下則是底座部分。這部分材料由織物變成了金屬,底座采用“三足”式的設(shè)計,在每個“足底”都有個貓爪樣式的膠墊,第一次把小雅AI音箱放在桌子上會覺得很穩(wěn)重。音箱的最底部是屬于電源的位置,由于沒有內(nèi)置電池,小雅AI音箱需要一直連接電源,好在我會把它放在家里固定位置,并不經(jīng)常移動。
講道理,我們平常使用手機放音樂已經(jīng)很方便了,脫離手機放音樂的時候不多,但懶癌犯了,能動口自然就不想動手了。所以最初上手小雅AI音箱的時候,有那么一股新鮮勁。再后來發(fā)現(xiàn),用語音點歌、切歌是真的很方便,尤其是用手機打“王者農(nóng)藥”的時候。
使用這款音箱之前,需要對它進行聯(lián)網(wǎng)設(shè)置。也許是因為沒有觸控面板,音箱本身又沒有那么多按鈕的緣故,設(shè)置網(wǎng)絡(luò)連接需要借助“小雅AI音箱”App完成,整個設(shè)置過程很簡單。
連接網(wǎng)絡(luò)成功之后,就可以向它發(fā)出指令了,首先你得喚醒它,對,就是“小雅小雅”。關(guān)于語音這部分,體驗好與不好的標準往往就那么幾個:容不容易喚醒、喚醒時聲音需要多大、精不精準。
如果你把它放在身邊,基本上就是和朋友面對面交流時的聲音大小;如果你們在同一間屋子,恐怕聲音要再大一點;我把它放在我家客廳,在距離五米左右的臥室喚醒它,就需要提高分貝,有點喊的勢頭了;在極端的情況下,比如我在距離它五米的臥室,它正在用最大音量放歌,這個時候想切歌,那就真的要用喊的了。
據(jù)官方介紹,小雅AI音箱四周麥克風有六個,再加上頂部的一個,組成6+1環(huán)形麥克風陣列。理論加實際體驗兩方面來講,都足以應(yīng)付日常生活中的情景。有意思的是,每次喚醒,它會用幾種不同的方式回應(yīng),類似“我在”、“哎”、“在”,即使它回應(yīng)了,你也可以繼續(xù)說指令,它基本上不會因為回應(yīng)而識別不清。
語音識別的時候會亮起“跑馬燈” 比較遺憾的是,對于中英問混合的指令小雅AI音箱基本上無法識別,所以如果想聽一首英文歌,還是拿手機放吧。中英文混合命令識別的準確性問題應(yīng)該算是語音助手圈子中的“世界難題”了,即便是人們熟知的Siri也很難完成,不過這里要贊一句小娜(Cortana,微軟研發(fā)的語音助手),它的中英文混合識別準確度還不錯,感興趣可以試試。
說回小雅智能AI音箱,前文提到,它有一個調(diào)節(jié)音量的實體旋鈕,實際上,調(diào)節(jié)音量這事完全可以用語音代替。你可以說“小雅小雅,音量調(diào)到30%”,甚至更模糊一些“小雅小雅,聲音調(diào)小一點”。
最后說說點歌時的體驗,用一句話來講就是不鬧心。準確率是一方面,即便不準確,它會根據(jù)你所說的部分關(guān)鍵詞為你推薦。有時候它推薦的那首就是你最初點的那首。無論中間經(jīng)歷了什么,識別對了也好,識別不清也好,最后它放的是你要的那首歌,這樣目的就達到了。另一個我比較滿意的地方是,它允許你在語音過程中有停頓,幾乎不會出現(xiàn)因為停頓導致話說一半就開始識別的情況。
至于內(nèi)容上,音樂方面,這款音箱的合作方是百度音樂,基本上沒有太大問題;其他內(nèi)容,當然由喜馬拉雅自家提供,包括免費和付費。
究竟什么才是智能音箱?
我們從小就被科幻大片的智能語音教育著,總覺得語音助手應(yīng)該像鋼鐵俠里的賈維斯、蝙蝠俠的電腦管家那樣才算得上智能吧。實際上,就目前技術(shù)來講還遠遠達不到。甚至我對小雅AI音箱說“小雅小雅,取消明天6:00叫我起床,改為6:30叫我起床”,它也只能幫我訂個6:30的鬧鐘,第二天六點還是會叫我一次。
那么,所謂的智能音箱就只是用來實現(xiàn)簡單的語音操控嗎?是,也不是。我個人感覺,人工智能之所以稱為智能,不是因為它能實現(xiàn)什么功能,而是因為它能自己學習。就像AlphaGo那樣,不只是單純的記住棋譜,然后用窮舉法計算所有可能,還能夠自己與自己對弈,不斷學習提升。
假想中的AlphaGo
落實到小雅AI音箱上,最簡單的例子是它能夠根據(jù)用戶的使用習慣播放內(nèi)容。舉個例子,我一開始講“小雅小雅,放一首《三生三世》”的時候,它會找一首任意歌手的《三生三世》,而當我講過幾次“張杰的《三生三世》”以后,再重復一開始的命令,它就會自動播放張杰的那首。這也許只是最低級最簡單最容易實現(xiàn)的學習用戶行為的例子,但是我覺得這就是一個“智能”的開始。
至于官方承諾的通過學習能夠智能推薦內(nèi)容,實現(xiàn)精準化智能推薦,甚至到最后演變成推薦的內(nèi)容都是用戶喜歡的,這一點我想掛個問號。畢竟使用時間有限,在之后的更新迭代中小雅AI音箱能做到什么程度,還需要慢慢發(fā)掘。
最后的最后,提一句大家關(guān)心的音質(zhì)問題。講真,小雅AI音箱的定位就是家庭智能語音助手,如果你追求音質(zhì)的話,蘋果公司打造的那款不在中國上市的HomePod可能更適合你。