“懶癌患者”的福音：小雅AI音箱

時間：2017-06-26 13:15:49

關(guān)鍵字： AI 人工智能喜馬拉雅電源新品音箱小雅

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]如果說2017年科技圈什么最火，什么最熱，那一定是人工智能。但是人工智能這個概念實在太大，以至于但凡與之有一點點交集的產(chǎn)品都想冠以AI(Artificial Intelligence，即人工智能)的名頭。語音助手是人工智能;機器人是人工智能;甚至地圖導航也能是人工智能。那么貼近消費者生活的人工智能什么樣?我們從這款小雅AI音箱來一探究竟。

人工智能(Artificial Intelligence)，英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學。人工智能是計算機科學的一個分支，它企圖了解智能的實質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器，該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來，理論和技術(shù)日益成熟，應(yīng)用領(lǐng)域也不斷擴大，可以設(shè)想，未來人工智能帶來的科技產(chǎn)品，將會是人類智慧的“容器”。

如果說2017年科技圈什么最火，什么最熱，那一定是人工智能。但是人工智能這個概念實在太大，以至于但凡與之有一點點交集的產(chǎn)品都想冠以AI(Artificial Intelligence，即人工智能)的名頭。語音助手是人工智能;機器人是人工智能;甚至地圖導航也能是人工智能。那么貼近消費者生活的人工智能什么樣?我們從這款小雅AI音箱來一探究竟。

喜馬拉雅出品小雅AI音箱　　

這款小雅AI音箱來自喜馬拉雅FM，不過它的外觀設(shè)計由設(shè)計公司洛可可完成，而核心的語音技術(shù)則由人工智能公司獵戶星空提供。甚至在產(chǎn)品發(fā)布的時候，獵戶星空投資人、獵豹移動CEO傅盛為其站臺。陣仗是足夠大了，產(chǎn)品體驗我們慢慢來說。

外觀：好像現(xiàn)在的智能音箱都長這樣

現(xiàn)在的智能音箱產(chǎn)品似乎都長著一樣的面孔：一個圓筒，外面包裹一層音響喇叭金屬網(wǎng)似的設(shè)計。不過細節(jié)上，小雅AI音箱做了一些調(diào)整，它的外部不是金屬網(wǎng)而是一層織物，摸上去不像金屬那樣冰冰涼涼，而且手感不錯。不過也因為是織物的關(guān)系，表面容易沾上空氣中的白毛。

整個音箱可用的按鈕不多，因為大部分事兒都能通過語音完成，更何況還有配套的App可以使用。如果非要說有幾個按鈕，算上音量調(diào)節(jié)，應(yīng)該是三個。小雅AI音箱的這三個按鈕都不顯得突兀，尤其是頂部的那兩個。

小雅AI音箱頂部的兩個按鈕，或者說一個按鈕加一個轉(zhuǎn)動調(diào)節(jié)器，可完成的事兒不多。中間那個是暫停/繼續(xù)開關(guān)，有點類似于電源鍵，而在這個“電源鍵”外圍則是一圈可以手動調(diào)節(jié)的旋鈕，它的作用是調(diào)節(jié)音量。其實這兩個功能(暫停播放和音量調(diào)節(jié))也可以通過語音實現(xiàn)，只不過對于一款音箱來說，最基礎(chǔ)的功能按鈕還是有必要的，不僅是因為語音的準確率問題，還和人們的使用習慣有關(guān)。

最后一個按鈕在音箱靠下的部分，上面畫著的標志很明確的告訴你它是用來關(guān)閉語音功能的。為什么一款基本靠語音操控的音箱需要一個關(guān)閉語音的按鈕呢?這大概是為了防止你有一個可愛的女友叫小雅而產(chǎn)生誤會吧。在開啟音箱的語音識別功能之前，一般都需要一個關(guān)鍵口令，比如Siri是“Hey，Siri”，然后Siri就會開啟語音識別模式，可以聽你叨叨叨地一直說，而小雅AI音箱的口令則是“小雅小雅”。

在關(guān)閉語音按鈕的另一側(cè)是“喜馬拉雅”四個字組成的logo，而再往下則是底座部分。這部分材料由織物變成了金屬，底座采用“三足”式的設(shè)計，在每個“足底”都有個貓爪樣式的膠墊，第一次把小雅AI音箱放在桌子上會覺得很穩(wěn)重。音箱的最底部是屬于電源的位置，由于沒有內(nèi)置電池，小雅AI音箱需要一直連接電源，好在我會把它放在家里固定位置，并不經(jīng)常移動。

講道理，我們平常使用手機放音樂已經(jīng)很方便了，脫離手機放音樂的時候不多，但懶癌犯了，能動口自然就不想動手了。所以最初上手小雅AI音箱的時候，有那么一股新鮮勁。再后來發(fā)現(xiàn)，用語音點歌、切歌是真的很方便，尤其是用手機打“王者農(nóng)藥”的時候。

使用這款音箱之前，需要對它進行聯(lián)網(wǎng)設(shè)置。也許是因為沒有觸控面板，音箱本身又沒有那么多按鈕的緣故，設(shè)置網(wǎng)絡(luò)連接需要借助“小雅AI音箱”App完成，整個設(shè)置過程很簡單。

連接網(wǎng)絡(luò)成功之后，就可以向它發(fā)出指令了，首先你得喚醒它，對，就是“小雅小雅”。關(guān)于語音這部分，體驗好與不好的標準往往就那么幾個：容不容易喚醒、喚醒時聲音需要多大、精不精準。

如果你把它放在身邊，基本上就是和朋友面對面交流時的聲音大小;如果你們在同一間屋子，恐怕聲音要再大一點;我把它放在我家客廳，在距離五米左右的臥室喚醒它，就需要提高分貝，有點喊的勢頭了;在極端的情況下，比如我在距離它五米的臥室，它正在用最大音量放歌，這個時候想切歌，那就真的要用喊的了。

據(jù)官方介紹，小雅AI音箱四周麥克風有六個，再加上頂部的一個，組成6+1環(huán)形麥克風陣列。理論加實際體驗兩方面來講，都足以應(yīng)付日常生活中的情景。有意思的是，每次喚醒，它會用幾種不同的方式回應(yīng)，類似“我在”、“哎”、“在”，即使它回應(yīng)了，你也可以繼續(xù)說指令，它基本上不會因為回應(yīng)而識別不清。

語音識別的時候會亮起“跑馬燈”　　比較遺憾的是，對于中英問混合的指令小雅AI音箱基本上無法識別，所以如果想聽一首英文歌，還是拿手機放吧。中英文混合命令識別的準確性問題應(yīng)該算是語音助手圈子中的“世界難題”了，即便是人們熟知的Siri也很難完成，不過這里要贊一句小娜(Cortana，微軟研發(fā)的語音助手)，它的中英文混合識別準確度還不錯，感興趣可以試試。

說回小雅智能AI音箱，前文提到，它有一個調(diào)節(jié)音量的實體旋鈕，實際上，調(diào)節(jié)音量這事完全可以用語音代替。你可以說“小雅小雅，音量調(diào)到30%”，甚至更模糊一些“小雅小雅，聲音調(diào)小一點”。

最后說說點歌時的體驗，用一句話來講就是不鬧心。準確率是一方面，即便不準確，它會根據(jù)你所說的部分關(guān)鍵詞為你推薦。有時候它推薦的那首就是你最初點的那首。無論中間經(jīng)歷了什么，識別對了也好，識別不清也好，最后它放的是你要的那首歌，這樣目的就達到了。另一個我比較滿意的地方是，它允許你在語音過程中有停頓，幾乎不會出現(xiàn)因為停頓導致話說一半就開始識別的情況。

至于內(nèi)容上，音樂方面，這款音箱的合作方是百度音樂，基本上沒有太大問題;其他內(nèi)容，當然由喜馬拉雅自家提供，包括免費和付費。

究竟什么才是智能音箱?

我們從小就被科幻大片的智能語音教育著，總覺得語音助手應(yīng)該像鋼鐵俠里的賈維斯、蝙蝠俠的電腦管家那樣才算得上智能吧。實際上，就目前技術(shù)來講還遠遠達不到。甚至我對小雅AI音箱說“小雅小雅，取消明天6:00叫我起床，改為6:30叫我起床”，它也只能幫我訂個6:30的鬧鐘，第二天六點還是會叫我一次。

那么，所謂的智能音箱就只是用來實現(xiàn)簡單的語音操控嗎?是，也不是。我個人感覺，人工智能之所以稱為智能，不是因為它能實現(xiàn)什么功能，而是因為它能自己學習。就像AlphaGo那樣，不只是單純的記住棋譜，然后用窮舉法計算所有可能，還能夠自己與自己對弈，不斷學習提升。

假想中的AlphaGo

落實到小雅AI音箱上，最簡單的例子是它能夠根據(jù)用戶的使用習慣播放內(nèi)容。舉個例子，我一開始講“小雅小雅，放一首《三生三世》”的時候，它會找一首任意歌手的《三生三世》，而當我講過幾次“張杰的《三生三世》”以后，再重復一開始的命令，它就會自動播放張杰的那首。這也許只是最低級最簡單最容易實現(xiàn)的學習用戶行為的例子，但是我覺得這就是一個“智能”的開始。

至于官方承諾的通過學習能夠智能推薦內(nèi)容，實現(xiàn)精準化智能推薦，甚至到最后演變成推薦的內(nèi)容都是用戶喜歡的，這一點我想掛個問號。畢竟使用時間有限，在之后的更新迭代中小雅AI音箱能做到什么程度，還需要慢慢發(fā)掘。

最后的最后，提一句大家關(guān)心的音質(zhì)問題。講真，小雅AI音箱的定位就是家庭智能語音助手，如果你追求音質(zhì)的話，蘋果公司打造的那款不在中國上市的HomePod可能更適合你。