我們所說(shuō)的“語(yǔ)音”是什么意思?一文讀懂語(yǔ)音識(shí)別技術(shù)
基于語(yǔ)音的技術(shù)將對(duì)許多行業(yè)產(chǎn)生巨大影響,在短短兩年內(nèi),預(yù)計(jì)50%的搜索將基于語(yǔ)音技術(shù)。
該項(xiàng)技術(shù)的普及率可能因用戶(hù)的年齡、地理位置和讀寫(xiě)能力而有所不同,但一些市場(chǎng)和平臺(tái)已擁有很高的滲透率,而全球10%的搜索已經(jīng)是基于語(yǔ)音的搜索。
在這一領(lǐng)域?qū)?huì)出現(xiàn)新的贏家和輸家,而現(xiàn)有品牌將需要考慮到在收購(gòu)過(guò)程中失去對(duì)消費(fèi)者對(duì)話的控制的影響,這加大了在競(jìng)爭(zhēng)中脫穎而出的難度。
然而,語(yǔ)音界面為各品牌提供了前所未有的機(jī)會(huì),讓它們能以一種極為強(qiáng)大的新方式與消費(fèi)者進(jìn)行互動(dòng),而目前來(lái)說(shuō),很少有品牌利用到了這一點(diǎn)。
當(dāng)前廣泛使用的功能在范圍和用途上均受到限制。就開(kāi)發(fā)創(chuàng)新的內(nèi)容和體驗(yàn),以及全新的服務(wù)來(lái)說(shuō),現(xiàn)下各品牌仍有機(jī)會(huì)。
那些能在此情景下崛起的品牌,在提升市場(chǎng)份額方面處于有利地位。此外,市面上有許多工具,讓用戶(hù)可以用最低限額的投資來(lái)輕松地進(jìn)行語(yǔ)音實(shí)驗(yàn)。
我們的建議是盡快開(kāi)始一項(xiàng)服務(wù)設(shè)計(jì)和聲音試驗(yàn)的低投資計(jì)劃,可能還要與市場(chǎng)推廣活動(dòng)相結(jié)合,以便讓你的品牌充分利用這項(xiàng)技術(shù)所帶來(lái)的機(jī)遇。
我們所說(shuō)的“語(yǔ)音”是什么意思?
在本文的語(yǔ)境中,我們對(duì)“語(yǔ)音”的定義是自動(dòng)化的語(yǔ)音服務(wù)。它涵蓋了從交互式文字到實(shí)用工具內(nèi)的所有信息,內(nèi)置于定制的硬件設(shè)備,以及手機(jī)和云端應(yīng)用內(nèi)的各種應(yīng)用,可通過(guò)品牌產(chǎn)品或人工智能行業(yè)內(nèi)的幾大公司的虛擬助手來(lái)進(jìn)行訪問(wèn)。
很多關(guān)于基于語(yǔ)音的技術(shù)的宣傳都圍繞著智能音箱的普及(75%的美國(guó)家庭預(yù)計(jì)在2020年均擁有智能音箱),以及音響附帶的“語(yǔ)音助手”?,F(xiàn)在已有幾個(gè)公司允許第三方直接整合旗下的智能助理,有點(diǎn)像智能手機(jī)上的應(yīng)用。
此外,需要注意的是,不論是上文提及的還是其他語(yǔ)音助手也可以在其他硬件(通常是手機(jī)和平板電腦)上使用,人們可通過(guò)手機(jī)應(yīng)用和深度操作系統(tǒng)集成來(lái)使用,但也可以通過(guò)定制硬件設(shè)備,甚至是網(wǎng)站來(lái)使用語(yǔ)音助手。
從許多方面來(lái)看,語(yǔ)音和機(jī)器人背后的技術(shù)都是一樣的,但二者之間在生態(tài)系統(tǒng)和影響這兩方面的差異足以使語(yǔ)音技術(shù)成為一個(gè)非常重要的領(lǐng)域。
語(yǔ)音簡(jiǎn)史
基于語(yǔ)音的交互界面已經(jīng)存在了幾十年,盡管它們最具影響力的方面一直是客戶(hù)服務(wù)電話。大多數(shù)與語(yǔ)音相關(guān)的系統(tǒng)都遭遇了各種各樣的問(wèn)題,從語(yǔ)音識(shí)別到復(fù)雜的生態(tài)系統(tǒng)。
五年前,行業(yè)領(lǐng)先的語(yǔ)音識(shí)別技術(shù)的準(zhǔn)確率僅為75%左右,機(jī)器學(xué)習(xí)技術(shù)、系統(tǒng)和硬件的最新發(fā)展,使得最好的語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確率提高到了95%到97%。
不斷接近并跨過(guò)這一認(rèn)知門(mén)檻成了當(dāng)前語(yǔ)音產(chǎn)業(yè)繁榮的最大因素。人類(lèi)識(shí)別口語(yǔ)詞匯的準(zhǔn)確率約95%,并能使用語(yǔ)境來(lái)糾正錯(cuò)誤。對(duì)于大多數(shù)用戶(hù)來(lái)說(shuō),任何具有較低識(shí)別準(zhǔn)確率的自動(dòng)化系統(tǒng)都會(huì)讓他們失望,因此這在商業(yè)上并不可行。
機(jī)器學(xué)習(xí)在意圖推導(dǎo)方面的相關(guān)發(fā)展(后文另作解釋?zhuān)@也是產(chǎn)業(yè)繁榮的一個(gè)巨大貢獻(xiàn)因素。幾年前,這一功能的商業(yè)系統(tǒng)已經(jīng)跨過(guò)了類(lèi)似的門(mén)檻,并推動(dòng)了機(jī)器人產(chǎn)業(yè)的繁榮;語(yǔ)音其實(shí)就是無(wú)文字版本的機(jī)器人。
機(jī)器人本身也已經(jīng)存在了幾十年,但處理自然語(yǔ)言的能力,而不是簡(jiǎn)單地識(shí)別關(guān)鍵字,才帶來(lái)了基于對(duì)話的互動(dòng),這反過(guò)來(lái)又推動(dòng)了相關(guān)平臺(tái)和服務(wù)近期的爆炸式增長(zhǎng)。
在當(dāng)前的語(yǔ)音技術(shù)領(lǐng)域,虛擬自動(dòng)化助理的崛起首屈一指。盡管Siri(以及其他一些不太知名的語(yǔ)音助理)已經(jīng)推出多年,但Alexa和谷歌助理的崛起預(yù)示著一種更廣泛的平臺(tái)方式。
這些新出爐的助手會(huì)在一系列設(shè)備上推廣整個(gè)生態(tài)系統(tǒng)和功能,Alexa可以控制你的燈光,告訴你當(dāng)天的會(huì)議是什么,并幫助你烹飪食譜上的菜品。
語(yǔ)音技術(shù)只是炒作嗎?
當(dāng)然不是。的確,人們對(duì)語(yǔ)音技術(shù)的大肆宣傳,就像之前的3D打印和其他“改變我們生活方式的技術(shù)”的過(guò)度炒作一樣,但通過(guò)語(yǔ)音界面與計(jì)算機(jī)進(jìn)行互動(dòng)的趨勢(shì)將會(huì)持續(xù)下去。
除此之外,還有一系列極具說(shuō)服力的統(tǒng)計(jì)數(shù)據(jù),例如,超過(guò)20%的移動(dòng)搜索已經(jīng)是基于語(yǔ)音的搜索,并且,預(yù)計(jì)到2020年,這一比例將上升到50%。或許更有趣的是,這些統(tǒng)計(jì)數(shù)據(jù)背后有一些原因也許更值得我們?nèi)ヌ接憽?/p>