借用AI優(yōu)勢(shì) 語(yǔ)音交互開(kāi)啟“百度式”新體驗(yàn)
隨著科技的不斷發(fā)展,無(wú)論是虛擬世界還是現(xiàn)實(shí)世界都在經(jīng)歷著一場(chǎng)前所未有AI變革戰(zhàn)。
1月16日,百度輸入法搞了一場(chǎng)名為“AI·新輸入 全感官輸入2.0”的發(fā)布會(huì),發(fā)布了其宣稱為“國(guó)內(nèi)首款真正意義上的AI輸入法”的百度輸入法AI探索版,百度高級(jí)副總裁王海峰表示,“百度輸入法將扮演好溝通橋梁的重要角色,讓人機(jī)交互進(jìn)入一個(gè)全新的階段”。
可以說(shuō),百度輸入法正是目前的業(yè)內(nèi)標(biāo)桿。這也是第一家真正思考AI時(shí)代人機(jī)交互的輸入法產(chǎn)品。
借用AI優(yōu)勢(shì) 語(yǔ)音交互開(kāi)啟“百度式”新體驗(yàn)
從PC時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,輸入法可以說(shuō)完美的呈現(xiàn)了人機(jī)交互的升級(jí)變革,尤其是AI技術(shù)的應(yīng)用,讓這種笨重機(jī)械式的搜索工具有了更加人性化的一面,這對(duì)于游走于內(nèi)容世界的我們來(lái)說(shuō)無(wú)疑是技術(shù)入局后的體驗(yàn)升級(jí),而語(yǔ)音作為人誕生以來(lái)最天然的交互方式但卻一直沒(méi)有在這場(chǎng)升級(jí)大戰(zhàn)中完美釋放,這對(duì)于那些信奉“技術(shù)改變世界”的變革者來(lái)說(shuō)無(wú)疑是遺憾的。
自從百度高調(diào)開(kāi)啟AI戰(zhàn)略以來(lái),百度系產(chǎn)品就進(jìn)行了一系列的智慧化變革,而輸入法作為內(nèi)容和人類銜接的完美橋梁,在這樣一個(gè)AI時(shí)代也迎來(lái)了應(yīng)有的尊重,百度作為內(nèi)容產(chǎn)業(yè)的佼佼者,不僅借助了自己強(qiáng)有力的內(nèi)容產(chǎn)業(yè)閉環(huán),更重要的是在新一輪產(chǎn)業(yè)升級(jí)時(shí)期,百度把過(guò)去的搜索引擎,變成“搜索+信息流”的雙引擎產(chǎn)品。在融入AI之后,把過(guò)去搜索引擎時(shí)代的人找信息,變成信息、服務(wù)找人。既能讓用戶找到信息,也能讓信息找到用戶,重構(gòu)了新型信息服務(wù)體驗(yàn)。
據(jù)百度高級(jí)副總裁王海峰表示,輸入法是離用戶最近的產(chǎn)品之一,也是AI落地的“橋頭堡”,百度全方位的AI能力正在不斷賦能輸入法,讓輸入法更”聰明“。他也給出了輸入法行業(yè)的“未來(lái)畫(huà)像”,雖然目前的輸入法產(chǎn)品主要應(yīng)用于手機(jī)端,但未來(lái)的輸入法將應(yīng)用于各種智能設(shè)備與用戶的交互,并走向世界,為全球用戶提供更多元的輸入方式。
多樣式玩法激變 革新固有化輸入法邏輯
既然是一款百度輸入法AI探索版,那就不會(huì)只停留在AI在語(yǔ)音交互層面的價(jià)值,否則“探索”二字將變得毫無(wú)意義。
為了更好的激發(fā)用戶的交互熱情,百度輸入法AI探索版的“新探索”推出了凌空手寫(xiě),用手指在攝像頭取景范圍內(nèi)的空中手寫(xiě),輸入法即可識(shí)別并生成文字。乍看這是利用手機(jī)攝像頭和AI技術(shù)的一種新奇玩法,而事實(shí)上,這意味著輸入法有了脫離PC和手機(jī)的機(jī)會(huì),比如,在目前已有的案例中,百度輸入法凌空手寫(xiě)技術(shù)已經(jīng)在小尋手表、小天才電話手表上得到應(yīng)用。
當(dāng)然了,這只是“探索”價(jià)值的一面,伴隨著百度語(yǔ)音、視覺(jué)、自然語(yǔ)言處理、知識(shí)圖譜等百度AI技術(shù)落地輸入法,“全感官”的輸入變成現(xiàn)實(shí)。除了語(yǔ)音輸入,百度輸入法AI探索版還推出了拍立活、秀場(chǎng)、凌空手寫(xiě)等新功能玩法。無(wú)論是心愛(ài)的偶像,還是日夜陪伴的寵物,“拍立活”功能都可以讓用戶通過(guò)自己的動(dòng)作“驅(qū)動(dòng)”對(duì)方做出相同表情;“秀場(chǎng)”功能運(yùn)用圖像分割技術(shù),讓用戶“穿越”到不同的虛擬場(chǎng)景之中,科技、清新、賽博朋克多種風(fēng)格隨意挑選,表情創(chuàng)作更具場(chǎng)景感、更加生活化;凌空手寫(xiě)如同隔空打怪,在空中書(shū)寫(xiě)也能被流暢識(shí)別,目前整體識(shí)別率已達(dá)到大規(guī)模應(yīng)用的要求。
從百度輸入法AI探索版的表現(xiàn)形式來(lái)看,可以說(shuō)完全打破了用戶對(duì)輸入法的固有認(rèn)知,除了敲鍵盤(pán)、語(yǔ)音交互這些思維意識(shí)形態(tài)存在的畫(huà)面感以外,百度輸入法AI探索版完全將用戶拉到了另一個(gè)產(chǎn)品空間,通過(guò)技術(shù)加碼后的產(chǎn)品形態(tài)不僅更好的吸引了用戶,更重要的是這種新方式的內(nèi)容交互為百度后期迎接產(chǎn)業(yè)升級(jí)的萬(wàn)物互聯(lián)打下了銜接基礎(chǔ),在助推產(chǎn)業(yè)升級(jí)的同時(shí)也為用戶帶去了更加多元化的場(chǎng)景新體驗(yàn)。
深挖用戶需求 極致體驗(yàn)助推人類返璞歸真
不過(guò),作為一款用戶驅(qū)動(dòng)的產(chǎn)品,玩法的“千姿百態(tài)”無(wú)疑是吸引用戶圍觀的有效法寶,但如何釋放用戶的后發(fā)實(shí)力,才是產(chǎn)品得以生生不息的關(guān)鍵所在。
而百度輸入法AI探索版作為一款默認(rèn)輸入方式為全語(yǔ)音輸入的產(chǎn)品,無(wú)疑是會(huì)把語(yǔ)音交互打造成產(chǎn)品的重要亮點(diǎn),而對(duì)于語(yǔ)音交互而言,其首要難題就是如何通過(guò)用戶的語(yǔ)音輸出準(zhǔn)確的完成語(yǔ)義表達(dá)呢?為此,百度輸入法特意發(fā)布了在線語(yǔ)音的“流式截?cái)喽鄬幼⒁饬!保⊿MLTA)技術(shù),按其說(shuō)法,是“世界上首次實(shí)現(xiàn)了局部注意力建模識(shí)別精度超過(guò)全局注意力模型”,以及“世界上第一次大規(guī)模部署在線語(yǔ)音交互注意力模型”。該技術(shù)可以解決傳統(tǒng)模型存在的“時(shí)延性”問(wèn)題,百度方面宣稱其“將在線語(yǔ)音識(shí)別精度提升了15%,超越行業(yè)最高水平15%”。
而且,除了語(yǔ)音識(shí)別精準(zhǔn)度以外,百度輸入法AI探索版還專門(mén)針對(duì)方言進(jìn)行了優(yōu)化,通過(guò)“方言與方言、方言與普通話的混合語(yǔ)音輸入”技術(shù),從而實(shí)現(xiàn)無(wú)縫切換,用戶可實(shí)現(xiàn)“自由說(shuō)”。與此類似地,中英文夾雜亦可來(lái)回切換。目前為止,百度輸入法應(yīng)當(dāng)是市面上唯一實(shí)現(xiàn)了高精度中英文混合語(yǔ)音輸入、方言免切換語(yǔ)音輸入的輸入法產(chǎn)品。
同時(shí),在離線語(yǔ)音識(shí)別領(lǐng)域,為解決用戶多元輸入場(chǎng)景的需求,百度持續(xù)優(yōu)化Deep Peak 2系統(tǒng),讓離線語(yǔ)音輸入相對(duì)準(zhǔn)確率再次提升,高于行業(yè)平均水平35%。即使用戶處于地鐵、電梯、隧道或人流密集等離線場(chǎng)景中,依然可以借助百度輸入法進(jìn)行精準(zhǔn)的語(yǔ)音輸入。
截至2018年底,百度輸入法月活躍人數(shù)已達(dá)5億,語(yǔ)音日請(qǐng)求量峰值突破5.5億,AR表情使用次數(shù)超過(guò)1億。同時(shí),百度海外輸入法全球安裝量超過(guò)1億,支持120種語(yǔ)言,覆蓋全球190個(gè)國(guó)家地區(qū),并與超過(guò)100個(gè)全球知名IP達(dá)成合作,實(shí)現(xiàn)技術(shù)與市場(chǎng)的雙豐收。
縱觀歷史長(zhǎng)河,PC時(shí)代,輸入法要通過(guò)鍵鼠讓我們和機(jī)器交互;移動(dòng)互聯(lián)網(wǎng)時(shí)代,觸摸屏又取代鍵鼠,成了輸入法新的承載者。試想一下,在鍵盤(pán)、鼠標(biāo)、觸摸屏等一系列交互手段之后,以智能語(yǔ)音為代表的對(duì)話式人工智能將會(huì)產(chǎn)生什么樣的產(chǎn)業(yè)形態(tài)呢?
或許,屬于百度的時(shí)代將再一次開(kāi)啟!