對(duì)話搜狗王硯峰:智能硬件是搜狗目前戰(zhàn)略重心之一
今天,搜狗推出了一款實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字速記工具“搜狗聽(tīng)寫”,使用了搜狗知音引擎的長(zhǎng)時(shí)語(yǔ)音轉(zhuǎn)寫技術(shù),為文字工作者提供會(huì)議、采訪、寫作等場(chǎng)景下的速記要求,用戶可以在App商店免費(fèi)下載。
會(huì)后,搜狗公司語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰與智東西等媒體就搜狗聽(tīng)寫、搜狗AI技術(shù)、知音OS、以及搜狗智能硬件做了相關(guān)交流。
一、一款專注采訪場(chǎng)景的筆記產(chǎn)品
正如智東西之前的報(bào)道中寫道,目前市場(chǎng)上已經(jīng)有同類的產(chǎn)品,比如訊飛錄音寶等,搜狗聽(tīng)寫跟其他家的差異點(diǎn)在哪里呢?在回答智東西的這個(gè)問(wèn)題時(shí),王硯峰表示,搜狗聽(tīng)見(jiàn)與其他的差異在于兩點(diǎn):
1、其他產(chǎn)品不能像搜狗聽(tīng)寫那樣支持長(zhǎng)時(shí)間錄音+免費(fèi)轉(zhuǎn)寫支持;
2、搜狗聽(tīng)見(jiàn)更面向垂直場(chǎng)景,在記者采訪、作家寫作等場(chǎng)景下進(jìn)行了功能優(yōu)化(比如加入遠(yuǎn)程藍(lán)牙標(biāo)注重點(diǎn)技術(shù)),為用戶帶來(lái)更好的產(chǎn)品體驗(yàn)。
在會(huì)后的采訪中,王硯峰補(bǔ)充道,除了語(yǔ)音文字轉(zhuǎn)錄外,搜狗聽(tīng)寫還有對(duì)筆記進(jìn)行分享、記事、管理等功能,其實(shí)更類似一個(gè)云筆記,是專門為了解決文字工作者切身遇到的問(wèn)題而打造的產(chǎn)品。
二、遠(yuǎn)場(chǎng)噪聲環(huán)境下的識(shí)別轉(zhuǎn)錄
記者在發(fā)布會(huì)現(xiàn)場(chǎng)體驗(yàn)了,發(fā)現(xiàn)“搜狗聽(tīng)寫”在吵雜、遠(yuǎn)距離環(huán)境下的語(yǔ)音識(shí)別效果其實(shí)并不是太理想,這其實(shí)也是市場(chǎng)上不少語(yǔ)音轉(zhuǎn)錄產(chǎn)品所存在的共同問(wèn)題之一——在安靜、近距離環(huán)境下的轉(zhuǎn)錄效果很好,但處理遠(yuǎn)場(chǎng)、噪聲、尤其是發(fā)布會(huì)上經(jīng)由麥克風(fēng)及揚(yáng)聲器處理過(guò)一遍的聲音時(shí)效果很差。
為此,王硯峰提出了兩點(diǎn)解決方案:一是繼續(xù)進(jìn)行數(shù)據(jù)積累與產(chǎn)品迭代,在嘈雜噪音環(huán)境中累積更多數(shù)據(jù)用于模型訓(xùn)練,才能提升準(zhǔn)確率;二則是搜狗聽(tīng)寫中有“轉(zhuǎn)寫”模式,系統(tǒng)可在離線狀態(tài)下錄音,錄音完成后一次性獲取文字結(jié)果,此時(shí)因?yàn)椴恍枰獙?shí)時(shí)轉(zhuǎn)錄出結(jié)果,引擎速度不需要那么快,因此可以搭建更深、更復(fù)雜的模型,從而也能有更好的識(shí)別效果。
不過(guò),由于搜狗聽(tīng)寫App使用的是手機(jī)麥克風(fēng),手機(jī)本身的收音硬件差異也會(huì)導(dǎo)致識(shí)別效果差異。目前搜狗聽(tīng)寫尚不支持外部錄音導(dǎo)入,只能依靠手機(jī)進(jìn)行錄音。
三、智能硬件是搜狗目前的戰(zhàn)略重心之一
搜狗知音是搜狗一年前發(fā)布的語(yǔ)音交互引擎,主打“自然交互+知識(shí)計(jì)算”的技術(shù)戰(zhàn)略。王硯峰海表示,知音引擎指的是技術(shù):語(yǔ)音識(shí)別、機(jī)器翻譯、語(yǔ)音合成等技術(shù)的集合,對(duì)于搜狗來(lái)說(shuō)是語(yǔ)音AI的技術(shù)平臺(tái)。
基于知音引擎,搜狗打造了“知音OS”語(yǔ)音交互平臺(tái),這是一款面向手機(jī)、電視、可穿戴、車載設(shè)備等智能設(shè)備的語(yǔ)音交互平臺(tái)。目前,知音OS已經(jīng)在小米、魅族、創(chuàng)維、海爾等產(chǎn)品中落地應(yīng)用。
王硯峰海表示,智能硬件現(xiàn)在是整個(gè)搜狗的戰(zhàn)略重心之一,隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代逐漸向IOT時(shí)代進(jìn)軍,智能硬件已經(jīng)成為搶占用戶入口的最重要渠道。在未來(lái)一年里,搜狗還將會(huì)在可穿戴、車載、客廳場(chǎng)景內(nèi)自主研發(fā)更多搭載知音OS的智能硬件,并進(jìn)一步推廣知音OS平臺(tái)與其他廠商的合作。
“搜狗在能做智能硬件的品類下做智能硬件,電視、手機(jī)等(不適合搜狗做的)場(chǎng)景下,說(shuō)服好的合作伙伴進(jìn)行合作,形成用戶入口。”