搜狗開(kāi)放聽(tīng)寫(xiě)服務(wù) 與愛(ài)國(guó)者索尼等成立錄音筆AI創(chuàng)新聯(lián)盟
8月28日,搜狗宣布將其核心技術(shù)能力“搜狗聽(tīng)寫(xiě)”服務(wù)開(kāi)放,并宣布與愛(ài)國(guó)者、紐曼、索尼錄音筆、萬(wàn)城集團(tuán)四家錄音筆行業(yè)頭部企業(yè)成立AI創(chuàng)新聯(lián)盟。用戶(hù)手上的這些品牌的錄音筆都可以用上搜狗聽(tīng)寫(xiě)服務(wù)。
搜狗CEO王小川表示,搜狗的使命是讓表達(dá)和獲取信息更簡(jiǎn)單,輸入法是幫用戶(hù)表達(dá)信息,搜索是幫用戶(hù)獲取信息。目前搜狗輸入法語(yǔ)音請(qǐng)求峰值已超過(guò)7億次,已經(jīng)成為中國(guó)最大的語(yǔ)音輸入法。語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到98%,居于行業(yè)領(lǐng)先。搜狗的語(yǔ)音增強(qiáng)、語(yǔ)音變聲、語(yǔ)音合成等能力已經(jīng)在多場(chǎng)景落地應(yīng)用。
此次開(kāi)放的搜狗聽(tīng)寫(xiě)服務(wù)背后包含多項(xiàng)業(yè)界領(lǐng)先的技術(shù)。其中轉(zhuǎn)寫(xiě)技術(shù)已處于行業(yè)領(lǐng)先地位,其實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)運(yùn)用了搜狗自研的延遲可控的Adaptive Attention-based端到端建模技術(shù),非實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)功能使用業(yè)界領(lǐng)先的深層Transformer-based端到端語(yǔ)音識(shí)別技術(shù),語(yǔ)音轉(zhuǎn)寫(xiě)準(zhǔn)確率可達(dá)95%以上。
在語(yǔ)音增強(qiáng)方面,搜狗自研的Smart Voice麥克風(fēng)陣列算法能夠?qū)υ肼暫突祉戇M(jìn)行多重深度優(yōu)化,確保人聲的高保真還原。
在智能輔助編輯方面,搜狗語(yǔ)音轉(zhuǎn)寫(xiě)可以通過(guò)云端智能糾錯(cuò)編輯技術(shù),基于詞圖搜索和輸入糾錯(cuò)模型,針對(duì)置信度低的轉(zhuǎn)寫(xiě)結(jié)果提供多個(gè)候選詞,幫助用戶(hù)對(duì)轉(zhuǎn)寫(xiě)結(jié)果進(jìn)行糾正,同時(shí)還具備了良好的自動(dòng)區(qū)分說(shuō)話(huà)人、智能文本順滑和標(biāo)點(diǎn)預(yù)測(cè)等能力,可以為用戶(hù)提供更多便捷功能。
報(bào)告顯示,市場(chǎng)上傳統(tǒng)的錄音筆產(chǎn)品有近20年沒(méi)有新的技術(shù)突破,近2年錄音筆行業(yè)銷(xiāo)售量增長(zhǎng)遲緩、市場(chǎng)趨于飽和,迫切需要新的技術(shù)變革。
而據(jù)介紹,搜狗在今年3月推出了AI錄音筆C1,這款區(qū)別于傳統(tǒng)錄音筆的產(chǎn)品一經(jīng)發(fā)布,在極短時(shí)間內(nèi)就在多個(gè)電商平臺(tái)取得了單品銷(xiāo)量第一的成績(jī)。這說(shuō)明市場(chǎng)對(duì)智能化的錄音筆是有很高需求的。這也是搜狗決定開(kāi)放聽(tīng)寫(xiě)服務(wù),和錄音筆行業(yè)頭部企業(yè)成立AI創(chuàng)新聯(lián)盟來(lái)促進(jìn)錄音筆行業(yè)發(fā)展的原因。
搜狗聽(tīng)寫(xiě)服務(wù)開(kāi)放提供移動(dòng)和PC2種接入方式。移動(dòng)端,搜狗升級(jí)推出搜狗錄音助手APP,面向聯(lián)盟的能力升級(jí)包括藍(lán)牙協(xié)議開(kāi)放。
PC接入方式上,搜狗聽(tīng)寫(xiě)服務(wù)和搜狗輸入法PC版進(jìn)行了打通,傳統(tǒng)品牌的錄音筆插入用戶(hù)PC后,通過(guò)搜狗輸入法來(lái)進(jìn)行搜狗聽(tīng)寫(xiě)服務(wù)的調(diào)用。
搜狗方面表示,開(kāi)放聽(tīng)寫(xiě)服務(wù)后,可以為市場(chǎng)上90%以上的錄音筆產(chǎn)品提供接入服務(wù),讓所有有需求的用戶(hù)享受“錄音1小時(shí),出稿5分鐘”的體驗(yàn)。