當(dāng)前位置:首頁(yè) > 智能硬件 > 智能硬件
[導(dǎo)讀]今天,搜狗推出了一款實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字速記工具“搜狗聽(tīng)寫”,使用了搜狗知音引擎的長(zhǎng)時(shí)語(yǔ)音轉(zhuǎn)寫技術(shù),為文字工作者提供會(huì)議、采訪、寫作等場(chǎng)景下的速記要求,用戶可以在App商店免費(fèi)下載。

今天,搜狗推出了一款實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字速記工具“搜狗聽(tīng)寫”,使用了搜狗知音引擎的長(zhǎng)時(shí)語(yǔ)音轉(zhuǎn)寫技術(shù),為文字工作者提供會(huì)議、采訪、寫作等場(chǎng)景下的速記要求,用戶可以在App商店免費(fèi)下載。

會(huì)后,搜狗公司語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰與智東西等媒體就搜狗聽(tīng)寫、搜狗AI技術(shù)、知音OS、以及搜狗智能硬件做了相關(guān)交流。

一、一款專注采訪場(chǎng)景的筆記產(chǎn)品

 

正如智東西之前的報(bào)道中寫道,目前市場(chǎng)上已經(jīng)有同類的產(chǎn)品,比如訊飛錄音寶等,搜狗聽(tīng)寫跟其他家的差異點(diǎn)在哪里呢?在回答智東西的這個(gè)問(wèn)題時(shí),王硯峰表示,搜狗聽(tīng)見(jiàn)與其他的差異在于兩點(diǎn):

1、其他產(chǎn)品不能像搜狗聽(tīng)寫那樣支持長(zhǎng)時(shí)間錄音+免費(fèi)轉(zhuǎn)寫支持;

2、搜狗聽(tīng)見(jiàn)更面向垂直場(chǎng)景,在記者采訪、作家寫作等場(chǎng)景下進(jìn)行了功能優(yōu)化(比如加入遠(yuǎn)程藍(lán)牙標(biāo)注重點(diǎn)技術(shù)),為用戶帶來(lái)更好的產(chǎn)品體驗(yàn)。

在會(huì)后的采訪中,王硯峰補(bǔ)充道,除了語(yǔ)音文字轉(zhuǎn)錄外,搜狗聽(tīng)寫還有對(duì)筆記進(jìn)行分享、記事、管理等功能,其實(shí)更類似一個(gè)云筆記,是專門為了解決文字工作者切身遇到的問(wèn)題而打造的產(chǎn)品。

二、遠(yuǎn)場(chǎng)噪聲環(huán)境下的識(shí)別轉(zhuǎn)錄

 

記者在發(fā)布會(huì)現(xiàn)場(chǎng)體驗(yàn)了,發(fā)現(xiàn)“搜狗聽(tīng)寫”在吵雜、遠(yuǎn)距離環(huán)境下的語(yǔ)音識(shí)別效果其實(shí)并不是太理想,這其實(shí)也是市場(chǎng)上不少語(yǔ)音轉(zhuǎn)錄產(chǎn)品所存在的共同問(wèn)題之一——在安靜、近距離環(huán)境下的轉(zhuǎn)錄效果很好,但處理遠(yuǎn)場(chǎng)、噪聲、尤其是發(fā)布會(huì)上經(jīng)由麥克風(fēng)及揚(yáng)聲器處理過(guò)一遍的聲音時(shí)效果很差。

為此,王硯峰提出了兩點(diǎn)解決方案:一是繼續(xù)進(jìn)行數(shù)據(jù)積累與產(chǎn)品迭代,在嘈雜噪音環(huán)境中累積更多數(shù)據(jù)用于模型訓(xùn)練,才能提升準(zhǔn)確率;二則是搜狗聽(tīng)寫中有“轉(zhuǎn)寫”模式,系統(tǒng)可在離線狀態(tài)下錄音,錄音完成后一次性獲取文字結(jié)果,此時(shí)因?yàn)椴恍枰獙?shí)時(shí)轉(zhuǎn)錄出結(jié)果,引擎速度不需要那么快,因此可以搭建更深、更復(fù)雜的模型,從而也能有更好的識(shí)別效果。

不過(guò),由于搜狗聽(tīng)寫App使用的是手機(jī)麥克風(fēng),手機(jī)本身的收音硬件差異也會(huì)導(dǎo)致識(shí)別效果差異。目前搜狗聽(tīng)寫尚不支持外部錄音導(dǎo)入,只能依靠手機(jī)進(jìn)行錄音。

三、智能硬件是搜狗目前的戰(zhàn)略重心之一

 

搜狗知音是搜狗一年前發(fā)布的語(yǔ)音交互引擎,主打“自然交互+知識(shí)計(jì)算”的技術(shù)戰(zhàn)略。王硯峰海表示,知音引擎指的是技術(shù):語(yǔ)音識(shí)別、機(jī)器翻譯、語(yǔ)音合成等技術(shù)的集合,對(duì)于搜狗來(lái)說(shuō)是語(yǔ)音AI的技術(shù)平臺(tái)。

基于知音引擎,搜狗打造了“知音OS”語(yǔ)音交互平臺(tái),這是一款面向手機(jī)、電視、可穿戴、車載設(shè)備等智能設(shè)備的語(yǔ)音交互平臺(tái)。目前,知音OS已經(jīng)在小米、魅族、創(chuàng)維、海爾等產(chǎn)品中落地應(yīng)用。

王硯峰海表示,智能硬件現(xiàn)在是整個(gè)搜狗的戰(zhàn)略重心之一,隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代逐漸向IOT時(shí)代進(jìn)軍,智能硬件已經(jīng)成為搶占用戶入口的最重要渠道。在未來(lái)一年里,搜狗還將會(huì)在可穿戴、車載、客廳場(chǎng)景內(nèi)自主研發(fā)更多搭載知音OS的智能硬件,并進(jìn)一步推廣知音OS平臺(tái)與其他廠商的合作。

“搜狗在能做智能硬件的品類下做智能硬件,電視、手機(jī)等(不適合搜狗做的)場(chǎng)景下,說(shuō)服好的合作伙伴進(jìn)行合作,形成用戶入口。”

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉