當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 2016年,美國一位科技記者James Vlahos,做了一件感動無數(shù)人的事。 他在父親臨終前幾個月,下定決心要把父親的聲音和教誨永遠(yuǎn)留在身邊。于是非技術(shù)背景的James在一個AI項目的

2016年,美國一位科技記者James Vlahos,做了一件感動無數(shù)人的事。

他在父親臨終前幾個月,下定決心要把父親的聲音和教誨永遠(yuǎn)留在身邊。于是非技術(shù)背景的James在一個AI項目的幫助下,自學(xué)語音合成機器學(xué)習(xí)。在父親的幫助下,他每天錄制父親一到兩個小時的聲音,共記錄了9萬多個單詞用來訓(xùn)練AI模型。最終完成了由父親聲音構(gòu)成的,類似siri的語音助手,得以讓James時時寄托哀思。

這個故事在感動了全球無數(shù)家庭的同時,也讓AI開發(fā)者與技術(shù)人員看到了用AI語音定制化的重要意義。毫無疑問,全球眾多家庭都在渴望著類似功能,無論是記錄老人的聲音,讓自己的聲音能夠更多陪伴孩子成長,還是戀人之間的聲音陪伴,家庭,正在成為AI語音技術(shù)應(yīng)用場景的主戰(zhàn)場。

這種需求也在不斷受到產(chǎn)業(yè)界的重視。近來幾年,語音合成、聲音克隆等技術(shù)相繼發(fā)展,自然語言處理整體能力也得到了突飛猛進的發(fā)展。AI語音定制化這件事,也早已不用耗時幾個月,用數(shù)萬條語料進行機器學(xué)習(xí)訓(xùn)練,而是真正的“飛入尋常百姓家”。

3月初,一直對AI技術(shù)大舉投入的百度,在小度音箱中上線了語音定制功能。在小度APP中“爸媽講故事”這個功能場景,用戶可以錄制自己和家人的語音包。

這是對話式AI硬件中,首次出現(xiàn)用戶語音定制能力。當(dāng)用戶可以定制自己的語音包,讓智能音箱不斷傳來自己的聲音,眾多行業(yè)規(guī)則似乎都在發(fā)生變化。

讓我們從語音合成、對話式AI,以及智能語音硬件三者發(fā)展的合流中,審視一下進入AI語音定制時代的2020,可能發(fā)生的三個改變。

門檻已去:AI語音進入定制化時代

事實上,AI語音定制的能力,一直都處在AI行業(yè)與用戶的高度期待里。一方面讓AI模擬用戶聲音,關(guān)乎家庭、陪伴、記憶等諸多社會情感因素;另一方面熟悉的聲音可能觸發(fā)很多新的應(yīng)用想象,比如你可能懶得打開音頻課,但如果你的愛豆或者女神給你上音頻課,你可能都懶得睡覺。

因此,AI語音定制的工程化與商業(yè)應(yīng)用,始終被抱以高度期待。這條技術(shù)線索可以說是AI語音硬件,比如智能音箱、智能屏等產(chǎn)品持續(xù)發(fā)展的奇兵。

而AI語音定制的相關(guān)技術(shù),在過去幾年間迎來了不斷降低門檻、提升應(yīng)用規(guī)模的過程。James Vlahos用了9萬多條語料進行機器學(xué)習(xí)訓(xùn)練,但如今只需要幾分鐘就可以訓(xùn)練出語義理解和自然語言處理效果遠(yuǎn)遠(yuǎn)超過siri的定制化語音模型。

近幾年,隨著技術(shù)的升級,定制用戶語音的相關(guān)產(chǎn)業(yè)探索一直在前進。比如一個名為Revoice的公益項目,希望能夠幫助漸凍癥患者留住自己的聲音;而汽車AI廠商Cerence在去年推出了創(chuàng)建用戶聲音語音助手的功能;微軟的Custom Voice服務(wù),可以一定程度上讓用戶聲音成為小冰的語音。去年,“語音定制功能”開始被應(yīng)用到地圖場景,用戶在百度地圖APP上錄制20句話,就能夠生成個人完整語音包。

如今,定制化語音的功能來到了最復(fù)雜的AI場景里:對話式AI設(shè)備。

在小度語音定制功能中,用戶進入小度APP,就可以在“爸媽講故事”這個功能里錄制自己的專屬語音包。談不上多復(fù)雜,3-5分鐘就可以錄好,錄制的聲音可以播講大段的故事,并且語氣、語調(diào)、頓挫感在百度的AI語音能力加持下非常逼真,沒有異樣感。

這意味著,AI定制語音的能力已經(jīng)基本不再存在任何用戶門檻,我們不用學(xué)習(xí)復(fù)雜的技術(shù),浪費大量時間,忍受一次次的失敗。用戶將以非常簡單的方式,就能夠利用智能語音定制來展開實現(xiàn)家庭場景中的應(yīng)用。語音定制的產(chǎn)業(yè)化通道也就此展開。

在另一條軌跡上,我們可以將其看作智能語音助手和對話式AI硬件的整體進化。

從2015年,亞馬遜的Ehco誕生起,語音助手就處在用機器音一問一答的基本能力里。用戶時常找不到繼續(xù)說下去的動力。一問一答模式也與真人交互并不相似。

2019年,小度助手實現(xiàn)了全雙工免喚醒能力,可以一次喚醒多次交互,終于讓多輪對話在硬件中得以實現(xiàn),聊天開始形似真人。

而AI語音定制的能力,或許可以看作2020年智能語音助手和相關(guān)硬件的又一次升級,用戶可以借此實現(xiàn)千人千面的AI硬件,開發(fā)者有了新的開發(fā)基礎(chǔ)。連發(fā)生的產(chǎn)業(yè)化影響也能夠隨之展開。

飯圈&家庭:兩個場景的AI硬件或爆發(fā)

AI語音定制化帶來的第一個改變,就是用戶可能會重新開始思考自己如何應(yīng)用對話式AI硬件,以及為什么購買相關(guān)產(chǎn)品。

有了AI語音定制能力后,有兩個商業(yè)場景的改變是顯而易見的。首先在家庭場景中,定制家人聲音這一能力其實至關(guān)重要。因為家人的聲音代表著陪伴、依靠和溫暖,這是人之天性,無法在任何時代改變。用父母的聲音給孩子講故事、講知識,讓子女的聲音在智能音箱中陪伴著父母,給父母報時間,念新聞。這些溫暖的應(yīng)用,是中國人的普遍需求,也是繁忙都市工作下的必然選擇。

今天的情況就是一個很好的例證,疫情推遲了復(fù)工,這讓很多父母有了更多時間陪伴孩子,從而產(chǎn)生了“疫情下的父母依賴”。但返工開始,父母不得已又將離開孩子怎么辦?在智能音箱家庭使用場景下,語音定制功能就給出了一個選項。

另一方面,AI語音定制功能的更大紅利還要看飯圈。這幾天飯圈的能量之大,讓整個社會頗為領(lǐng)教。那么讓愛豆的聲音不僅僅出現(xiàn)在地圖導(dǎo)航,而是時時留存在智能產(chǎn)品中,與自己時時對話,聊天、講故事、玩游戲——以此產(chǎn)生的購買力和再開發(fā)能力,簡直不敢細(xì)想。

這兩個場景在AI語音定制能力下,是最有可能快速呈現(xiàn)爆發(fā)的。而以此為基礎(chǔ),一波新的開發(fā)者紅利即將上線。

泛化定制:AI語音開發(fā)者獲得新船票

隨著AI語音產(chǎn)業(yè)的成熟,開發(fā)者技術(shù)支持的日趨完備,已經(jīng)有越來越多的聲音博主、AI開發(fā)者,投身到AI語音生態(tài)的大潮中。而隨著AI語音定制功能的上線,開發(fā)者的基礎(chǔ)能力又得到了不小突破,“千人千聲”的對話式AI設(shè)備不再僅僅是個產(chǎn)業(yè)想象。

AI語音開發(fā)者,或許很快就可以通過語音定制功能,獲得“泛化定制”的全新機會??梢灶A(yù)見,AI語音定制將通過以下幾種方式影響AI語音的開發(fā)空間與產(chǎn)業(yè)價值:

1、技能定制得到飛速發(fā)展。用家人的聲音定制一個語音技能,甚至定制只有家庭成員、情侶之間、粉絲專屬的語音技能,是一個廣闊的產(chǎn)業(yè)想象力。很多語音技能在有了用戶聲音這個選項之后,將產(chǎn)生全面改變,可能影響到娛樂、家庭、教育、陪伴等多個場景。

2、生活場景定制成為重頭戲。在智能家居、智能手機助手、智能穿戴設(shè)備中聽到自己親人、偶像的聲音,是一件可以充滿各種玩法的事情。開發(fā)者將可以借助各種硬件形態(tài),揮灑AI語音定制的想象力。

3、“聲音著作權(quán)”的無數(shù)新玩法。上面說過,AI語音定制能力的出現(xiàn)和普及,將讓“高凈值聲音”成為一種新的版權(quán)資本。明星、偶像、公眾人物,甚至特定領(lǐng)域網(wǎng)紅的聲音,將可以通過AI交互的形式普及到各種硬件中,造成內(nèi)容產(chǎn)業(yè)與科技產(chǎn)業(yè)的又一個垂直風(fēng)口。

能夠規(guī)?;涞氐腁I語音泛定制應(yīng)用、硬件,以及專屬服務(wù),是將用戶、偶像、軟件開發(fā)者和硬件品牌融合在一起的全新形式,由此激發(fā)的購買欲望和平臺開發(fā)機遇,也許將是2020年的獨特風(fēng)景。

4、AI語音的社會價值與意義被重新估判。從James Vlahos的故事不難看出,AI語音定制能力,包含著深刻雋永的親情關(guān)懷與家庭意義。人與人無法永遠(yuǎn)陪伴,但對方聲音的智能化,卻可以將很多重要的時刻與陪伴感放大。AI語音定制化的開發(fā)者們,接下來將可能擔(dān)負(fù)起更多關(guān)于親情、社會與陪伴的探索。從技術(shù)價值到社會價值,AI語音定制化的影響力也將以此被放大。

AI語音定制化,正在成為對話式AI硬件市場上新的驅(qū)動因素。細(xì)心觀察近三年來的對話式AI硬件以及AI語音市場,就會發(fā)現(xiàn)市場的波動式增長,呈現(xiàn)與技術(shù)突破緊密契合的關(guān)系。在一種硬件形態(tài)處于草創(chuàng)階段的時候,這種因技術(shù)而爆發(fā)的商業(yè)能量是產(chǎn)業(yè)常態(tài)。

換句話說,對話式AI打開的硬件市場,呈現(xiàn)這樣的邏輯關(guān)系:技術(shù)能力突破代表著更好的用戶體驗,繼而將直接催生市場回饋。在2019年,小度帶來全雙工免喚醒能力后,AI語音硬件市場一度解封了三足鼎立的形態(tài),展現(xiàn)出獨自向前大幅飛躍的局面。而AI語音定制化能力,作為與開發(fā)者、技能生態(tài)、內(nèi)容生態(tài)聯(lián)系更緊密的技術(shù)突破,顯然將持續(xù)維護這種技術(shù)領(lǐng)先性,帶來更多的市場回饋,以至于某種市場質(zhì)變的臨近。

但不管最終是哪個平臺獲得最后的留場權(quán),對于AI開發(fā)者來說,語音定制化能力帶來的產(chǎn)業(yè)機遇都剛剛開始。千人千面的硬件,千變?nèi)f化的應(yīng)用,千方百計的技術(shù)突破,是我們最終想在新硬件形態(tài)上看到的結(jié)果。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉