當(dāng)前位置:首頁 > 消費電子 > 便攜設(shè)備
[導(dǎo)讀] 使用蘋果設(shè)備的朋友都知道,蘋果的Siri助手的工作方式是接收到用戶的命令,然后將收到的語音匿名發(fā)送至蘋果公司服務(wù)器上,經(jīng)過語音轉(zhuǎn)換成文本,再對用戶發(fā)出的指令進行解釋,并將結(jié)果發(fā)送至iPhone和

使用蘋果設(shè)備的朋友都知道,蘋果的Siri助手的工作方式是接收到用戶的命令,然后將收到的語音匿名發(fā)送至蘋果公司服務(wù)器上,經(jīng)過語音轉(zhuǎn)換成文本,再對用戶發(fā)出的指令進行解釋,并將結(jié)果發(fā)送至iPhone和iPad上,而這個過程的語音識別工作非常復(fù)雜,需要在蘋果公司的服務(wù)器上完成,因此iPhone系列的設(shè)備未必能夠勝任。

蘋果為Siri考慮離線模式

對于Siri來說,依賴服務(wù)器就意味著如果沒有網(wǎng)絡(luò)連接,這款虛擬助手就無法工作,盡管“Hey Siri”仍然會觸發(fā)該服務(wù),卻只能顯示離線消息。蘋果周四發(fā)布的專利申請文件“離線個人助理”顯示,這一情況未來可能會發(fā)生變化。

根據(jù)文件顯示,不用連接到蘋果公司的服務(wù)器,語音到文本的處理和驗證將在設(shè)備上完成。在聽到用戶發(fā)出請求時,設(shè)備將能夠通過機載自然語言處理功能來確定任務(wù),如果所請求的任務(wù)是有用的,則進行計算,然后執(zhí)行。蘋果公司表示使用設(shè)備上的機載系統(tǒng)處理未聯(lián)網(wǎng)時的數(shù)字助理請求。它包含了語音合成、對話處理、基于默認詞匯表以及用戶創(chuàng)建數(shù)據(jù)的語音-字母轉(zhuǎn)換和自然語言處理等模塊。根據(jù)識別的單詞和查詢的結(jié)構(gòu),離線數(shù)字助理可以執(zhí)行存儲在任務(wù)流處理模塊或服務(wù)處理模塊中的多個預(yù)定義任務(wù)。這兩個存儲包含常用請求的模型,例如設(shè)置計時器或播放保存在設(shè)備中的歌曲,并根據(jù)請求執(zhí)行相應(yīng)的任務(wù)模型。在申請中,蘋果公司表示使用了機器學(xué)習(xí)機制來執(zhí)行特定類型的任務(wù),包括自然語言處理。

這對于系統(tǒng)理解上下文信息,在不聯(lián)網(wǎng)的情況下,基于非常有限的機載數(shù)據(jù)理解用戶想要什么非常有幫助。即使有了針對離線場景的機載處理功能,如果連接可用,仍然建議保持聯(lián)機。該系統(tǒng)可以根據(jù)連接的可用性,以兩種不同的方式工作。訪問本地和遠程處理還將為數(shù)字助理提供對用戶語音的兩種可能的解釋。在這種情況下,系統(tǒng)會對兩種解釋評定有用性分數(shù),然后執(zhí)行得分較高的一個。

這將有效地為助手提供備選項,如果本地執(zhí)行的處理無法得到有用的結(jié)果,可以將服務(wù)器處理的結(jié)果作為備用。如果服務(wù)器版本超時或者不可用,本地版本仍然可以完成任務(wù)。通常,蘋果公司每周都會申請很多專利,雖然專利申請中描述的概念確實表明了蘋果公司感興趣的領(lǐng)域,但并不能保證此類系統(tǒng)將來一定會出現(xiàn)在該公司未來的產(chǎn)品之中。對于離線Siri來說,蘋果走這條路似乎是相當(dāng)合理的。在最近發(fā)布的iPhone中,A系列處理器包含了神經(jīng)引擎,該引擎用于執(zhí)行計算密集型任務(wù),如面部識別身份驗證和與拍照相關(guān)功能供電,但它也可被用于執(zhí)行機器學(xué)習(xí)的任務(wù)??紤]到2018年iPhone版本中使用的第二代神經(jīng)引擎的強大功能,離線Siri完全有可能利用強大的功能和機器學(xué)習(xí)能力來執(zhí)行離線處理。離線模式并不是蘋果公司改進Siri的唯一方式,它已經(jīng)采用了許多不同的概念以使數(shù)字助理變得更好。

10月份的一項專利說明了Siri如何通過“聲紋”識別特定用戶,同時蘋果公司也在努力通過個性化響應(yīng)實現(xiàn)多用戶支持。Siri已經(jīng)完成了一些與識別能力有關(guān)的改進,包括地理語音模型——幫助解決區(qū)域查詢和方言口音問題。消費者更清楚的是在iOS?12中引入了Siri Shortcuts,它允許用戶制作他們專屬的個人Siri命令。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉