蘋果正在為iPhone系列手機考慮Siri離線模式可在無網(wǎng)絡(luò)的情況下使用
使用蘋果設(shè)備的朋友都知道,蘋果的Siri助手的工作方式是接收到用戶的命令,然后將收到的語音匿名發(fā)送至蘋果公司服務(wù)器上,經(jīng)過語音轉(zhuǎn)換成文本,再對用戶發(fā)出的指令進行解釋,并將結(jié)果發(fā)送至iPhone和iPad上,而這個過程的語音識別工作非常復(fù)雜,需要在蘋果公司的服務(wù)器上完成,因此iPhone系列的設(shè)備未必能夠勝任。
蘋果為Siri考慮離線模式
對于Siri來說,依賴服務(wù)器就意味著如果沒有網(wǎng)絡(luò)連接,這款虛擬助手就無法工作,盡管“Hey Siri”仍然會觸發(fā)該服務(wù),卻只能顯示離線消息。蘋果周四發(fā)布的專利申請文件“離線個人助理”顯示,這一情況未來可能會發(fā)生變化。
根據(jù)文件顯示,不用連接到蘋果公司的服務(wù)器,語音到文本的處理和驗證將在設(shè)備上完成。在聽到用戶發(fā)出請求時,設(shè)備將能夠通過機載自然語言處理功能來確定任務(wù),如果所請求的任務(wù)是有用的,則進行計算,然后執(zhí)行。蘋果公司表示使用設(shè)備上的機載系統(tǒng)處理未聯(lián)網(wǎng)時的數(shù)字助理請求。它包含了語音合成、對話處理、基于默認詞匯表以及用戶創(chuàng)建數(shù)據(jù)的語音-字母轉(zhuǎn)換和自然語言處理等模塊。根據(jù)識別的單詞和查詢的結(jié)構(gòu),離線數(shù)字助理可以執(zhí)行存儲在任務(wù)流處理模塊或服務(wù)處理模塊中的多個預(yù)定義任務(wù)。這兩個存儲包含常用請求的模型,例如設(shè)置計時器或播放保存在設(shè)備中的歌曲,并根據(jù)請求執(zhí)行相應(yīng)的任務(wù)模型。在申請中,蘋果公司表示使用了機器學(xué)習(xí)機制來執(zhí)行特定類型的任務(wù),包括自然語言處理。
這對于系統(tǒng)理解上下文信息,在不聯(lián)網(wǎng)的情況下,基于非常有限的機載數(shù)據(jù)理解用戶想要什么非常有幫助。即使有了針對離線場景的機載處理功能,如果連接可用,仍然建議保持聯(lián)機。該系統(tǒng)可以根據(jù)連接的可用性,以兩種不同的方式工作。訪問本地和遠程處理還將為數(shù)字助理提供對用戶語音的兩種可能的解釋。在這種情況下,系統(tǒng)會對兩種解釋評定有用性分數(shù),然后執(zhí)行得分較高的一個。
這將有效地為助手提供備選項,如果本地執(zhí)行的處理無法得到有用的結(jié)果,可以將服務(wù)器處理的結(jié)果作為備用。如果服務(wù)器版本超時或者不可用,本地版本仍然可以完成任務(wù)。通常,蘋果公司每周都會申請很多專利,雖然專利申請中描述的概念確實表明了蘋果公司感興趣的領(lǐng)域,但并不能保證此類系統(tǒng)將來一定會出現(xiàn)在該公司未來的產(chǎn)品之中。對于離線Siri來說,蘋果走這條路似乎是相當(dāng)合理的。在最近發(fā)布的iPhone中,A系列處理器包含了神經(jīng)引擎,該引擎用于執(zhí)行計算密集型任務(wù),如面部識別身份驗證和與拍照相關(guān)功能供電,但它也可被用于執(zhí)行機器學(xué)習(xí)的任務(wù)??紤]到2018年iPhone版本中使用的第二代神經(jīng)引擎的強大功能,離線Siri完全有可能利用強大的功能和機器學(xué)習(xí)能力來執(zhí)行離線處理。離線模式并不是蘋果公司改進Siri的唯一方式,它已經(jīng)采用了許多不同的概念以使數(shù)字助理變得更好。
10月份的一項專利說明了Siri如何通過“聲紋”識別特定用戶,同時蘋果公司也在努力通過個性化響應(yīng)實現(xiàn)多用戶支持。Siri已經(jīng)完成了一些與識別能力有關(guān)的改進,包括地理語音模型——幫助解決區(qū)域查詢和方言口音問題。消費者更清楚的是在iOS?12中引入了Siri Shortcuts,它允許用戶制作他們專屬的個人Siri命令。