Siri工作方式詳解:本地語(yǔ)音識(shí)別云計(jì)算服務(wù)
以下為文章全文:
當(dāng)用戶(hù)對(duì)iPhone說(shuō)話(huà)后,語(yǔ)音將被立即編碼,成為一個(gè)壓縮的數(shù)字文件,其中包含著所有有用的信息。這一信息將通過(guò)互聯(lián)網(wǎng)服務(wù)提供商(ISP)的網(wǎng)絡(luò)被發(fā)送至云計(jì)算服務(wù)器,而服務(wù)器中的模塊將識(shí)別用戶(hù)所說(shuō)的內(nèi)容。
與此同時(shí),用戶(hù)的語(yǔ)音將在手機(jī)端被識(shí)別。安裝在手機(jī)中的語(yǔ)音識(shí)別器將與云計(jì)算服務(wù)器通信,了解指令是否適合在本地被處理。用戶(hù)的指令可能要求手機(jī)播放一首歌曲,而另一些指令則有可能需要手機(jī)連接至網(wǎng)絡(luò),尋求進(jìn)一步的幫助。如果語(yǔ)音識(shí)別器認(rèn)為,手機(jī)內(nèi)部模塊足以處理用戶(hù)的指令,那么將會(huì)告知云計(jì)算服務(wù)器,不再需要服務(wù)器的支持。
根據(jù)用戶(hù)的聲調(diào)和語(yǔ)序,服務(wù)器將對(duì)語(yǔ)音進(jìn)行靜態(tài)對(duì)比,了解語(yǔ)音中包含哪些字母。與此同時(shí),本地的語(yǔ)音識(shí)別器也將對(duì)用戶(hù)語(yǔ)音進(jìn)行靜態(tài)對(duì)比。在服務(wù)器端和手機(jī)端,可能性最高的識(shí)別內(nèi)容將優(yōu)先獲得處理。
此時(shí),識(shí)別出的內(nèi)容已經(jīng)包含一系列的元音和輔音字母。隨后這些內(nèi)容將被發(fā)送至一個(gè)語(yǔ)言模塊,以評(píng)估用戶(hù)的語(yǔ)音中包含哪些單詞。根據(jù)不同的可信度,計(jì)算機(jī)將創(chuàng)建一個(gè)用戶(hù)所說(shuō)內(nèi)容的列表。
如果判斷結(jié)果具有足夠的可信度,那么計(jì)算機(jī)將能理解用戶(hù)所說(shuō)的內(nèi)容,例如發(fā)送短信或查找聯(lián)系人列表中的聯(lián)系人。隨后用戶(hù)將會(huì)看到手機(jī)屏幕上出現(xiàn)所需的內(nèi)容,而不必手動(dòng)操作。在這一過(guò)程中,如果用戶(hù)的語(yǔ)音含義過(guò)于模糊,那么計(jì)算機(jī)將會(huì)詢(xún)問(wèn)用戶(hù),例如用戶(hù)希望查找的聯(lián)系人是埃里卡·奧爾森(Erica Olssen)還是埃里卡·施密特(Erica Schmidt)。