“Apple Brain”:蘋果人工智能早已無處不在
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋果似乎對(duì)此無動(dòng)于衷,被認(rèn)為在人工智能領(lǐng)域嚴(yán)重落后,除了語音助手Siri,似乎沒有更多作為。但真實(shí)情況或許與外界猜測(cè)的完全不同,Backchannel主編Steven Levy近日走訪了蘋果,發(fā)現(xiàn)這家公司其實(shí)先于業(yè)界使用了時(shí)髦的深度學(xué)習(xí)技術(shù),并將其用在了除Siri外的方方面面。
2014年6月30日,Siri迎來了一次腦部移植。
再三年前,蘋果是第一家將智能助理整合進(jìn)其操作系統(tǒng)的主流公司。而Siri則是蘋果對(duì)一個(gè)收購而來的獨(dú)立應(yīng)用的改進(jìn),它還在2010年吞下了開發(fā)團(tuán)隊(duì)。對(duì)于Siri,最初的評(píng)價(jià)令人欣喜,但后來的幾個(gè)月到幾年中,用戶對(duì)它的缺點(diǎn)越來越不耐煩。它常常錯(cuò)誤理解指令,怎么調(diào)整也沒沅改進(jìn)。
所以在上面提到的那個(gè)日期,蘋果將Siri的語音識(shí)別移植到了基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)上。這一服務(wù)首先面向美國用戶,并在8月15日推向全球。一些早期技術(shù)仍有用,包括隱馬爾可夫模型,但現(xiàn)在系統(tǒng)使用的是機(jī)器學(xué)習(xí)技術(shù),包括DNN(深度神經(jīng)網(wǎng)絡(luò)),卷積神經(jīng)網(wǎng)絡(luò),長短期記憶單位,封閉復(fù)發(fā)性單位(gated recurrent units),以及n-grams等。用戶升級(jí)后,Siri雖然看起來還是一樣,但經(jīng)過了深度學(xué)習(xí)的加強(qiáng)。
與其它底層改進(jìn)一樣,由于不愿向競(jìng)爭(zhēng)者暴露自己,蘋果沒有公布Siri的進(jìn)展。如果用戶注意到了什么,也只是它犯的錯(cuò)變少了。蘋果也表示,準(zhǔn)確度的改善令人震驚。
Eddy Cue
蘋果互聯(lián)網(wǎng)軟件及服務(wù)部高級(jí)副總裁Eddy Cue表示,“這次改進(jìn)的效果如此明顯,以至于進(jìn)行了重新測(cè)試,確保沒人算錯(cuò)小數(shù)點(diǎn)。”
Siri轉(zhuǎn)變的故事會(huì)讓人工智能領(lǐng)域的人皺起眉頭,不是因?yàn)樯窠?jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)的提升,而是因?yàn)樘O果對(duì)技術(shù)如此熟練又如此低調(diào)。直到最近,雖然蘋果在AI領(lǐng)域加大了招聘力度,也做出了一些高調(diào)的收購,但外界還是認(rèn)為它在最為激烈的AI競(jìng)爭(zhēng)中稍顯落后。由于蘋果一直守口如瓶,連AI行家也不知道它在機(jī)器學(xué)習(xí)上有何作為。在斯坦福教授人工智能歷史一課的Jerry Kaplan表示,“蘋果不屬于社區(qū)的一分子,就像是AI領(lǐng)域的NSA(美國國家安全局)”。一般認(rèn)為,如果蘋果的努力與Google和Facebook一樣認(rèn)真,應(yīng)該會(huì)被外界所知。
艾倫AI研究所的Oren Etzioni表示,“Google、Facebook和微軟有著頂尖的機(jī)器學(xué)習(xí)人才。蘋果確實(shí)聘用了一些人,但機(jī)器學(xué)習(xí)的五大領(lǐng)袖中有誰為蘋果工作?蘋果有語音識(shí)別技術(shù),但除此之外機(jī)器學(xué)習(xí)還能幫什么忙呢。”
然而,就在本月初,蘋果秘密地展示了機(jī)器學(xué)習(xí)在自家產(chǎn)品上的應(yīng)用。但沒有展示給Oren Etzioni看,而是展示給了我。當(dāng)天,我的大部分時(shí)間都待在了蘋果庫比提諾飛船總部大樓里,在蘋果高管的陪同下,感受了蘋果產(chǎn)品在人工智能與機(jī)器學(xué)習(xí)上的緊密結(jié)合。(高管包括Eddy Cue,副總裁兼市場(chǎng)營銷主管Phil Schiller,以及軟件主管兼高級(jí)副總裁Craig Federighi)同時(shí)在場(chǎng)的還有負(fù)責(zé)開發(fā)Siri的專家。當(dāng)我們都就坐以后,他們給我看了寫滿了兩頁紙的機(jī)器學(xué)習(xí)應(yīng)用,一些是已經(jīng)投入使用的產(chǎn)品或服務(wù),一些是還在討論中的項(xiàng)目。
如果你是一名iPhone用戶,大概已經(jīng)受益于機(jī)器學(xué)習(xí)所帶來的用戶體驗(yàn)的提升。但與直覺相反,機(jī)器學(xué)習(xí)并不僅僅應(yīng)用于Siri上。識(shí)別陌生來電,在解鎖后列出你最常使用的應(yīng)用,或者在提醒事項(xiàng)中標(biāo)記了一個(gè)約會(huì)(但你并沒有將之放入日程表中),以及自動(dòng)顯示附近標(biāo)記的酒店,這些在蘋果全面擁抱機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)后,都能做得更加盡善盡美。
對(duì),這就是傳說中的“Apple Brain”,已經(jīng)內(nèi)置于你的iPhone中。
用到了神經(jīng)網(wǎng)絡(luò)的面部識(shí)別
“機(jī)器學(xué)習(xí)”,一名專家說,“現(xiàn)在在蘋果的產(chǎn)品及服務(wù)里無處不在”。Apple store使用深度學(xué)習(xí)辨別騙保行為,公測(cè)版操作系統(tǒng)收到的反饋也會(huì)使用人工智能篩選一遍,找出有用的反饋報(bào)告。還有蘋果的News應(yīng)用,采用機(jī)器學(xué)習(xí)挑選出你可能感興趣的新聞源。
Apple Watch也利用到了機(jī)器學(xué)習(xí),檢測(cè)用戶在鍛煉狀態(tài)還是僅僅在閑逛。還有就是眾所周知的相機(jī)人臉識(shí)別,iPhone早已搭載這項(xiàng)技術(shù)。在Wi-Fi信號(hào)較弱的情況下,出于電量考慮,iOS還會(huì)建議你使用蜂窩網(wǎng)絡(luò)。它甚至能分辨出拍攝視頻的好壞,并在點(diǎn)擊一個(gè)按鈕之后,快速把一組相關(guān)的視頻剪輯到一起。當(dāng)然,這些蘋果的競(jìng)爭(zhēng)對(duì)手們做的也不賴,但高管們強(qiáng)調(diào),蘋果是唯一一家在用戶隱私及用戶體驗(yàn)上取得平衡的公司。當(dāng)然,要在 iOS 設(shè)備上達(dá)到這一標(biāo)準(zhǔn),也只有蘋果能做到。
對(duì)蘋果來說,人工智能并非新玩意兒。早在上世紀(jì)90年代,蘋果推出牛頓(Newton)平板時(shí),配套的觸控筆就采用了一定程度的人工智能,用以識(shí)別用戶輸入的字符。這一研究成果目前還在為蘋果帝國發(fā)光發(fā)熱,即Apple Watch上面的中文字符識(shí)別系統(tǒng)。這一系統(tǒng)允許用戶輸入極為潦草的筆劃仍能精準(zhǔn)識(shí)別。(這些功能數(shù)十年以來都是由統(tǒng)一的機(jī)器學(xué)習(xí)團(tuán)隊(duì)在研發(fā))當(dāng)然,早期的機(jī)器學(xué)習(xí)極為原始,現(xiàn)在大行其道的深度學(xué)習(xí)在當(dāng)時(shí)仍處于襁褓之中。
現(xiàn)在人工智能與機(jī)器學(xué)習(xí)成為人必言之的顯學(xué),蘋果在這方面一直飽受批評(píng)。近幾周,Tim Cook終于發(fā)話,表示蘋果并非在人工智能方面沒有著力,僅僅是宣傳較少?,F(xiàn)在,高管們終于已改悶聲做事的做法,將蘋果在人工智能方面的成果公之于眾。
機(jī)器學(xué)習(xí)用于Apple Watch的健康應(yīng)用
“蘋果在過去的五年里增長迅猛”,Phil Schiller說,“我們的產(chǎn)品的改進(jìn)速度也非???,A系列的處理芯片每年都有不小的性能突破,這使得我們擁有更加充裕的性能,將越來越多的機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到終端產(chǎn)品上。機(jī)器學(xué)習(xí)有不少好東西,而我們也有能力用好它”。
即使蘋果擁抱機(jī)器學(xué)習(xí)的熱情絲毫不亞于任何硅谷科技公司,但他們對(duì)于機(jī)器學(xué)習(xí)的使用仍是克制的。這幫庫比提諾的天才們并不認(rèn)為機(jī)器學(xué)習(xí)是解決一切問題的靈丹妙藥。人工智能是未來的交互方式,但觸摸屏幕,平板電腦,面向?qū)ο缶幊淘谔囟〞r(shí)期一樣發(fā)揮了相同的作用。在蘋果看來,機(jī)器學(xué)習(xí)并非其他公司所說,是人機(jī)交互的終極答案。
“人工智能與以往改變?nèi)藱C(jī)交互的各種媒介并無本質(zhì)區(qū)別”,Eddy Cue 說。蘋果對(duì)于機(jī)器是否將取代人類這樣老生常談的討論也并無興趣。與預(yù)期相同,蘋果并沒有承認(rèn)造車計(jì)劃,也沒有談及自制電視劇的傳言,但蘋果的工程師們明確指出,他們不會(huì)造出類似“天網(wǎng)”的東西。
“我們使用技術(shù)來解決以前做不了的事情,已經(jīng)改進(jìn)舊有范式”,Schiller說,“我們確保每項(xiàng)技術(shù)都能以最蘋果的方式應(yīng)用到產(chǎn)品上”。
之后,他們對(duì)于上述觀點(diǎn)展開了進(jìn)一步的闡釋。如,人工智能在多大程度上重塑了蘋果的生態(tài)系統(tǒng)。蘋果研發(fā)人工智能的初衷是,彌補(bǔ)缺乏搜索引擎帶來的用戶體驗(yàn)缺失。(搜索引擎能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其快速成熟)此間,高管們?cè)俅螐?qiáng)調(diào)了蘋果對(duì)于保證用戶隱私的決心。(即使這樣將限制用戶數(shù)據(jù)的使用,從而阻礙機(jī)器學(xué)習(xí)的效果)高管們強(qiáng)調(diào),這些障礙并非不可逾越。
這個(gè)“大腦”有多大?iPhone上有多少用戶數(shù)據(jù)緩存可供機(jī)器學(xué)習(xí)調(diào)用?工程師們的回答讓我驚訝:“平均200Mb,具體多少取決于用戶信息的多寡。”(為節(jié)約存儲(chǔ)空間,緩存會(huì)時(shí)不時(shí)被清理出去)。這些信息包括了應(yīng)用的使用習(xí)慣,與他人的交互,神經(jīng)網(wǎng)絡(luò)處理,還有“自然語言模型”。還有對(duì)象識(shí)別,人臉識(shí)別,場(chǎng)景識(shí)別等供神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
對(duì)于蘋果來說,這些數(shù)據(jù)都是你的私人信息,并不會(huì)被上傳到網(wǎng)絡(luò)及云端。
盡管蘋果并沒有對(duì)其在人工智能方面的努力做出任何解釋,但我還是成功獲取了有關(guān)公司內(nèi)部如何分配機(jī)器學(xué)習(xí)技術(shù)的決議。其機(jī)器學(xué)習(xí)智能可以在全公司得到共享,并且公司鼓勵(lì)生產(chǎn)團(tuán)隊(duì)利用這一技術(shù)來解決問題,并發(fā)明一些更具特色的個(gè)性化產(chǎn)品。“在蘋果,我們并沒有一個(gè)單獨(dú)集中負(fù)責(zé)機(jī)器學(xué)習(xí)技術(shù)的組織”,Craig Federighi說:“我們盡力保持各個(gè)團(tuán)隊(duì)之間的緊密合作,力圖應(yīng)用這一技術(shù)創(chuàng)造出良好的用戶體驗(yàn)。”
那么在蘋果有多少人在從事機(jī)器學(xué)習(xí)這一塊的工作呢?“有很多”,F(xiàn)ederighi在受到一些刺激之后說道。(如果你認(rèn)為他會(huì)告訴我具體數(shù)字,那說明你還不了解蘋果)有趣的是,負(fù)責(zé)蘋果機(jī)器學(xué)習(xí)的許多人,在進(jìn)入蘋果公司之前,并沒有受到過這方面的必要訓(xùn)練。“我們雇用的人才都是在一些基本領(lǐng)域方面十分厲害的人,比如像數(shù)學(xué),統(tǒng)計(jì)學(xué),程序設(shè)計(jì)語言,密碼學(xué)等。” Federighi說:“結(jié)果表明,這些核心的智能能夠完美地轉(zhuǎn)換為機(jī)器學(xué)習(xí)智能。盡管現(xiàn)在我們的確雇用了許多機(jī)器學(xué)習(xí)人才,但我們還是希望能找到具有良好核心資質(zhì)和才能的人才。”
Craig Federighi(左)與Alex Acero
盡管Federighi并沒有說,但這一途徑似乎不可避免:蘋果喜歡保密,而競(jìng)爭(zhēng)對(duì)手們則鼓勵(lì)計(jì)算機(jī)科學(xué)家將他們的研究在全球范圍內(nèi)共享,這樣一來,蘋果便會(huì)處于不利地位。“我們的實(shí)踐更傾向于強(qiáng)化自然選擇——其實(shí)就是兩種不同類型人之間的對(duì)抗,一種喜歡通過團(tuán)隊(duì)合作,進(jìn)而創(chuàng)造出偉大的產(chǎn)品,而另一種則是將公布產(chǎn)品和技術(shù)作為他們的首要?jiǎng)恿?rdquo;,F(xiàn)ederighi說。如果科學(xué)家們?cè)谔嵘骋惶O果產(chǎn)品性能的同時(shí),又恰巧在這一領(lǐng)域取得了重大突破,那真是再好不過了。“但正是對(duì)最終結(jié)果的幻想為我們提供了巨大動(dòng)力。”Cue說。
蘋果在這方面的一些才能也來自于不斷的收購。“最近一年時(shí)間,我們已經(jīng)購買了20到30家公司。這些都是相對(duì)較小而又真正需要人力的公司。”Cue 說。“當(dāng)蘋果買下一個(gè)人工智能公司時(shí),這里肯定會(huì)有大量的機(jī)器學(xué)習(xí)研究員,但我們不會(huì)是穩(wěn)定住這些人” ,F(xiàn)ederighi說:“我們關(guān)注的是那些自身十分有才能,但又能真正注重實(shí)現(xiàn)絕佳體驗(yàn)的人。”
最近的一次收購是位于西雅圖的Turi公司,蘋果最終以2億美元的價(jià)格收購。該公司建立了一個(gè)機(jī)器學(xué)習(xí)工具包,一直以來都被比作是Google的TensorFlow。此次收購給蘋果提供了一種不同的思索,即可以將它用作類似的用途,既用于公司內(nèi)部,也可以提供給開發(fā)商。“可以肯定的是,他們的有些事情和蘋果十分匹配,無論是從技術(shù)的角度還是從個(gè)人的角度來看,都是如此。”Cue說。在一年或兩年的時(shí)間里,或許我們就能弄清楚發(fā)生了什么。蘋果在2013年收購了一家小的初創(chuàng)企業(yè)Cue,后來Siri開始顯示出一些預(yù)測(cè)能力。
無論這些才能來自哪里,蘋果的人工智能基礎(chǔ)建設(shè)有助于其開發(fā)出全新的產(chǎn)品和功能,而這通過以前的手段都是不可能做到的。這正在改變著公司的產(chǎn)品線路圖。“現(xiàn)在在蘋果,炫酷的想法簡直層出不窮,永無止境。” Schiller說:“機(jī)器學(xué)習(xí)正在使我們對(duì)一些事情給予肯定的看法,而這些事情放在過去幾年,我們是絕對(duì)會(huì)說不的。它正在不斷深入到我們的決策當(dāng)中,決定著我們下一批產(chǎn)品的走向。”
iPad Pro的Apple Pencil就是一個(gè)例子。為了發(fā)明出一支高科技的觸控筆,蘋果不得不面臨這樣一個(gè)問題,即當(dāng)人們?cè)谠O(shè)備上寫字的時(shí)候,他們的手掌底部難免會(huì)擦到屏幕,造成各種觸控失靈。這時(shí),使用“防手掌誤觸”這樣一個(gè)機(jī)器學(xué)習(xí)模式,就能很好的解決這一問題。因?yàn)樵撃J侥軌蚴蛊聊粋鞲衅鞲惺艿焦尾?,觸摸和筆觸之間的區(qū)別,大大提升了觸控筆操控的精確度。“如果觸控筆無法在iPad上進(jìn)行完美操作,那么iPad就不能被看作是一張很好的可供我繼續(xù)寫字的紙,Pencil也就不會(huì)是一個(gè)好的產(chǎn)品。” Federighi說。所以如果你愛Apple Pencil的話,那就請(qǐng)感謝機(jī)器學(xué)習(xí)吧。
對(duì)蘋果機(jī)器學(xué)習(xí)方面進(jìn)展的最佳測(cè)量方式,或許來自它在AI上最重要的收購:Siri。Siri最初誕生自DARPA在智能助理上的一項(xiàng)計(jì)劃,后來部分科學(xué)家成立了一家公司,用同樣的技術(shù)開發(fā)了一款應(yīng)用。2010年,喬布斯親自說服公司創(chuàng)始成員將公司出售給蘋果,并指示將Siri整合進(jìn)操作系統(tǒng)。在2011年10月iPhone 4S的發(fā)布會(huì)上,Siri是一大點(diǎn)亮?,F(xiàn)在它早已不是用戶長按Home鍵,或發(fā)出“Hey, Siri”指令進(jìn)行喚醒(這一功能本身也使用了機(jī)器學(xué)習(xí),允許iPhone在不耗電的情況下了解周圍情況)這么簡單了。Siri的智能整合進(jìn)了Apple Brain,即便不發(fā)場(chǎng)時(shí)也在工作。
作為核心產(chǎn)品而言,Cue提到了四個(gè)組成:語音識(shí)別(理解你何時(shí)與它對(duì)話),自然語言理解(理解說話內(nèi)容),執(zhí)行(滿足查詢或請(qǐng)求)以及響應(yīng)(產(chǎn)生回話)。“機(jī)器學(xué)習(xí)對(duì)所有這些都有重要影響。”
Tom Gruber(上)與Alex Acero
Siri高級(jí)研發(fā)部主管Tom Gruber是在最初的收購后加入了蘋果的,他表示,在蘋果把神經(jīng)網(wǎng)絡(luò)用于Siri之前,其用戶量已經(jīng)在產(chǎn)生大量數(shù)據(jù),而這對(duì)訓(xùn)練神經(jīng)網(wǎng)絡(luò)十分重要。“喬布斯說,一夜之間就會(huì)擁有數(shù)百萬用戶,還不用公測(cè)。突然之間就會(huì)有用戶,他們會(huì)告訴你,人們?nèi)绾闻c應(yīng)用對(duì)話。這是第一次革命,那之后神經(jīng)網(wǎng)絡(luò)時(shí)代到來了。”
隨著Siri轉(zhuǎn)移到用神經(jīng)網(wǎng)絡(luò)處理語音識(shí)別而來的,還有幾位AI專家,其中包括現(xiàn)在語音組的主管Alex Acero。Acero的語音識(shí)別經(jīng)歷始于90年代的蘋果,后來他在微軟研究院工作了多年。“我喜歡這類工作,也發(fā)表了很多論文。當(dāng)Siri出現(xiàn)時(shí),我意識(shí)到這是讓深度神經(jīng)網(wǎng)絡(luò)應(yīng)用得以實(shí)現(xiàn)的機(jī)會(huì),不是讓幾百人用,而是讓數(shù)百萬人用。”換句話說,他就是蘋果想找的那類科學(xué)家——優(yōu)先考慮產(chǎn)品而非發(fā)表論文。
當(dāng)Acero在三年前加入時(shí),Siri用的語音技術(shù)仍基本來自第三方的授權(quán),而這種情況必須改變。Federighi意識(shí)到,這是蘋果不斷在重復(fù)的一種模式。“隨著一項(xiàng)技術(shù)對(duì)開發(fā)核心產(chǎn)品變得越來越重要,我們會(huì)讓內(nèi)部逐漸接手開發(fā)。要開發(fā)偉大的產(chǎn)品,我們希望內(nèi)部擁有技術(shù),并在內(nèi)部創(chuàng)新,語音識(shí)別就是一個(gè)很好的例子。”
團(tuán)隊(duì)開始訓(xùn)練神經(jīng)網(wǎng)絡(luò),以替代Siri早前的技術(shù)。蘋果的GPU集群不停運(yùn)轉(zhuǎn),調(diào)用了大量數(shù)量。2014年7月的發(fā)布證明,所有努力都沒有白費(fèi)。
Acero表示,“當(dāng)時(shí)在所有語言上,錯(cuò)誤率降低了兩倍,在很多場(chǎng)景下還不止如此。這都要?dú)w功于深度學(xué)習(xí)及對(duì)它的優(yōu)化,不僅是算法方面,更是在產(chǎn)品開發(fā)的整個(gè)過程上。”
蘋果不是第一家在語音識(shí)別中使用DNN的公司,但它證明,控制整個(gè)運(yùn)轉(zhuǎn)系統(tǒng)會(huì)產(chǎn)生優(yōu)勢(shì)。Acero表示,正是因?yàn)樘O果自己設(shè)計(jì)芯片,他能直接與編寫固件的芯片設(shè)計(jì)組工程師合作,最大化提升神經(jīng)網(wǎng)絡(luò)的性能。Siri團(tuán)隊(duì)的需求甚至影響了iPhone設(shè)計(jì)的方方面面。
Fdferighi表示,“不僅僅是芯片,還涉及設(shè)備上的麥克風(fēng),以及麥克風(fēng)安裝的位置,還有如何調(diào)整硬件,以及處理音頻的軟件棧。這需要所有組件的協(xié)調(diào),比起只是開發(fā)軟件的公司,有著驚人的優(yōu)勢(shì)。”
另一個(gè)優(yōu)勢(shì)是,當(dāng)蘋果的神經(jīng)網(wǎng)絡(luò)在一個(gè)產(chǎn)品上成功時(shí),還能成為其它產(chǎn)品的核心技術(shù)。機(jī)器學(xué)習(xí)讓Siri理解了用戶,也讓輸入方式由手動(dòng)變成了聽寫。也正是因?yàn)镾iri的技術(shù),用戶語音輸入的信息也變得更流暢和完整。
Cue提到的Siri第二個(gè)部分是自然語言理解。Siri在2014年11月開始用機(jī)器學(xué)習(xí)理解用戶的意圖,并在一年后推出了深度學(xué)習(xí)版。如在語音識(shí)別上一樣,機(jī)器學(xué)習(xí)提升了體驗(yàn),特別是在理解指令上。
蘋果認(rèn)為,沒有Siri上的技術(shù),它不太可能開發(fā)出最新版的Apple TV,因?yàn)楹笳咭灿姓Z音控制功能。盡管早期的Siri版本要求你用清晰的方式說話,但深度學(xué)習(xí)加強(qiáng)版不僅能從大量電影和音樂中找到特定的選擇,更能處理“播放一部湯姆·漢克斯主演的優(yōu)秀驚悚片”這樣的概念。這在以前是完全不可能的。
在即將正式發(fā)布的iOS 10中,Siri的聲音是最后一個(gè)被機(jī)器學(xué)習(xí)改造的部分。同樣,深度神經(jīng)網(wǎng)絡(luò)替代了原先授權(quán)的技術(shù)。Siri的聲音來自一家語音中心收集的錄音數(shù)據(jù)庫,每句話都是語音段拼貼的結(jié)果。機(jī)器學(xué)習(xí)讓語音變得平滑,聽起來更像一個(gè)真人。
這看起來只是很小的細(xì)節(jié),但更自然的聲音能為Siri帶來很大的改變。Gruber認(rèn)為,“如果聲音質(zhì)量更高,人們會(huì)感到更加可信。更好的語音能吸引用戶,讓他們更常使用。”
使用Siri的意愿,以及機(jī)器學(xué)習(xí)在技術(shù)上的提升,都在蘋果向開發(fā)者開放Siri的過程中十分重要。許多人注意到,蘋果在Siri上的合伙量只有兩位數(shù),遠(yuǎn)遠(yuǎn)落后于亞馬遜的Alexa,后者稱外部開發(fā)者幫助開發(fā)了1000多項(xiàng)技能。蘋果認(rèn)為這種比較沒有意義,因?yàn)閬嗰R遜用戶要使用特定的指令方式,才可用到那些技能。蘋果表示,Siri在與Uber和SquareCash等服務(wù)的整合上會(huì)更自然。
與此同時(shí),蘋果對(duì)Siri的改善也得到了回報(bào),用戶發(fā)現(xiàn)了一些新功能,也感到常用的查詢變得更準(zhǔn)確,而相應(yīng)的,查詢數(shù)量也不斷增長。
或許,蘋果使用機(jī)器學(xué)習(xí)技術(shù)中遇到的最大問題,是如何堅(jiān)持保護(hù)用戶隱私的原則。蘋果會(huì)加密用戶信息,包括公司律師在內(nèi)的任何人都無法讀取。FBI也不能,即便獲得了批準(zhǔn)。它還表示,不會(huì)收集用戶信息用于廣告目的。
從用戶的角度上看,這種行為值得尊敬,但這對(duì)吸引頂尖AI人才并無幫助。一位蘋果前員工表示,“機(jī)器學(xué)習(xí)專家想要的就是數(shù)據(jù)。但出于保護(hù)隱私的立場(chǎng),蘋果總會(huì)有所干預(yù)。這種做法是否正確暫不討論,但外界會(huì)認(rèn)為蘋果不是鐵桿AI粉。”
蘋果高管并不認(rèn)同這種觀點(diǎn)。他們認(rèn)為無需將用戶信息放在云端,或存儲(chǔ)訓(xùn)練神經(jīng)網(wǎng)絡(luò)所用的數(shù)據(jù),也能得到提升機(jī)器學(xué)習(xí)表現(xiàn)的數(shù)據(jù)。Federighi認(rèn)為,“外界一直存在錯(cuò)誤的觀點(diǎn),做出了錯(cuò)誤的妥協(xié),我們想讓他們走上正軌。”
這里有兩個(gè)問題。第一個(gè)涉及到在機(jī)器學(xué)習(xí)系統(tǒng)中處理個(gè)人信息,當(dāng)個(gè)人詳細(xì)信息是由神經(jīng)網(wǎng)絡(luò)收集到的時(shí),這些信息會(huì)怎么樣?第二個(gè)涉及到收集訓(xùn)練神經(jīng)網(wǎng)絡(luò)識(shí)別行為所需的數(shù)據(jù),不收集個(gè)人信息,又將如何做到訓(xùn)練呢?
蘋果對(duì)兩者都有答案。Cue表示,“有人認(rèn)為,我們用AI做不了這些事,因?yàn)闆]有數(shù)據(jù)。但我們找到了獲取所需的數(shù)據(jù),同時(shí)保護(hù)隱私的方式。這是我們的底線。”
對(duì)于第一個(gè)問題,蘋果的解決方式是利用其獨(dú)特的對(duì)軟硬件的控制。簡單來說,多數(shù)個(gè)人信息仍保留在Apple Brain中。Federighi表示,“我們會(huì)將部分最敏感的信息保留在設(shè)備上,這時(shí)機(jī)器學(xué)習(xí)完全在本地運(yùn)行。”他給出的例子是應(yīng)用推薦,即在主屏上右滑時(shí)會(huì)出現(xiàn)的圖標(biāo)。在理解狀態(tài)下,這些應(yīng)用就是你意圖想用的。這種預(yù)測(cè)基于許多因素,基本都與用戶的行為有關(guān)。這一功能確實(shí)有用,F(xiàn)ederighi表示,預(yù)測(cè)用戶想用圖標(biāo)的概率有90%。
蘋果存在設(shè)備上的其它信息可能包括了最個(gè)人的信息:用戶使用iPhone鍵盤輸入的文字。使用經(jīng)過神經(jīng)網(wǎng)絡(luò)訓(xùn)練的系統(tǒng),蘋果能識(shí)別出關(guān)鍵事件和項(xiàng)目,如航班信息,聯(lián)系人及約會(huì)。不過這些信息都存在手機(jī)上。即使是備份在蘋果云上的信息,也會(huì)經(jīng)過處理后不能僅由備份信息進(jìn)行還原。“我們不想把信息存在蘋果服務(wù)器上,公司沒必要知道你的愛好或你在哪。”
蘋果也在盡量減少整體上保存的信息。一個(gè)例子是,在交談中有人可能提到一個(gè)詞,這或許需要搜索。其它公司很可能在云端分析整段對(duì)話,從而識(shí)別出那些詞語,但蘋果設(shè)備無需這些數(shù)據(jù)遠(yuǎn)離用戶就能識(shí)別出來。這是因?yàn)橄到y(tǒng)會(huì)不斷與手機(jī)中的知識(shí)庫進(jìn)行搜索匹配。
Federight表示,“知識(shí)庫很精練,但也相當(dāng)完善,儲(chǔ)存了成千上萬的地點(diǎn)和實(shí)體。”蘋果所有的應(yīng)用都能用知識(shí)庫,包括Spotlight搜索應(yīng)用,地圖和瀏覽器。它也能幫助自動(dòng)糾錯(cuò),一直在后臺(tái)運(yùn)行。
機(jī)器學(xué)習(xí)圈的一個(gè)疑問是,蘋果的隱私限制是否會(huì)阻礙神經(jīng)網(wǎng)絡(luò)算法,這也是上文中提到的第二個(gè)問題。經(jīng)過大量數(shù)據(jù)訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能準(zhǔn)確。如果蘋果不采集用戶行為數(shù)據(jù),又從哪里得到數(shù)據(jù)呢?與其它公司一樣,蘋果用公開數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),但總有需要更新更準(zhǔn)確的數(shù)據(jù)的時(shí)候,而這又只能從用戶中來。蘋果的做法是在不知道用戶是誰的情況下收集信息。它會(huì)對(duì)數(shù)據(jù)匿名處理,隨機(jī)打上識(shí)別信息。
從iOS 10開始,蘋果會(huì)開始使用一種名為差分隱私(Differential Privacy)的新技術(shù),它會(huì)對(duì)信息進(jìn)行眾包處理,讓個(gè)人身份無法識(shí)別。這種技術(shù)可能用在出現(xiàn)新流行詞,而它又不在蘋果知識(shí)庫中時(shí);也會(huì)用在某個(gè)鏈接突然變得與相關(guān)查詢的答案相關(guān)時(shí),或某個(gè)表情被大量使用時(shí)。“傳統(tǒng)的方式會(huì)將用戶每次輸入都傳到服務(wù)器上,然后遍歷數(shù)據(jù)來找到感興趣的東西。但我們有端到端加密,不會(huì)這樣行事。”雖然差分隱私是一個(gè)較為學(xué)術(shù)的詞,但蘋果想讓它變得更加普及。
Federighi表示,“我們數(shù)年前就開發(fā)研究,做出了能大范圍使用的有趣的成果。它的隱私程度令人驚嘆。”簡單來說,差分隱私就是對(duì)數(shù)據(jù)的若干片段加入數(shù)學(xué)噪音,這樣蘋果能識(shí)別用使用模式,又不會(huì)辨別出個(gè)人身份。蘋果還授權(quán)研究相關(guān)技術(shù)的科技家發(fā)表論文,公布他們的工作。
顯然,機(jī)器學(xué)習(xí)改變了蘋果產(chǎn)品的方方面面,但對(duì)于蘋果本身,機(jī)器學(xué)習(xí)改變了什么,還有待觀察。從感覺上說,機(jī)器學(xué)習(xí)似乎與蘋果公司的氣質(zhì)格格不入。蘋果喜歡對(duì)用戶體驗(yàn)進(jìn)行全方位的控制,所有事情都事先幫你設(shè)計(jì)好,代碼極致優(yōu)化。但使用機(jī)器學(xué)習(xí),就意味著要將一部分決定權(quán)交由軟件處置。將用戶體驗(yàn)逐漸交給機(jī)器控制,蘋果能接受這樣的設(shè)定嗎?
“這件事情引起了內(nèi)部無窮無盡的爭(zhēng)論”,F(xiàn)aderighi 說,“我們對(duì)此曾有過非常深入的思考。以往我們根據(jù)經(jīng)驗(yàn),從多個(gè)維度控制人機(jī)交互的種種細(xì)節(jié),以達(dá)到最佳的用戶體驗(yàn)。但如果你開始訓(xùn)練機(jī)器通過大量數(shù)據(jù)模擬人的行為,結(jié)果就不再是蘋果設(shè)計(jì)師所擅長的。所有的一切都來自數(shù)據(jù)。”
但蘋果并沒有回頭,Schiller 說,“盡管這樣的技術(shù)將改變我們的工作方式,但為了做出更高質(zhì)量的產(chǎn)品,我們終將在這條路上越走越遠(yuǎn)”。
也許這就是問題的答案:蘋果并不會(huì)大張旗鼓地宣揚(yáng)自己采用了多么先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),但他們?nèi)詴?huì)盡可能地將之運(yùn)用到產(chǎn)品中,以期獲得更好的用戶體驗(yàn)。藏在你iPhone中的Apple Brain就是最好的證明。
“典型的蘋果用戶,將在不知不覺中得到機(jī)器學(xué)習(xí)帶來的用戶體驗(yàn)的提升,并因此更加愛上蘋果產(chǎn)品”。Schiller 說。“最讓人興奮的是,你甚至都感覺不到它的存在,直到有一天你突然意識(shí)到,并發(fā)出由衷的感嘆:“這一切是怎么發(fā)生的?”