當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀] 不久前,Google 宣布進(jìn)行架構(gòu)重組,原安卓業(yè)務(wù)主管、Google 高級(jí)副總裁桑達(dá)爾·皮查伊成為了 Google 新任的CEO。這個(gè)變動(dòng)似乎引起了一些 Google Now 開(kāi)發(fā)團(tuán)隊(duì)的不滿(mǎn),引發(fā)全員離職(亦說(shuō)骨干成員離職),Googl

Google Now是谷歌的一大神器,雖然墻內(nèi)不能使用,但是墻外的老外們玩的不亦樂(lè)乎。火熱程度不比siri差。墻內(nèi)的我們可能不太了解GOOGLE NOW。 不久前,Google 宣布進(jìn)行架構(gòu)重組,原安卓業(yè)務(wù)主管、Google 高級(jí)副總裁桑達(dá)爾·皮查伊成為了 Google 新任的CEO。這個(gè)變動(dòng)似乎引起了一些 Google Now 開(kāi)發(fā)團(tuán)隊(duì)的不滿(mǎn),引發(fā)全員離職(亦說(shuō)骨干成員離職),Google Now并入大 Search 組。Google Now 是安卓平臺(tái)用以對(duì)抗蘋(píng)果Siri、微軟Cortana的語(yǔ)音助手。那么,Google Now是什么?它包含了哪些 Google 的黑科技?

Google Now 是什么

雖然本文談的廣義 Google Now 是集成了語(yǔ)音搜索的一整套 App,但更精確地定義狹義的 Google Now,就是手機(jī)上 Google Now 應(yīng)用打開(kāi)之后,出現(xiàn)在首屏的那些智能推薦卡片,在合適的時(shí)間推送給你合適的信息,比如天氣、新聞。相對(duì)于人們?cè)贕oogle搜索輸入框主動(dòng)輸入自己想找的東西,Google Now會(huì)“智能”地把你所需要的信息推送到你面前。

 所以,大家經(jīng)常把 Google Now 稱(chēng)之為 Google 的智能推送技術(shù)。

比如筆者在國(guó)外的時(shí)候,能享受到 Google Now 的便利。比如通過(guò)Booking.com(類(lèi)似攜程)定了酒店,或者 kayak.com(類(lèi)似去哪兒)定了機(jī)票,確認(rèn)郵件都會(huì)發(fā)到筆者的Gmail郵箱。Google會(huì)很“智能”地分析(偷窺)這些行程郵件,并在航班即將起飛前幾小時(shí)提醒你航班的具體信息及航站樓甚至登機(jī)口信息。在你到達(dá)新的城市的時(shí)候,自動(dòng)彈出你即將下榻酒店的導(dǎo)航路線以及聯(lián)系電話等信息。出國(guó)旅行的時(shí)候,Google Now會(huì)自動(dòng)彈出當(dāng)?shù)氐呢泿艆R率,以及祖國(guó)的時(shí)間。它也會(huì)細(xì)心地記住你家和公司的位置,在下班時(shí)間準(zhǔn)時(shí)提醒你回家的交通狀況,雖然還并不能那么智能地了解到你今晚又要加班!

這里再說(shuō)說(shuō)Google Now 的誕生

Google Now,也是傳說(shuō)中的 Google 20% Project 的產(chǎn)物。Google工程師 Baris Gultekin 在2010年的時(shí)候,因?yàn)閭€(gè)人興趣想利用手機(jī)上豐富的傳感器來(lái)做一些有趣的事情,這個(gè)想法跟時(shí)任Google Map負(fù)責(zé)人的 Andrew Kirmse 不謀而合。兩人在業(yè)余時(shí)間里面搭建了一個(gè)原型,并展示給當(dāng)時(shí)還在 Google 的梅姐 Marissa mayer。

 在梅姐的支持下,隊(duì)伍漸漸壯大,并且也加入了用戶(hù)通勤的時(shí)間預(yù)測(cè)和對(duì) Google Calendar 事件的整合。碰巧的是,在2012年初,Larry Page正好要求 Android 和 Search 團(tuán)隊(duì)搭建一個(gè)類(lèi)似的東西。于是在Android 老大 Andy Rubin 的支持下,兩人加入了 Android 團(tuán)隊(duì),得到了大量的設(shè)計(jì)方面的資源,并且在2012年 Google IO上第一次發(fā)布Google Now。

發(fā)展了這么多年,現(xiàn)在 Google Now 已經(jīng)被整合進(jìn) Google 搜索的 App 中。

最近某國(guó)外科技網(wǎng)站也傳出了Google Now團(tuán)隊(duì)解散的謠言,說(shuō)是成員全數(shù)離職,還聯(lián)系到最近Google架構(gòu)變動(dòng),頗有陰謀論的意思。部分骨干成員離職確有其事,但這早在幾個(gè)月前就發(fā)生了,非常正常的人事變動(dòng)。

Google Now本身作為一個(gè)出色的產(chǎn)品,從Android組移入Search組,從技術(shù)角度來(lái)講,能得到大Search組更多的技術(shù)資源,對(duì)早日完成智能Google這一偉大目標(biāo)是大有好處的,這明顯是個(gè)好消息!

別看這個(gè)App界面簡(jiǎn)單,就一個(gè)搜索框和一排卡片,里面的技術(shù)可不簡(jiǎn)單。

介紹完狹義的Google Now推薦卡片,我們一起來(lái)看看Google Now這個(gè)小app里面,蘊(yùn)含了很多Google的黑科技:智能推薦(Google Now card),熱詞喚醒(OK Google),語(yǔ)音識(shí)別和語(yǔ)義分析。

首先說(shuō)下智能推薦

推薦的原則是“Just right information at right time”,即合適的時(shí)間推薦合適的信息。那么如何知道哪些信息是用戶(hù)真正想要的,而不是機(jī)器自作主張,這個(gè)度需要拿捏。雖然現(xiàn)在統(tǒng)計(jì)機(jī)器學(xué)習(xí)方面這幾年已經(jīng)大規(guī)模地應(yīng)用在工業(yè)界,但是巧婦難為無(wú)米之炊,在無(wú)法得知用戶(hù)生活方方面面信息的前提之下,算機(jī)器學(xué)習(xí)算法再高級(jí),也無(wú)法做出太智能的推薦,所以一般公司都會(huì)采用規(guī)則+機(jī)器學(xué)習(xí)相結(jié)合的策略。

從現(xiàn)有產(chǎn)品看來(lái),Google Now推薦的東西也相當(dāng)保守。

Google 能夠通過(guò)你在某個(gè)地點(diǎn)待的頻率,猜測(cè)你家和工作單位的位置,并且在每天指定時(shí)間自動(dòng)提醒你回家的交通情況。

前面也提到過(guò),行程郵件卡片、酒店預(yù)訂卡片、出國(guó)旅游的匯率和祖國(guó)時(shí)間卡片等等。難點(diǎn)不在有多高深的推薦算法,而在于Google能盡量收集用戶(hù)的生活信息的點(diǎn)點(diǎn)滴滴,并且通過(guò)深思熟慮的規(guī)則,盡量不打擾地推薦給你。在國(guó)外,由于郵件普及率高,Google 坐擁 Gmail(順便說(shuō)一下,Gmail 當(dāng)年出生跟 Google Now很像,也是誕生于傳說(shuō)中的20% project),做出 Google now,Google占了天時(shí)地利人和。

熱詞喚醒

在 Google Now 軟件主界面,對(duì)著手機(jī)喊一聲“OK Google”,則自動(dòng)觸發(fā)語(yǔ)音識(shí)別接受用戶(hù)語(yǔ)音查詢(xún)。


熱詞喚醒作為啟動(dòng)語(yǔ)音識(shí)別的鑰匙,目的是以盡可能低的功耗來(lái)接受用戶(hù)的喚醒。

因?yàn)樾枰掷m(xù)開(kāi)著麥克風(fēng),對(duì)輸入的音頻進(jìn)行運(yùn)算,使得CPU一直無(wú)法得到休眠,會(huì)嚴(yán)重影響已經(jīng)很緊張的手機(jī)電池續(xù)航。

所以手機(jī)上熱詞喚醒要維持高水準(zhǔn),需要考慮的重點(diǎn),除了準(zhǔn)確率(用戶(hù)叫你的時(shí)候能馬上響應(yīng),用戶(hù)不在叫你的時(shí)候不要聽(tīng)錯(cuò)),還有能耗。熱詞喚醒不需要像通用語(yǔ)音識(shí)別一樣識(shí)別千變?nèi)f化的自然語(yǔ)言,它只要識(shí)別“OK Google”這個(gè)固定的詞,所以在算法方面也不必要采用復(fù)雜的傳統(tǒng)語(yǔ)音識(shí)別,拋棄高大上的各種 HMM、語(yǔ)言模型,用簡(jiǎn)單直接的分類(lèi)的方法在用戶(hù)輸入語(yǔ)音流中尋找“OK Google”這幾個(gè)字,簡(jiǎn)單但好用。

當(dāng)然,這也有個(gè)例外,幾年前 Moto X剛出來(lái),就是主打24小時(shí)全程語(yǔ)音喚醒待命,人家可是有2顆低功耗芯片,專(zhuān)門(mén)等待著用戶(hù)隨時(shí)輸入語(yǔ)音命令。

語(yǔ)音識(shí)別就不用說(shuō)了,Google的強(qiáng)項(xiàng)

幾年前微軟研究院的一篇基于深度學(xué)習(xí)應(yīng)用于語(yǔ)音識(shí)別的論文,定義的算法準(zhǔn)確率超越了傳統(tǒng)的基于 HMM-GMM 的語(yǔ)音識(shí)別。但 Google 領(lǐng)先將其工業(yè)化,并應(yīng)用到當(dāng)年的語(yǔ)音搜索產(chǎn)品中。DNN 直接在最原始的音頻數(shù)據(jù)上進(jìn)行語(yǔ)音識(shí)別,并且需要大量的訓(xùn)練數(shù)據(jù),來(lái)訓(xùn)練大量的神經(jīng)網(wǎng)絡(luò)參數(shù),因此對(duì)硬件要求也很高,這正好是 Google 的強(qiáng)項(xiàng)。

經(jīng)過(guò)幾年的積累,Google 的語(yǔ)音識(shí)別已經(jīng)初具規(guī)模。值得注意的是,作為 Google Now 的競(jìng)爭(zhēng)對(duì)手的Siri,Siri 的語(yǔ)音識(shí)別一直用的是 nuance 家的技術(shù)(nuance是世界最大的語(yǔ)音識(shí)別提供商,可以理解為訊飛在中國(guó)的地位),雖然前段時(shí)間也傳出過(guò)蘋(píng)果在組建自己的語(yǔ)音識(shí)別團(tuán)隊(duì)的消息。

語(yǔ)義識(shí)別

通過(guò) Google Now 上面的應(yīng)用搜索框,你可以問(wèn)一些看起來(lái)非常炫酷的問(wèn)題。

一些日常生活類(lèi)信息查詢(xún),比如紐約到舊金山的航班,比如未來(lái)3天北京的天氣,現(xiàn)在東京時(shí)間幾點(diǎn)。這種問(wèn)答系統(tǒng)涉及到自然語(yǔ)言處理的方方面面,難度極大。

雖然在學(xué)術(shù)上,NLP(自然語(yǔ)言處理)在各種領(lǐng)域,比如語(yǔ)法分析、實(shí)體識(shí)別,經(jīng)過(guò)幾十年的努力,都取得了90%以上的準(zhǔn)確率。但在實(shí)際產(chǎn)品情境下,用戶(hù)口語(yǔ)化表述更加多樣,會(huì)產(chǎn)生歧義,和學(xué)術(shù)界經(jīng)常用于評(píng)測(cè)系統(tǒng)的語(yǔ)言測(cè)試集差別很大。

并且,問(wèn)答系統(tǒng)是多個(gè)子NLP系統(tǒng)串聯(lián)成流水線的產(chǎn)物,比如詞性分析的輸出可能作為語(yǔ)法分析的輸入,語(yǔ)法分析的輸出可能作為實(shí)體識(shí)別的輸入。在這么一個(gè)流水線系統(tǒng)中,早期的錯(cuò)誤會(huì)被傳播到流水線之后的步驟,并被放大。


因此單個(gè)子系統(tǒng)上很小的錯(cuò)誤,在最終都會(huì)被放大,嚴(yán)重影響最終對(duì)用戶(hù)查詢(xún)的理解。

一般的問(wèn)答系統(tǒng),都會(huì)針對(duì)當(dāng)前領(lǐng)域進(jìn)行專(zhuān)門(mén)優(yōu)化,研究用戶(hù)問(wèn)得最多的是哪些問(wèn)題,并盡量倚重規(guī)則(甚至正則表達(dá)式),并加強(qiáng)用戶(hù)引導(dǎo),減少用戶(hù)自然語(yǔ)言的歧義。

Google Now 語(yǔ)音搜索還支持一些百科類(lèi)問(wèn)題,比如現(xiàn)在的美國(guó)總統(tǒng)是誰(shuí),喜馬拉雅山的高度是多少,或者中國(guó)的人口是多少。

Google 畢竟是搜索出身,坐擁整個(gè)互聯(lián)網(wǎng)的信息,千千萬(wàn)萬(wàn)的網(wǎng)頁(yè)中已經(jīng)包含了“奧巴馬是美國(guó)總統(tǒng)”,“中國(guó)的人口是13億”這樣的陳述,對(duì)于 Google 來(lái)說(shuō),問(wèn)題會(huì)簡(jiǎn)化成如何匹配用戶(hù)的問(wèn)題到千千萬(wàn)萬(wàn)網(wǎng)頁(yè)中的某一句話,而不僅僅是給出 Top 幾十的匹配網(wǎng)頁(yè),這在屏幕小的手機(jī)上、甚至手表上對(duì)用戶(hù)體驗(yàn)的影響至關(guān)重要。

學(xué)術(shù)界的一般做法,是首先識(shí)別用戶(hù)是問(wèn)哪個(gè)類(lèi)型的問(wèn)題(What? When? Which? Where? etc。),然后利用信息檢索的策略先在千萬(wàn)網(wǎng)頁(yè)中篩選出一些和用戶(hù)問(wèn)題最相關(guān)的候選網(wǎng)頁(yè),之后根據(jù)問(wèn)題類(lèi)型,去這些候選網(wǎng)頁(yè)中摘出最能直接回答用戶(hù)提問(wèn)的語(yǔ)句。贏了Jeopardy!(可以理解為老美的開(kāi)心辭典這樣的知識(shí)問(wèn)答類(lèi)節(jié)目)人類(lèi)冠軍的 IBM Watson 系統(tǒng),也采用了類(lèi)似的設(shè)計(jì)思路。這樣的方法可以確保以自動(dòng)化而非人力的方法提高問(wèn)題的覆蓋率,而不用像某果需要招聘很多問(wèn)題編輯來(lái)應(yīng)對(duì)越來(lái)越多熱心群眾對(duì)Siri的無(wú)情調(diào)戲。

Google 近幾年來(lái),在語(yǔ)義分析、知識(shí)圖譜方面都投入了大力氣,大家也漸漸能在Google Now以及普通搜索中看到對(duì)這類(lèi)技術(shù)的整合。

所以,Google Now 并入大 Search 組,得到更多的技術(shù)支持,絕對(duì)是一件大大的好事呢!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉