語音識別不是革命性的。多年前,IBM的語音識別軟件在PC上就有不錯的識別率了。
基于語音識別,簡單的智能分析和系統(tǒng)功能的調用也不算革命性的。無論是Google的Voice Action,還是Vlingo等獨立的公司,做的都不錯。
但是,從目前流出的視頻看,Siri并非這些已知技術的簡單組合。
Siri的智能程度更高
Vlingo中你說 “Text Mike ,Messages How are you.”利用關鍵字的匹配就可以完成很多事情了。Text是命令,Messages是關鍵字。匹配上這兩個詞,就知道給誰,發(fā)送什么內(nèi)容了。
而Siri理解上下文。你問了北京的天氣,再說:“ How about Shanghai ?” ,他知道你指的是天氣。
一個更驚人的例子出現(xiàn)在Siri被蘋果并購前的演示里。你說“ I like a romantic place for Italian food near my office”。
Siri 回答:“I am looking for a Italian restaurants which reviews say are romantic near your wok in San Jose…”
這個回答說明Siri聽懂了romantic是個形容詞。并且知道near my office是個地方。并且,找到了以前存儲的用戶的工作地點。并且,他知道怎么判斷一個餐館是否 romantic。(去搜索 reviews)
把同樣的話對著 Android的Voice Action或者Vlingo說一遍,你就知道Siri具有超越現(xiàn)有 Apps的智能。
Siri和系統(tǒng)的整合更加緊密
Siri在并購前的版本整合了大量網(wǎng)絡服務的APIs。比如 OpenTable,Tickets.com,Taxi Magic等等。
而Siri被蘋果收購了之后,他已經(jīng)被整合為系統(tǒng)的一部分了。
在iOS5 的Siri視頻中,出現(xiàn)新短消息之后,交互由Siri發(fā)起。說明他已經(jīng)常駐系統(tǒng)后臺并且可以接管重要的系統(tǒng)功能了。(除了短消息還有天氣,時鐘,Maps 等等)
Siri的團隊?
判斷Siri靠不靠譜的另一個角度是看看到底是誰在做?
2003 年美國國防部高級研究機構(DARPA)發(fā)起了一個相關的項目(“enduring personalized cognitive assistant.”)。而 SRI(斯坦福研究院)負責這個項目的研究,項目被命名為CALO 。這就是Siri的前身。
DARPA?互聯(lián)網(wǎng)的前身和GPS都源于 DARPA 的項目。
SRI參與的創(chuàng)新?鼠標,互聯(lián)網(wǎng),無線通訊,超聲波,機器人 AI ,語音識別等赫然在列。
Siri被喬布斯看中?
2009年2月,Siri登陸AppStore 。
2009年3月,蘋果收購Siri。價格不詳。
2011年10月,蘋果發(fā)布和系統(tǒng)高度整合的Siri。(DARPA項目的8年之后)
(時間表來自 Mashable )
蘋果收購Siri的決定之快,價格之高,和iOS5的整合之緊密,讓人懷疑這是個高層決策。(收購價格不詳,假設第二輪出讓 10% 股份,在此之后Siri的估值不會低于1.5億美金。蘋果的并購很少超過這個數(shù)。)
這次并購展示了蘋果對于新科技的超凡的預見能力。他總能發(fā)現(xiàn)那些真正會改變生活的技術。(比如電容多點觸摸)
再一次,讓人想起喬布斯。對他來說, Siri可能不過是當年在帕羅奧多那里看到Alto情景的重演而已。(而最近幾天的報道證實,喬布斯在病重期間一直參與蘋果的決策。)
Siri威脅了誰?
擁有Siri的iPhone 4S會威脅 Android ,WP7等其他智能手機。但是,這并不是最重要的。
Siri如果真的如蘋果的廣告那么好用,他會威脅到Google的命根子:搜索。
搜索不再是“搜索框,網(wǎng)站,功能,結果”的流程了。這個流程太慢,太復雜。
搜索變?yōu)?ldquo; Siri語音識別,智能分析,調用本地Apps或者網(wǎng)絡APIs ,整合所有結果為最合適的內(nèi)容表現(xiàn)給用戶”。
Siri變?yōu)?ldquo;入口”。所有的Apps和網(wǎng)絡服務都在他的后面。
據(jù)說為了讓iPhone 使用Google Maps,Google每年付給蘋果10億美金。相信沒人會懷疑, Siri最終會裝在上億臺iOS設備上。
那時,有多少網(wǎng)絡服務商,要為他的各種服務付出多少?