不久前,蘋果公司宣布為新一代 iPhone(iPhone4S)啟用一項新的語音識別系統(tǒng) :Siri。Siri 的到來很可能標(biāo)志著人工智能已經(jīng)走進我們的生活。
說到與機器語音互動,用過 Android 的朋友都可能會認為,這個功能并不新鮮,甚至很多年前不能算智能手機的諾基亞也有對應(yīng)的技術(shù),而蘋果最多算是后發(fā)制人,并不新鮮。如果僅僅是出于對 Siri 技術(shù)的第一印象,有這個判斷可能無可厚非。但如果真正接觸過,我想很多人會徹底改變類似的看法——Siri 可能是近些年來移動平臺上誕生的最偉大的技術(shù),它標(biāo)志著人機對話的未來。
我們應(yīng)該從 Siri 的血統(tǒng)說起。Siri 的起源實際是歷史上最大的人工智能項目——美國五角大樓的 CALO項 目。CALO(Cognitive Assistant that Learns andOrganizes,會學(xué)習(xí)和組織的認知助理)匯聚了全球人工智能方面的頂尖科研人員和他們的研究成果,它本身具有著跨時代的意義。整個 CALO 計劃的帶頭人名叫Adam Cheyer,而他現(xiàn)在也是蘋果 iPhone 團隊的工程總監(jiān)。
在接受媒體采訪時,Cheyer 表示,CALO 早已開始探索如何把對話、自然語言理解、視覺、演說、機器學(xué)習(xí)、制定計劃、理性思考、服務(wù)代表全部融合到一個模仿人類的助理中,幫助人們更簡單地完成不同的事情。
Sir 并非語音識別那么簡單。
以往,在傳統(tǒng)手機上就早已集成了語音識別技術(shù),比如可以用語音撥號等,類似功能一般用戶都非常清楚,但這與我們所要強調(diào)的“智能”則沒有任何關(guān)系。而Android 系統(tǒng)的 Voice Actions 和 Nokia 的 Vilingo 也算得上有趣的技術(shù),并已經(jīng)被許多手機用戶所熟知和使用。但實際上,他們和 Siri 依然不是同一個層面的產(chǎn)品。
Voice Actions 等軟件提供了非??煽康穆曇糇R別引擎,它的高識別度把曾經(jīng)一度流行的語音識別工具都比了下去。不過,和過去的所有語音命令系統(tǒng)一樣,它要求你說的話嚴(yán)格符合一系列特定的語法,否則它就無法理解。
Siri 和以前公眾使用過的所有產(chǎn)品都不相同。你說的話可以和你想表達的意思在字面上毫不相干,從嚴(yán)格的技術(shù)上看,可能是文不對題,但 Siri 會根據(jù)上下文、相關(guān)歷史以及能夠理解一般人類語言的人工智能去分析,通過與云計算網(wǎng)絡(luò)的對接,在多數(shù)情況下領(lǐng)會你的意思,
并作出響應(yīng)。
具體來說,你想小睡一會,并準(zhǔn)備上個鬧鐘,只需要說“20分鐘后叫醒我”。如果你想查閱后面的日程安排,你可以說:“我今天接下來都有什么事要做?”這些語句中既不包括會用到的應(yīng)用程序名稱,也不包括所需數(shù)據(jù)的名稱。Siri 仍然能夠在理解語義的基礎(chǔ)上,調(diào)用相關(guān)程序完成任務(wù)響應(yīng),而且十分方便、智能。
當(dāng)然,這些語句對人類而言,再平常不過,但要讓機器去理解這些變化多端的詞匯和語法,恐怕是個艱巨的工程,事實上,人機交互發(fā)展這么多年,Siri 是目前唯一一款能夠在民用領(lǐng)域大幅度應(yīng)用的產(chǎn)品。而 Siri 最具人性化的特點是,一旦你開始和 Siri 進入一段對話,它甚至能理解許多含義模糊或者引申的語義。比如,你可以問它:“步行范圍內(nèi)有沒有什么頂尖的意大利餐館?”如果 Siri 查詢后回答“沒有”的話,你可以說 :“那墨西哥的呢?”Siri 會將你的這個問題連同上文的“頂尖的餐館”和“步行范圍”一道進行理解。顯然一般的聲控軟件或聲音識別系統(tǒng)做不到這樣的事情。
Siri 有時會為你顯示網(wǎng)頁搜索的結(jié)果,有時能替你執(zhí)行一些操作,有時能夠直接控制 iPhone 里的應(yīng)用程序。而且除此以外,Siri 同樣能夠用語言回答問題。這歸功于它整合的Wolfram - Alpha。你可以隨機提問:“30英里是多少公里?”,“巴黎現(xiàn)在幾點?”,“鋼琴上有多少個八度?”,或者“天空為何是藍色的?”,Siri 能夠直接回答這些問題而不是顯示網(wǎng)頁搜索結(jié)果,而且是直觀的語音答案。
從歷史和文明推進的角度來看,關(guān)于 Siri,最偉大的事情并非人工智能本身,而是蘋果通過 Siri 把人工智能帶進了現(xiàn)實生活中。科技最美妙的不是科技本身有多么瑰麗,而是能為我們解決什么問題。而這正是蘋果此次發(fā)布 Siri 之后廣受贊譽的理由:他們將 Siri 做成了 iPhone 的一個核心組成部分,并且讓或者說有能力讓這款手機走入人群主流,讓每個用戶都覺得除了使用很方便之外,更想時時刻刻都嘗試使用它。很顯然,iPhone 4S 的熱銷已經(jīng)向我們證明了,Siri 會成為主流,人們會逐漸熟知它,甚至包括非 iPhone 用戶。
想象一下,如果 Siri 和物聯(lián)網(wǎng)技術(shù)能夠充分的結(jié)合,傳感器的信息,云計算的數(shù)據(jù)處理能力,再加上無處不在的寬帶網(wǎng)絡(luò),這將是一個多么振奮人心的時代?
或許你已經(jīng)拿到了最新上市的蘋果手機,或許你已經(jīng)開始了與 Siri 的對話和交流,或許它在幫助你的同時,也讓你產(chǎn)生了一大堆的牢騷。沒有關(guān)系,Siri 只是大眾進入真正的人工智能時代的開端,隨著云技術(shù)的不斷發(fā)展,以及 Siri 軟件的不斷進步,我相信,類似的智能助手類軟件會逐步完善,并配合其他高新技術(shù)共同改變這個時代。
Siri十大功用
1. Siri 變身鬧鐘。這應(yīng)該是用戶最容易想到的 Siri 的“正經(jīng)”用法了。按住“Home”鍵,告訴 Siri,“早上 7點 15 的時候叫醒我”; 想打會兒小盹,就說“40 分鐘后叫醒我”。
2. 用 Siri 尋找咖啡廳。出門在外的時候,想找個咖啡廳 ?告訴 Siri,尋找離當(dāng)前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri 將反饋給還算不錯的答案,很可能是告訴你最近的星巴克在哪。
3. 想去哪,Siri 告訴你。查找出行路線的過程中往往要輸入不少文字。想省事的話,報上要去的地點,Siri 會調(diào)用Google 地圖來尋找出行路線的方案。
4. 用 Siri 播放隨機音樂。如果你厭倦了固定順序的音樂播放列表,可以試著用 Siri 播放隨機音樂。
5. 發(fā)送短信,Siri 代勞。還在邊走路邊發(fā)短信?行路不安全不說,發(fā)短信還費勁,以后用 Siri 代勞吧。走路的時候,將 iPhone 放在耳邊,告訴 Siri 你想表達的內(nèi)容,即可輕輕松松地發(fā)送短信。
6. 天氣預(yù)報,Siri知道。這也是Siri十分擅長的一項功能。關(guān)于氣象信息的問題,Siri 都能正確理解。
7. 用 Siri 提醒日程安排。既然能把 Siri當(dāng)鬧鐘用,你當(dāng)然可以用它來提醒日程安排。比如說,“十點鐘的時候,提醒我去開會”。
8. 用 Siri 提醒地點。Siri 提醒地點的功能目前還不是很完善。除了“家”或“上班處”,Siri 對于一些位置稱呼的理解能力不佳。但是 Siri 對“這里”的理解十分準(zhǔn)確。所以當(dāng)你途徑一家不錯的小店時,可以將它的位置標(biāo)記為“這里”并設(shè)置好提醒,以便日后有時間時再次光顧。
9. Siri 為你答疑解惑。珠穆朗瑪峰現(xiàn)在多高 ?美國去年的 GDP 是多少 ? 回答不上來的話,無需 Google,張嘴問問Siri 吧。Siri 會從“知識問答引擎”中尋找答案。所有的回答都會以自然語言的形式呈現(xiàn)。這也是Siri 被認為將對 Google重要威脅的原因。
10. 用 Siri 發(fā)推。如果你是Twitter 重度用戶,怎么能錯過這個用法呢 ? 不過在使用 Siri 發(fā)推前,還得做一些必要的設(shè)置。