IBM開發(fā)口袋大小沃森電腦 添加語音和圖像識別
近日消息,IBM的研究人員花費了4年時間來開發(fā)沃森(Watson)超級電腦,這種電腦系統(tǒng)足夠聰明,以至于擊敗了智力競賽節(jié)目Jeopardy的冠軍?,F(xiàn)在,他們正嘗試找出將這種能力賦予手機的方法。
IBM創(chuàng)新副總裁伯尼·邁爾森(Bernie Meyerson)構(gòu)想了一種聲控的沃森電腦系統(tǒng),這種系統(tǒng)能回答各種問題,就像是蘋果Siri個人語音助理服務(wù)的超級版。舉例來說,一名農(nóng)夫可以站在田地里問他的手機說:“我應(yīng)該在什么時候種植玉米?”然后他就會在幾秒鐘內(nèi)得到一個答案,而這個答案將基于他所處的位置數(shù)據(jù)、歷史趨勢以及科學(xué)研究得出。
為沃森電腦系統(tǒng)找到更多用戶是IBM一項計劃的部分內(nèi)容,這項計劃旨在開辟新的市場,在2015年以前將IBM來自于商務(wù)分析業(yè)務(wù)的營收提高至160億美元。在通過智力競賽節(jié)目Jeopardy掌握了歷史和流行文化以后,這個電腦系統(tǒng)正在為花旗集團運算金融信息,以及為美國第二大醫(yī)療保險公司維朋運算癌癥相關(guān)數(shù)據(jù)。下一個版本的沃森電腦將命名為“Watson 2.0”,這種電腦系統(tǒng)將足夠節(jié)能,從而能在智能手機和平板電腦上運行。
“運行沃森電腦系統(tǒng)所需要的功率正在象降落中的石頭那樣迅速下降。”邁爾森在接受采訪時說道。“有一天,你將可以迅速獲取一個令人難以置信的引擎,這個引擎將擁有一個覆蓋全球的知識庫。”
IBM預(yù)計,通過將沃森電腦系統(tǒng)引入金融、醫(yī)療保健、電信及其他領(lǐng)域的方式,該公司將可創(chuàng)造數(shù)十億美元的銷售額。有1500萬人見證了這種電腦系統(tǒng)擊敗Jeopardy節(jié)目冠軍肯·詹尼斯(Ken Jennings)和布拉德·魯特爾(Brad Rutter)的過程,而這種電腦系統(tǒng)已經(jīng)成為IBM七年以來最受人矚目的產(chǎn)品,當(dāng)時他向聯(lián)想集團出售了自己的個人電腦部門。
語音識別
IBM所面臨的挑戰(zhàn)是克服那些阻礙沃森電腦系統(tǒng)變成便攜式產(chǎn)品的技術(shù)障礙,并找出為其定價和交付這種產(chǎn)品的方法。沃森電腦系統(tǒng)的神經(jīng)中樞是在紐約州約克城高地運行的10臺IBM Power750服務(wù)器,這些服務(wù)器的處理能力相當(dāng)于6000臺臺式機。即使大多數(shù)的計算指令都是在數(shù)據(jù)中心中發(fā)生的,但沃森電腦應(yīng)用仍將消耗過大的功率,因此到目前為止還無法變成便攜式產(chǎn)品。
另一個障礙則是,沃森電腦系統(tǒng)需要一段時間來進行必要的“機器學(xué)習(xí)”,隨后才能成為某個領(lǐng)域中的可靠助手。IBM在去年9月份宣布了沃森電腦系統(tǒng)與維朋之間的交易,而這個系統(tǒng)至少要到2013年底才能掌握腫瘤學(xué)領(lǐng)域的知識。
賦予更多感覺
此外,IBM的行業(yè)研究副總裁凱薩琳·弗雷斯(Katharine Frase)指出,研究人員還需要在這項服務(wù)中加入語音和圖像識別功能,才能讓其對來自真實世界的輸入信號作出回應(yīng)。
“在沃森2.0中,我們希望能賦予它更多的感覺。”弗雷斯說道。“目標(biāo)是能讓一個人對他的手機說:‘這是我所在的地方,而這是我看到的東西。’然后舉起手機來,拍下周圍環(huán)境的照片。”
IBM通向移動助理市場的道路與蘋果的道路形成了對比。對IBM來說,這家公司將重點放在企業(yè)客戶身上;而就蘋果而言,其目標(biāo)對象則是購買該公司手機的任何用戶。
蘋果將Siri個人語音助理服務(wù)作為其iPhone 4S手機的營銷重點,這款手機是在去年推出的。這個軟件被吹捧為能對各種廣泛的問題作出回答的個人助手,比如說“我明天需要帶傘嗎”,然后在日歷中加入提醒信息。
Siri已經(jīng)變成iPhone最典型的特征之一,但這種服務(wù)同時也招來了投訴。據(jù)美國投資銀行派杰(Piper Jaffray & Co.)在今年6月份發(fā)布的一份調(diào)查報告顯示,Siri只能在不到70%的時間里正確地解答問題。
增強版Siri
蘋果發(fā)言人特魯?shù)?middot;穆勒(Trudy Muller)對此表示,用戶對Siri功能感到滿意。他還表示,該公司將在下一個版本的iOS操作系統(tǒng)中對Siri功能作出進一步的改進。
“Siri是iPhone 4S最受歡迎的功能之一。”穆勒說道。“iOS 6操作系統(tǒng)將在今年秋天發(fā)布,屆時將推出新的功能,到那時Siri將可幫助你通過語音方式完成更多的任務(wù)。”
通過沃森電腦系統(tǒng),IBM的目標(biāo)是解決更加復(fù)雜的問題。IBM的首席醫(yī)療科學(xué)家馬丁·科恩(Martin Koh)表示,這個系統(tǒng)的程序?qū)⒖勺銐蚝玫乩斫饽[瘤學(xué)的知識,從而可在診斷和處方方面為醫(yī)生提供建議。一個沃森電腦系統(tǒng)的iPad應(yīng)用——這個醫(yī)療保健程序是由哥倫比亞大學(xué)的一位教授開發(fā)的——正被用于為未來的IBM客戶展示其醫(yī)療相關(guān)功能。
隨著技術(shù)的改進,移動版的沃森電腦系統(tǒng)可能會變成IBM現(xiàn)在已向維朋等企業(yè)客戶所提供之服務(wù)的延展。IBM此舉符合該公司更加廣泛的戰(zhàn)略,內(nèi)容是促進分析軟件的發(fā)展,這種軟件能幫助其企業(yè)客戶判斷各種問題,從嬰兒死亡率到南美洲的洪水都可進行分析。昨天,IBM同意以大約13億美元的價格收購美國人力資源外包公司Kenexa,此舉同樣是這項戰(zhàn)略的部分內(nèi)容。
研究癥狀
在一種可能發(fā)生的情境中,一名病人可以通過移動設(shè)備來進入沃森電腦系統(tǒng),這個系統(tǒng)將以自然語言來解釋病人的癥狀。隨后,病人將可獲得有關(guān)可能將會發(fā)生的事情的多種建議,這些建議將以電腦信任的級別來排序??贫鞅硎?,病人和醫(yī)生都可以進入這個系統(tǒng),它將以安全的方式獲取病人的醫(yī)療記錄,并基于懷孕或糖尿病等因素來對答案作出調(diào)整。
就目前而言,這些功能正在為醫(yī)療服務(wù)提供商開發(fā),而尚未為病人本身開發(fā),而且這個程序仍舊處在測試階段中。
“未來我們將會做到的事情是,你將不再需要任何的中間人。”邁爾森說道。
學(xué)習(xí)主題
為了“教會”沃森電腦系統(tǒng)一個主題,比如說是腫瘤學(xué)等,研究人員需要向其灌輸大量的相關(guān)問題的答案。然后,研究人員會要求其回答類似的查詢請求,而這個系統(tǒng)將通過對文件、網(wǎng)站和書籍進行分析的方式來作出解答,其處理能力可達每秒鐘6600萬頁。研究人員會告訴這個系統(tǒng)哪些答案是正確的,而在這個過程重復(fù)足夠的次數(shù)以后,沃森電腦系統(tǒng)就能培育出足以輔助醫(yī)生的專業(yè)知識。
“它將向你給出推薦答案,并向你展示相關(guān)的證據(jù)。”弗雷斯說道。
科恩表示,與灌輸知識相比,給沃森電腦系統(tǒng)加入語音識別及其他功能可能要簡單一些,原因是IBM已經(jīng)開發(fā)了能夠理解圖像和自然語言的工具。舉例來說,IBM為美國軍方開發(fā)的一個項目就能把英語轉(zhuǎn)換為阿拉伯地方方言。
“沃森電腦系統(tǒng)本身不會解讀圖像,但IBM擁有能解讀圖像和海量信息的技術(shù)。”科恩說道。“沃森2.0則會將所有這些不同的工具聚合在一起運行。”
更多計算機與外設(shè)信息請關(guān)注:21ic計算機與外設(shè)頻道