IBM開(kāi)發(fā)口袋大小沃森電腦 添加語(yǔ)音和圖像識(shí)別
近日消息,IBM的研究人員花費(fèi)了4年時(shí)間來(lái)開(kāi)發(fā)沃森(Watson)超級(jí)電腦,這種電腦系統(tǒng)足夠聰明,以至于擊敗了智力競(jìng)賽節(jié)目Jeopardy的冠軍。現(xiàn)在,他們正嘗試找出將這種能力賦予手機(jī)的方法。
IBM創(chuàng)新副總裁伯尼·邁爾森(Bernie Meyerson)構(gòu)想了一種聲控的沃森電腦系統(tǒng),這種系統(tǒng)能回答各種問(wèn)題,就像是蘋(píng)果Siri個(gè)人語(yǔ)音助理服務(wù)的超級(jí)版。舉例來(lái)說(shuō),一名農(nóng)夫可以站在田地里問(wèn)他的手機(jī)說(shuō):“我應(yīng)該在什么時(shí)候種植玉米?”然后他就會(huì)在幾秒鐘內(nèi)得到一個(gè)答案,而這個(gè)答案將基于他所處的位置數(shù)據(jù)、歷史趨勢(shì)以及科學(xué)研究得出。
為沃森電腦系統(tǒng)找到更多用戶(hù)是IBM一項(xiàng)計(jì)劃的部分內(nèi)容,這項(xiàng)計(jì)劃旨在開(kāi)辟新的市場(chǎng),在2015年以前將IBM來(lái)自于商務(wù)分析業(yè)務(wù)的營(yíng)收提高至160億美元。在通過(guò)智力競(jìng)賽節(jié)目Jeopardy掌握了歷史和流行文化以后,這個(gè)電腦系統(tǒng)正在為花旗集團(tuán)運(yùn)算金融信息,以及為美國(guó)第二大醫(yī)療保險(xiǎn)公司維朋運(yùn)算癌癥相關(guān)數(shù)據(jù)。下一個(gè)版本的沃森電腦將命名為“Watson 2.0”,這種電腦系統(tǒng)將足夠節(jié)能,從而能在智能手機(jī)和平板電腦上運(yùn)行。
“運(yùn)行沃森電腦系統(tǒng)所需要的功率正在象降落中的石頭那樣迅速下降。”邁爾森在接受采訪(fǎng)時(shí)說(shuō)道。“有一天,你將可以迅速獲取一個(gè)令人難以置信的引擎,這個(gè)引擎將擁有一個(gè)覆蓋全球的知識(shí)庫(kù)。”
IBM預(yù)計(jì),通過(guò)將沃森電腦系統(tǒng)引入金融、醫(yī)療保健、電信及其他領(lǐng)域的方式,該公司將可創(chuàng)造數(shù)十億美元的銷(xiāo)售額。有1500萬(wàn)人見(jiàn)證了這種電腦系統(tǒng)擊敗Jeopardy節(jié)目冠軍肯·詹尼斯(Ken Jennings)和布拉德·魯特爾(Brad Rutter)的過(guò)程,而這種電腦系統(tǒng)已經(jīng)成為IBM七年以來(lái)最受人矚目的產(chǎn)品,當(dāng)時(shí)他向聯(lián)想集團(tuán)出售了自己的個(gè)人電腦部門(mén)。
語(yǔ)音識(shí)別
IBM所面臨的挑戰(zhàn)是克服那些阻礙沃森電腦系統(tǒng)變成便攜式產(chǎn)品的技術(shù)障礙,并找出為其定價(jià)和交付這種產(chǎn)品的方法。沃森電腦系統(tǒng)的神經(jīng)中樞是在紐約州約克城高地運(yùn)行的10臺(tái)IBM Power750服務(wù)器,這些服務(wù)器的處理能力相當(dāng)于6000臺(tái)臺(tái)式機(jī)。即使大多數(shù)的計(jì)算指令都是在數(shù)據(jù)中心中發(fā)生的,但沃森電腦應(yīng)用仍將消耗過(guò)大的功率,因此到目前為止還無(wú)法變成便攜式產(chǎn)品。
另一個(gè)障礙則是,沃森電腦系統(tǒng)需要一段時(shí)間來(lái)進(jìn)行必要的“機(jī)器學(xué)習(xí)”,隨后才能成為某個(gè)領(lǐng)域中的可靠助手。IBM在去年9月份宣布了沃森電腦系統(tǒng)與維朋之間的交易,而這個(gè)系統(tǒng)至少要到2013年底才能掌握腫瘤學(xué)領(lǐng)域的知識(shí)。
賦予更多感覺(jué)
此外,IBM的行業(yè)研究副總裁凱薩琳·弗雷斯(Katharine Frase)指出,研究人員還需要在這項(xiàng)服務(wù)中加入語(yǔ)音和圖像識(shí)別功能,才能讓其對(duì)來(lái)自真實(shí)世界的輸入信號(hào)作出回應(yīng)。
“在沃森2.0中,我們希望能賦予它更多的感覺(jué)。”弗雷斯說(shuō)道。“目標(biāo)是能讓一個(gè)人對(duì)他的手機(jī)說(shuō):‘這是我所在的地方,而這是我看到的東西。’然后舉起手機(jī)來(lái),拍下周?chē)h(huán)境的照片。”
IBM通向移動(dòng)助理市場(chǎng)的道路與蘋(píng)果的道路形成了對(duì)比。對(duì)IBM來(lái)說(shuō),這家公司將重點(diǎn)放在企業(yè)客戶(hù)身上;而就蘋(píng)果而言,其目標(biāo)對(duì)象則是購(gòu)買(mǎi)該公司手機(jī)的任何用戶(hù)。
蘋(píng)果將Siri個(gè)人語(yǔ)音助理服務(wù)作為其iPhone 4S手機(jī)的營(yíng)銷(xiāo)重點(diǎn),這款手機(jī)是在去年推出的。這個(gè)軟件被吹捧為能對(duì)各種廣泛的問(wèn)題作出回答的個(gè)人助手,比如說(shuō)“我明天需要帶傘嗎”,然后在日歷中加入提醒信息。
Siri已經(jīng)變成iPhone最典型的特征之一,但這種服務(wù)同時(shí)也招來(lái)了投訴。據(jù)美國(guó)投資銀行派杰(Piper Jaffray & Co.)在今年6月份發(fā)布的一份調(diào)查報(bào)告顯示,Siri只能在不到70%的時(shí)間里正確地解答問(wèn)題。
增強(qiáng)版Siri
蘋(píng)果發(fā)言人特魯?shù)?middot;穆勒(Trudy Muller)對(duì)此表示,用戶(hù)對(duì)Siri功能感到滿(mǎn)意。他還表示,該公司將在下一個(gè)版本的iOS操作系統(tǒng)中對(duì)Siri功能作出進(jìn)一步的改進(jìn)。
“Siri是iPhone 4S最受歡迎的功能之一。”穆勒說(shuō)道。“iOS 6操作系統(tǒng)將在今年秋天發(fā)布,屆時(shí)將推出新的功能,到那時(shí)Siri將可幫助你通過(guò)語(yǔ)音方式完成更多的任務(wù)。”
通過(guò)沃森電腦系統(tǒng),IBM的目標(biāo)是解決更加復(fù)雜的問(wèn)題。IBM的首席醫(yī)療科學(xué)家馬丁·科恩(Martin Koh)表示,這個(gè)系統(tǒng)的程序?qū)⒖勺銐蚝玫乩斫饽[瘤學(xué)的知識(shí),從而可在診斷和處方方面為醫(yī)生提供建議。一個(gè)沃森電腦系統(tǒng)的iPad應(yīng)用——這個(gè)醫(yī)療保健程序是由哥倫比亞大學(xué)的一位教授開(kāi)發(fā)的——正被用于為未來(lái)的IBM客戶(hù)展示其醫(yī)療相關(guān)功能。
隨著技術(shù)的改進(jìn),移動(dòng)版的沃森電腦系統(tǒng)可能會(huì)變成IBM現(xiàn)在已向維朋等企業(yè)客戶(hù)所提供之服務(wù)的延展。IBM此舉符合該公司更加廣泛的戰(zhàn)略,內(nèi)容是促進(jìn)分析軟件的發(fā)展,這種軟件能幫助其企業(yè)客戶(hù)判斷各種問(wèn)題,從嬰兒死亡率到南美洲的洪水都可進(jìn)行分析。昨天,IBM同意以大約13億美元的價(jià)格收購(gòu)美國(guó)人力資源外包公司Kenexa,此舉同樣是這項(xiàng)戰(zhàn)略的部分內(nèi)容。
研究癥狀
在一種可能發(fā)生的情境中,一名病人可以通過(guò)移動(dòng)設(shè)備來(lái)進(jìn)入沃森電腦系統(tǒng),這個(gè)系統(tǒng)將以自然語(yǔ)言來(lái)解釋病人的癥狀。隨后,病人將可獲得有關(guān)可能將會(huì)發(fā)生的事情的多種建議,這些建議將以電腦信任的級(jí)別來(lái)排序??贫鞅硎?,病人和醫(yī)生都可以進(jìn)入這個(gè)系統(tǒng),它將以安全的方式獲取病人的醫(yī)療記錄,并基于懷孕或糖尿病等因素來(lái)對(duì)答案作出調(diào)整。
就目前而言,這些功能正在為醫(yī)療服務(wù)提供商開(kāi)發(fā),而尚未為病人本身開(kāi)發(fā),而且這個(gè)程序仍舊處在測(cè)試階段中。
“未來(lái)我們將會(huì)做到的事情是,你將不再需要任何的中間人。”邁爾森說(shuō)道。
學(xué)習(xí)主題
為了“教會(huì)”沃森電腦系統(tǒng)一個(gè)主題,比如說(shuō)是腫瘤學(xué)等,研究人員需要向其灌輸大量的相關(guān)問(wèn)題的答案。然后,研究人員會(huì)要求其回答類(lèi)似的查詢(xún)請(qǐng)求,而這個(gè)系統(tǒng)將通過(guò)對(duì)文件、網(wǎng)站和書(shū)籍進(jìn)行分析的方式來(lái)作出解答,其處理能力可達(dá)每秒鐘6600萬(wàn)頁(yè)。研究人員會(huì)告訴這個(gè)系統(tǒng)哪些答案是正確的,而在這個(gè)過(guò)程重復(fù)足夠的次數(shù)以后,沃森電腦系統(tǒng)就能培育出足以輔助醫(yī)生的專(zhuān)業(yè)知識(shí)。
“它將向你給出推薦答案,并向你展示相關(guān)的證據(jù)。”弗雷斯說(shuō)道。
科恩表示,與灌輸知識(shí)相比,給沃森電腦系統(tǒng)加入語(yǔ)音識(shí)別及其他功能可能要簡(jiǎn)單一些,原因是IBM已經(jīng)開(kāi)發(fā)了能夠理解圖像和自然語(yǔ)言的工具。舉例來(lái)說(shuō),IBM為美國(guó)軍方開(kāi)發(fā)的一個(gè)項(xiàng)目就能把英語(yǔ)轉(zhuǎn)換為阿拉伯地方方言。
“沃森電腦系統(tǒng)本身不會(huì)解讀圖像,但IBM擁有能解讀圖像和海量信息的技術(shù)。”科恩說(shuō)道。“沃森2.0則會(huì)將所有這些不同的工具聚合在一起運(yùn)行。”
更多計(jì)算機(jī)與外設(shè)信息請(qǐng)關(guān)注:21ic計(jì)算機(jī)與外設(shè)頻道