針對(duì)高科技領(lǐng)域的語(yǔ)義搜索--超越Google的搜索引擎?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
“我們認(rèn)為基于關(guān)鍵詞的搜索需要改進(jìn),這也是我們發(fā)布illumin8的一個(gè)原因,我們需要找出信息的含義,”Elsevier公司illumin8的產(chǎn)品經(jīng)理Joe Buzzanga表示,“這真的是個(gè)基于自然語(yǔ)言處理技術(shù)的研究和開(kāi)發(fā)的工具,我們已經(jīng)為我們的核心用戶提供服務(wù),他們都是各個(gè)企業(yè)里的研發(fā)專業(yè)人士?!?/FONT>
新的搜索引擎不是免費(fèi)的,但已經(jīng)在網(wǎng)頁(yè)上運(yùn)作了,允許用戶執(zhí)行他們之前在Google、Yahoo或其他關(guān)鍵詞搜索引擎上所做的類似的查詢。不同的是當(dāng)你點(diǎn)“搜索”按鈕,不是立即出現(xiàn)搜出的相關(guān)度排名列表,illumin8會(huì)花幾秒鐘與它的語(yǔ)義數(shù)據(jù)庫(kù)進(jìn)行對(duì)比來(lái)決定你的查詢的含義。Elsevier的crawler算法是經(jīng)常的搜索60億個(gè)頁(yè)面、3百萬(wàn)篇科學(xué)和技術(shù)期刊文章、3千3百萬(wàn)科學(xué)報(bào)告的結(jié)果,和2千1百萬(wàn)個(gè)專利,這些結(jié)果被翻譯到11億個(gè)相關(guān)概念的語(yǔ)義解釋上。
在完成對(duì)你的相關(guān)查詢的語(yǔ)義抽取后,立即可以在整個(gè)視窗屏幕顯示出分欄的搜索結(jié)果,分類是根據(jù)組織、方法、益處、作者/發(fā)明者、公司和產(chǎn)品。每欄都有一系列搜索的信息,顯示每個(gè)不同的項(xiàng)目的所有搜索結(jié)果。
將鼠標(biāo)移到相關(guān)條目上會(huì)彈出一個(gè)窗口顯示摘要,指出相關(guān)性并分類,還會(huì)拼出縮寫詞和別稱。點(diǎn)擊該條目就可以新出一個(gè)窗口轉(zhuǎn)到搜索的結(jié)果。
搜索需要花費(fèi)15秒鐘來(lái)鎖定語(yǔ)義數(shù)據(jù)庫(kù)中的結(jié)果,而且需要近1分鐘(取決于你得到信息的數(shù)量)來(lái)在概要頁(yè)中進(jìn)行組織。Elsevier表示目前正在為提高速度進(jìn)行升級(jí)的工作,概要頁(yè)面可以被約束為只顯示網(wǎng)頁(yè)條目、只顯示期刊條目或?qū)@麠l目,或自定義。例如,輸入“半導(dǎo)體研發(fā)”,在概要頁(yè)會(huì)出現(xiàn)5284個(gè)結(jié)果,包括公司、方法、人物、產(chǎn)品和其他相關(guān)結(jié)果 - 3869個(gè)項(xiàng)目是來(lái)自網(wǎng)頁(yè)的。該查詢出來(lái)的“公司”是由升序排列,包括了IBM、INTEL、英飛凌、意法半導(dǎo)體、三星、摩托羅拉、AMD、Toshiba、德州儀器等等。
使用illumin8需要注冊(cè),對(duì)各個(gè)組織的價(jià)格不同。目前已經(jīng)有免費(fèi)的語(yǔ)義搜索供讀者嘗試,雖然不提供概要頁(yè)面,數(shù)據(jù)庫(kù)也沒(méi)有illumin8那么大。大家可以試試Hakia(http://www.hakia.com/,只搜索網(wǎng)頁(yè))或者Powerset(http://www.powerset.com/只搜索Wikipedia)。