當(dāng)前位置:首頁(yè) > 通信技術(shù) > 通信網(wǎng)絡(luò)
[導(dǎo)讀] 最近一個(gè)有意思的現(xiàn)象,是機(jī)器閱讀理解突然開(kāi)始熱絡(luò)了起來(lái)。下面就隨網(wǎng)絡(luò)通信小編一起來(lái)了解一下相關(guān)內(nèi)容吧。 2月21日,百度自然語(yǔ)言處理團(tuán)隊(duì)研發(fā)的V-Net模型以46.15的Rouge-L得

最近一個(gè)有意思的現(xiàn)象,是機(jī)器閱讀理解突然開(kāi)始熱絡(luò)了起來(lái)。下面就隨網(wǎng)絡(luò)通信小編一起來(lái)了解一下相關(guān)內(nèi)容吧。

2月21日,百度自然語(yǔ)言處理團(tuán)隊(duì)研發(fā)的V-Net模型以46.15的Rouge-L得分登上微軟的MS MARCO(Microsoft MAchine Reading COmprehension)機(jī)器閱讀理解測(cè)試排行榜首。

讀題還是讀你?剝開(kāi)機(jī)器閱讀理解的神秘外衣

加上此前斯坦福大學(xué)的SQuAD競(jìng)賽中,阿里、哈工大訊飛聯(lián)合實(shí)驗(yàn)室等團(tuán)隊(duì)先后超越了人類(lèi)平均水平。這意味著,機(jī)器閱讀理解領(lǐng)域的兩大頂級(jí)賽事:MS MARCO和SQuAD的記錄先后由中國(guó)團(tuán)隊(duì)打破。

但在熱鬧的“軍備競(jìng)賽”之余,機(jī)器閱讀理解領(lǐng)域的深處并非一團(tuán)和氣。各種爭(zhēng)議和辯論正在這場(chǎng)“機(jī)器答題大秀”背后上演。

比如說(shuō),為什么微軟要緊隨SQuAD之后另起爐灶,發(fā)布自己的數(shù)據(jù)集和競(jìng)賽?學(xué)術(shù)界關(guān)于機(jī)器閱讀理解的爭(zhēng)議為何一直不斷?

這些疑問(wèn)或許可以最終歸因到一個(gè)問(wèn)題:讓AI做閱讀理解,到底有什么用?

我們來(lái)聊聊“閱讀理解圈”的江湖恩怨,以及接下來(lái)可預(yù)見(jiàn)的技術(shù)應(yīng)用未來(lái)。

兩大數(shù)據(jù)集對(duì)峙:機(jī)器閱讀理解的問(wèn)題與爭(zhēng)議

所謂的機(jī)器閱讀理解,基本概念跟咱們上學(xué)時(shí)做的閱讀理解題很相似,同樣都是給出一段材料和問(wèn)題,讓“考生”給出正確答案。所不同的,僅僅是機(jī)器閱讀理解的主角變成了AI模型而已。

而機(jī)器閱讀理解領(lǐng)域的比賽方式,就像斯坦福大學(xué)著名的AI競(jìng)賽ImageNet一樣,都是由一個(gè)官方給定的數(shù)據(jù)集+一場(chǎng)跑分競(jìng)賽組成。各大科技巨頭和世界名校的AI研究團(tuán)隊(duì)是主要參賽選手。

百度此次參與的機(jī)器閱讀理解比賽,是微軟在2016年末發(fā)布的MS MARCO。

這個(gè)賽事有趣的地方在于,其運(yùn)用的訓(xùn)練數(shù)據(jù)是微軟在產(chǎn)品實(shí)踐中,從真實(shí)用戶(hù)那里收集來(lái)的問(wèn)題和答案。

這個(gè)數(shù)據(jù)集的問(wèn)題全部來(lái)自于BING的搜索日志,然后又整理了這些問(wèn)題獲得的人工答案作為訓(xùn)練數(shù)據(jù)。這樣做的優(yōu)點(diǎn)在于,可以讓AI模型通過(guò)最接近真實(shí)應(yīng)用的語(yǔ)境來(lái)進(jìn)行學(xué)習(xí)、訓(xùn)練和反向?qū)嵺`,完成“學(xué)以致用”的小目標(biāo)。

圈內(nèi)普遍認(rèn)為,微軟這么不容易地搜集一個(gè)源自真實(shí)網(wǎng)絡(luò)的數(shù)據(jù)集,就是希望硬懟斯坦福大學(xué)的SQuAD。

2016年早些時(shí)候,斯坦福大學(xué)相關(guān)團(tuán)隊(duì)制作了一個(gè)用來(lái)測(cè)試AI模型閱讀理解能力的數(shù)據(jù)集。與MS MARCO不同,SQuAD主要訓(xùn)練數(shù)據(jù)是來(lái)自維基百科的536篇文章,以及由人類(lèi)閱讀這些文章后,提出的10萬(wàn)多個(gè)問(wèn)題及相關(guān)答案。

這種非常像校園考試的數(shù)據(jù)設(shè)定,從誕生之日起就爭(zhēng)議不斷。比如NLP領(lǐng)域的大牛Yoav Goldberg就認(rèn)為這個(gè)數(shù)據(jù)集有些太過(guò)片面。SQuAD受到指責(zé)的地方,主要可以分為三個(gè)層面:

1、問(wèn)題過(guò)分簡(jiǎn)單。問(wèn)題的答案主要源自于文檔中的一個(gè)片段,真實(shí)應(yīng)用場(chǎng)景中很少遇到這樣的問(wèn)題。

2、數(shù)據(jù)多樣性不足。SQuAD只有500多篇文章,內(nèi)容不夠豐富,訓(xùn)練出的模型被質(zhì)疑難以處理其他數(shù)據(jù)或者更復(fù)雜的問(wèn)題。

3、通用性不強(qiáng)。為了跑分的方便,SQuAD的問(wèn)題結(jié)構(gòu)比較簡(jiǎn)單,涉及到的機(jī)器“推理”一面偏弱,導(dǎo)致其實(shí)用性數(shù)次受到懷疑。

舉個(gè)簡(jiǎn)單的例子來(lái)描述一下兩個(gè)數(shù)據(jù)集之間的不同:SQuAD大多數(shù)問(wèn)題的答案來(lái)自文檔本身,從文檔中“復(fù)制粘貼”就能完成回答,這樣模式固然更加方便,但客觀上對(duì)問(wèn)題類(lèi)型和答案范圍都做了限制,建立在SQuAD上的問(wèn)題通常更加直白簡(jiǎn)單。而MS MARCO的問(wèn)題則更傾向真實(shí)的語(yǔ)言環(huán)境,需要智能體推理語(yǔ)境進(jìn)行分析。

蘿卜白菜各有所愛(ài),有人認(rèn)為SQuAD是最方便測(cè)試的機(jī)器閱讀理解比賽,也有人堅(jiān)持MS MARCO是最接近人類(lèi)問(wèn)答習(xí)慣的競(jìng)賽。但爭(zhēng)論的背后或許有一個(gè)共識(shí)正在浮現(xiàn):機(jī)器閱讀理解的應(yīng)用性,已經(jīng)開(kāi)始受到產(chǎn)業(yè)的廣泛關(guān)注。

進(jìn)擊的數(shù)據(jù)集:AI閱讀也要重視“素質(zhì)教育”

當(dāng)然,MS MARCO的數(shù)據(jù)集結(jié)構(gòu)同樣也有很多爭(zhēng)議。但相類(lèi)似的“從生活中來(lái)”的機(jī)器閱讀理解訓(xùn)練數(shù)據(jù)集正在越來(lái)越多。一句話(huà)總結(jié)這種趨勢(shì),大概就是大家發(fā)現(xiàn),該讓AI從“應(yīng)試教育”變成“素質(zhì)教育”了。

結(jié)構(gòu)緊湊、體系清晰的SQuAD,雖然可以非常便捷地展現(xiàn)出AI模型的測(cè)試結(jié)果,但拓展性和實(shí)用性始終受到指責(zé)。許多學(xué)者認(rèn)為,這個(gè)數(shù)據(jù)集有些被過(guò)分“考試化”了,導(dǎo)致其最終變成為了競(jìng)賽而競(jìng)賽。

而直接從互聯(lián)網(wǎng)文本與產(chǎn)品實(shí)踐問(wèn)題中訓(xùn)練出的模型,被認(rèn)為距離應(yīng)用性更近。

其實(shí)仔細(xì)想想,機(jī)器閱讀理解這項(xiàng)技術(shù),從來(lái)都不是紙上談兵的“象牙塔派”,在我們已經(jīng)熟悉的互聯(lián)網(wǎng)應(yīng)用中,就有大量只能依靠機(jī)器閱讀理解來(lái)解決的難題。

舉個(gè)例子,當(dāng)用戶(hù)在搜索引擎尋找答案的時(shí)候,傳統(tǒng)方案只能依靠用戶(hù)互助來(lái)回答,正確性和效率都嚴(yán)重不足。但智能體進(jìn)行回答,就不能只依靠關(guān)鍵詞填空來(lái)處理。比如絕不會(huì)有用戶(hù)提問(wèn)“()是我國(guó)最長(zhǎng)的河流?”;更多情況用戶(hù)會(huì)詢(xún)問(wèn)復(fù)雜的問(wèn)題,需要完整的解決方案和建議。那么,從真實(shí)提問(wèn)數(shù)據(jù)中學(xué)習(xí)理解材料、回答問(wèn)題的方案,近乎于AI技術(shù)滿(mǎn)足搜索引擎體驗(yàn)升級(jí)的唯一出路。

再比如最近爭(zhēng)議不斷的內(nèi)容推薦領(lǐng)域。今日頭條最近反復(fù)出狀況,很大程度來(lái)源于輿論指責(zé)其過(guò)度依賴(lài)關(guān)鍵詞進(jìn)行算法推薦,忽略了用戶(hù)的對(duì)文章深度與知識(shí)性的需求。造成這種情況的原因之一,就在于算法的機(jī)器閱讀理解能力不夠,無(wú)法閱讀真實(shí)的互聯(lián)網(wǎng)材料,給出個(gè)性化的推薦結(jié)果。

除此之外,語(yǔ)音助手、智能客服等領(lǐng)域,都大量依靠于機(jī)器閱讀理解閱讀真實(shí)問(wèn)題、真實(shí)互聯(lián)網(wǎng)材料,給出完整答案的AI能力。從真實(shí)數(shù)據(jù)中訓(xùn)練AI,可能是破解這些難題的唯一途徑。

中文、通識(shí)、應(yīng)用:可預(yù)見(jiàn)的MRC未來(lái)

在我們猜想機(jī)器閱讀理解的未來(lái)時(shí),會(huì)看到幾個(gè)比較明顯的趨勢(shì)。

首當(dāng)其沖,目前機(jī)器閱讀理解的訓(xùn)練數(shù)據(jù)集和競(jìng)賽,大部分集中在英文領(lǐng)域。這個(gè)尷尬正在一步步被打破。

比如百度在去年發(fā)布了與微軟MS MARCO結(jié)構(gòu)類(lèi)似全中文數(shù)據(jù)集DuReader。其首批發(fā)布的數(shù)據(jù)集包含20萬(wàn)真實(shí)問(wèn)題,100萬(wàn)互聯(lián)網(wǎng)真實(shí)文檔,以及42萬(wàn)人工撰寫(xiě)生成的答案。由此可見(jiàn),在中國(guó)團(tuán)隊(duì)一次次挑戰(zhàn)英文機(jī)器閱讀理解記錄的同時(shí),直接作用于中文世界的機(jī)器閱讀理解應(yīng)該已經(jīng)不遠(yuǎn)了。

另一方面,機(jī)器閱讀理解的技術(shù)能力如何通用化、泛在化,與各種其他NLP技術(shù)體系相擬合,似乎成為了廣為關(guān)注的話(huà)題。讓機(jī)器能“理解”的同時(shí),還能歸納、能思考、能創(chuàng)作,勾勒出完整的Deep NLP時(shí)代,也已經(jīng)提上了日程。

再者,將機(jī)器閱讀理解能力投入搜索、問(wèn)答等應(yīng)用領(lǐng)域,產(chǎn)生現(xiàn)實(shí)價(jià)值的應(yīng)用案例正在增多。相信不久的未來(lái),機(jī)器閱讀理解工具化、集成化,可以滲透到各行各業(yè)當(dāng)中,成為一種信息世界的主流解決方案。

比較大概率的狀況,大概是不久的將來(lái),我們會(huì)在信息流中感受到了種難以具體形容卻又真實(shí)存在的體驗(yàn)提升。那就是因?yàn)闄C(jī)器正在“讀你”,而不是“讀題”。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉