當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > C語(yǔ)言編程
[導(dǎo)讀]豐色發(fā)自凹非寺來(lái)源:量子位(QbitAI)“代碼拖更”的經(jīng)歷,不知你遇到過(guò)沒(méi)?就是你看上了一篇論文或者項(xiàng)目,作者聲稱(chēng)代碼會(huì)開(kāi)源或者已開(kāi)源,但你左等右等,每天查查GitHub,代碼就是一直沒(méi)發(fā)布……reddit上一位網(wǎng)友就遭遇了這種經(jīng)歷,還是在他三番五次聯(lián)系原作者的情況下。無(wú)奈/一...

豐色 發(fā)自 凹非寺
來(lái)源:量子位(QbitAI)
代碼拖更”的經(jīng)歷,不知你遇到過(guò)沒(méi)?


就是你看上了一篇論文或者項(xiàng)目,作者聲稱(chēng)代碼會(huì)開(kāi)源或者已開(kāi)源,但你左等右等,每天查查GitHub,代碼就是一直沒(méi)發(fā)布……



reddit上一位網(wǎng)友就遭遇了這種經(jīng)歷,還是在他三番五次聯(lián)系原作者的情況下。


無(wú)奈/一怒之下,他就把作者和論文掛網(wǎng)上了。



結(jié)果這一現(xiàn)象引起了網(wǎng)友們熱烈的討論,還把“涉事”作者給“炸”出來(lái)了!


聲稱(chēng)代碼開(kāi)源卻遲遲不更新

據(jù)發(fā)帖網(wǎng)友陳述,“涉事”論文是NeurIPS 2020的一篇有關(guān)自動(dòng)駕駛的論文。


當(dāng)時(shí)他覺(jué)得很有意思,順著文中給出的代碼地址點(diǎn)進(jìn)去,發(fā)現(xiàn)倉(cāng)庫(kù)居然是個(gè)“空殼子”。


“好吧,應(yīng)該是還沒(méi)來(lái)得及更新”,他心想:那就fork一下,過(guò)幾天再來(lái)看。


然而他等啊等啊,代碼一直都沒(méi)有發(fā)布。


他看到有其他人也在評(píng)論區(qū)“催更”,他自己也嘗試電郵聯(lián)系作者們(包括學(xué)生和PI),但都沒(méi)收到回復(fù)。


終于,去年11月份就提交到arXiv的論文,在今年4月更新代碼倉(cāng)庫(kù)了!


——但,更新的只是自述文件,只說(shuō)代碼即將發(fā)布。


然后幾個(gè)月過(guò)去了,那已成了該倉(cāng)庫(kù)最后一次更新。



而這位網(wǎng)友也終于聯(lián)系上了作者,卻得到了這樣的回應(yīng):


論文實(shí)際上是基于經(jīng)驗(yàn)的改進(jìn),沒(méi)有有效代碼來(lái)復(fù)現(xiàn)結(jié)果。


這下這位網(wǎng)友可是真的炸了:“我等了你們這么久,付出了巨大的努力聯(lián)系你們。不發(fā)布就不發(fā)布,一開(kāi)始就別承諾啊,也更不該‘玩失蹤’啊。”


他表示,他知道這種“聲稱(chēng)開(kāi)源卻實(shí)際并未發(fā)布代碼”的事情在機(jī)器學(xué)習(xí)論文中越來(lái)越多。


當(dāng)他實(shí)驗(yàn)室的本科生問(wèn)他“為什么我應(yīng)該如此費(fèi)力地整理代碼并發(fā)布,而別的人早已開(kāi)展下一個(gè)有趣的項(xiàng)目去了”時(shí),他也沒(méi)法兒解釋。


事情不應(yīng)該是這樣


我強(qiáng)烈地認(rèn)為這種事情必須被改變,而且只有我們說(shuō)出來(lái),這種現(xiàn)象才能被改變。


于是,也就有了前文我們看到的這篇論文被掛在網(wǎng)上“社死”的事情。


誰(shuí)之過(guò)?應(yīng)該怎么辦?

看到這個(gè)帖子,許多網(wǎng)友的第一反應(yīng)確實(shí)是:這不新鮮啊。


“CVPR 2019都還有篇論文的代碼現(xiàn)在還沒(méi)發(fā)布。原作者還親口告訴我有代碼且已上線呢……”



不過(guò),這不排除有人是在論文被接收后又偷偷刪除鏈接的……



畢竟,有網(wǎng)友指出,有人不發(fā)就是因?yàn)閾?dān)心自己“透露”的太多,被別人反超成果……



emmmm……


當(dāng)然,更普遍的也可能是自己的代碼遇到問(wèn)題了,不過(guò):


“Paper Bad Code >>>> Paper No Code。”


許多人表示,論文能公開(kāi)代碼還是要公開(kāi),即使有錯(cuò)誤、別人跑不起來(lái),但也盡量發(fā)出來(lái),大家還可以做逆向工程——畢竟總比啥都沒(méi)有強(qiáng)。


而關(guān)于不發(fā)布代碼的原因,這里面還出現(xiàn)了“對(duì)于你來(lái)說(shuō)開(kāi)源代碼可能就是30分鐘的事兒,但有人真的很忙需要耗費(fèi)數(shù)周才能完成,所以你不該責(zé)怪他們”的論調(diào),但顯然他沒(méi)有抓住本次事件真正的問(wèn)題所在:


不能開(kāi)源代碼的情況會(huì)有,可以原諒,但你不應(yīng)該把“代碼已在X發(fā)布”寫(xiě)在論文中。不誠(chéng)實(shí)才是最大的問(wèn)題。



而另一邊,網(wǎng)友也把矛頭指向了評(píng)審。


“我已經(jīng)說(shuō)過(guò)很多次了,會(huì)議/期刊/審稿人應(yīng)該確保論文中提到的代碼是真正發(fā)布了的?!?


許多人一致認(rèn)為先不提有沒(méi)有驗(yàn)證代碼是否能復(fù)現(xiàn),沒(méi)有復(fù)現(xiàn)代碼能過(guò)審就讓人費(fèi)解,所以給復(fù)現(xiàn)代碼掛了個(gè)空倉(cāng)庫(kù)的論文一開(kāi)始就應(yīng)該被拒稿,審稿人應(yīng)該好好把關(guān)。



不過(guò)說(shuō)是這么說(shuō),有人算了算:


ICLR今年收到了大約3400篇提交,每篇論文應(yīng)該有4條評(píng)論,所以總共需要13000 條評(píng)論。而一個(gè)好的評(píng)審總共需要4-5個(gè)小時(shí)在一篇論文上。


這需要耗費(fèi)的時(shí)間不敢想象,但審稿又是“義務(wù)勞動(dòng)”,你“審的好”不會(huì)給你帶來(lái)什么附加收益,對(duì)你找工作、升職加薪什么的也不會(huì)有幫助,所以……


那你可能會(huì)說(shuō),付費(fèi)評(píng)審吧。


但這不且提每小時(shí)約100美元的市場(chǎng)價(jià)格帶來(lái)高得離譜的成本,有的人給錢(qián)他都不一定有那么多時(shí)間呢。



再扯遠(yuǎn)點(diǎn),最不缺的是審稿人,而是真正有水平的審稿人。



所以也就發(fā)生了太多空代碼論文“鉆空子”的情況。


不過(guò),也不是完全沒(méi)有辦法。


有網(wǎng)友支招,面對(duì)那種承諾已有代碼實(shí)際就是沒(méi)有的,可以把它提交到下面這個(gè)網(wǎng)站



會(huì)有人專(zhuān)門(mén)幫你聯(lián)系作者,其審核嚴(yán)格,也會(huì)顯示每篇論文的處理進(jìn)度。



從申請(qǐng)理由中,我們也可以看到,代碼有問(wèn)題的論文也可以提交的。


良心網(wǎng)站。


“涉事”論文作者被“炸”出來(lái)了

令人沒(méi)想到的是,原帖網(wǎng)友私下三番五次聯(lián)系不上“涉事”論文作者,發(fā)了這個(gè)帖子后,倒是一下子把他“炸”出來(lái)了。



他首先道歉,表示自己剛剛進(jìn)入一家公司工作很忙,沒(méi)有及時(shí)跟蹤到這篇論文的郵件。


承諾在最近的NeurIPS之前會(huì)發(fā)布代碼,到時(shí)大家有啥問(wèn)題就可以問(wèn)他了。


還給出了代碼用到的數(shù)據(jù)集來(lái)自哪篇論文以及根代碼庫(kù)的鏈接。


以上,你怎么看?


參考鏈接:
https://www.reddit.com/r/MachineLearning/comments/qrbkc7/d_calling_out_the_authors_of_trajformer_paper_for/


版權(quán)申明:內(nèi)容來(lái)源網(wǎng)絡(luò),版權(quán)歸原創(chuàng)者所有。除非無(wú)法確認(rèn),我們都會(huì)標(biāo)明作者及出處,如有侵權(quán)煩請(qǐng)告知,我們會(huì)立即刪除并表示歉意。謝謝!




本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

實(shí)際上函數(shù)指針本質(zhì)也是一個(gè)指針,只不過(guò)這個(gè)指針指向的不是內(nèi)存中的一段數(shù)據(jù)而是內(nèi)存中的一段代碼

關(guān)鍵字: 指針 數(shù)據(jù) 代碼

(全球TMT2022年10月17日訊)上海安勢(shì)信息技術(shù)有限公司的清源SCA工具在騰訊成功部署。清源?SCA可進(jìn)行代碼片段識(shí)別、文件識(shí)別、組件識(shí)別、依賴識(shí)別和容器鏡像掃描。清源SCA擁有海量數(shù)據(jù)儲(chǔ)備,其中包含24萬(wàn)漏洞數(shù)...

關(guān)鍵字: 騰訊 組件 開(kāi)源 互聯(lián)網(wǎng)

蘇州2022年10月17日 /美通社/ -- 開(kāi)拓藥業(yè)(股票代碼:9939.HK),一家專(zhuān)注于潛在同類(lèi)首創(chuàng)和同類(lèi)最佳創(chuàng)新藥物研發(fā)及產(chǎn)業(yè)化的生物制藥公司,宣布其自主研發(fā)、潛在同類(lèi)首創(chuàng)的福瑞他恩(KX-826)治療痤瘡的中國(guó)...

關(guān)鍵字: ST FDA 代碼 ADI

上海2022年10月14日 /美通社/ -- 近日,上海安勢(shì)信息技術(shù)有限公司的清源SCA工具在騰訊成功部署。 開(kāi)源軟件在促進(jìn)全球的技術(shù)創(chuàng)新方面發(fā)揮著越來(lái)越重要的作用,企業(yè)越來(lái)越依賴開(kāi)源軟件來(lái)加速開(kāi)發(fā)與創(chuàng)新,根據(jù) Gar...

關(guān)鍵字: 開(kāi)源 開(kāi)源軟件 組件 數(shù)據(jù)庫(kù)

10月12日消息,據(jù)開(kāi)放原子開(kāi)源基金會(huì),日前,北京萬(wàn)里紅科技有限公司(簡(jiǎn)稱(chēng)“萬(wàn)里紅”)發(fā)布了針對(duì)行業(yè)定制、搭載T618芯片和OpenAtom OpenHarmony(以下簡(jiǎn)稱(chēng)“Open...

關(guān)鍵字: 平板 開(kāi)源 芯片 鴻蒙

在智能汽車(chē)時(shí)代,保障智能汽車(chē)數(shù)據(jù)安全已成為一項(xiàng)新的重要課題。

關(guān)鍵字: 豐田 代碼 信息安全

北京2022年10月8日 /美通社/ -- 日前,全球領(lǐng)先的IT基礎(chǔ)設(shè)施提供商浪潮信息加入龍蜥社區(qū)并成為理事單位,致力于攜手社區(qū)生態(tài)伙伴,共同推動(dòng)開(kāi)源操作系統(tǒng)的全產(chǎn)業(yè)鏈協(xié)同創(chuàng)新和產(chǎn)業(yè)化應(yīng)用。 龍蜥社區(qū)成立于2020...

關(guān)鍵字: 開(kāi)源 操作系統(tǒng) 通信 大數(shù)據(jù)

(全球TMT2022年10月8日訊)IT基礎(chǔ)設(shè)施提供商浪潮信息加入龍蜥社區(qū)并成為理事單位,致力于攜手社區(qū)生態(tài)伙伴,共同推動(dòng)開(kāi)源操作系統(tǒng)的全產(chǎn)業(yè)鏈協(xié)同創(chuàng)新和產(chǎn)業(yè)化應(yīng)用。 龍蜥社區(qū)成立于2020年9月,是國(guó)內(nèi)...

關(guān)鍵字: 操作系統(tǒng) 開(kāi)源 通信 裝機(jī)量

南京2022年9月16日 /美通社/ -- 說(shuō)到"世界清潔地球日",恐怕很多人都一頭霧水。作為全球最重要的環(huán)境保護(hù)活動(dòng)之一,該節(jié)日"致力于通過(guò)影響人類(lèi)行為模式的改變以應(yīng)對(duì)世界上的垃圾問(wèn)題&q...

關(guān)鍵字: 電熱水器 BSP 溫度 代碼

C語(yǔ)言編程

178 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉