大資料文摘授權轉載自AI科技評論作者:杏花、王曄編輯:青暮最近,越來越多關於論文抄襲的訊息被爆出來,ICLR 2022 也成了「在逃之魚」。網友:第二頁都是空白的!這是又發生了啥?ICLR,全
2021-11-05 00:16:24
大資料文摘授權轉載自AI科技評論
作者:杏花、王曄
編輯:青暮
最近,越來越多關於論文抄襲的訊息被爆出來,ICLR 2022 也成了「在逃之魚」。
網友:第二頁都是空白的!
這是又發生了啥?
ICLR,全稱 International Conference on Learning Representations(國際學習表徵會議),2013 年由位列深度學習三巨頭之二的 Yoshua Bengio 和 Yann LeCun 牽頭創辦。
眾所周知,Yoshua Bengio 是蒙特利爾大學教授,深度學習三巨頭之一,他領導蒙特利爾大學的人工智慧實驗室(MILA)進行 AI 技術的學術研究。MILA 是世界上最大的人工智慧研究中心之一,與谷歌也有著密切的合作。
而 Yann LeCun 就自不用提,同為深度學習三巨頭之一的他現任 Facebook 人工智慧研究院(FAIR)院長、紐約大學教授。作為卷積神經網路之父,他為深度學習的發展和創新作出了重要貢獻。
因此,這個一年一度的會議雖成立時間不長,但已獲得學術界廣泛認可,被認為是深度學習的頂級會議。然而,如此權威的學術會議上竟出現論文抄襲現象,ICLR 2022 出現抄襲論文在 reddit 引起網友熱議。僅針對此事,AI科技評論帶大家吃一波瓜。
事件回顧:
這篇被 ICLR 2022 認為抄襲的論文提出了 Text-Gen,一種新的對抗性文字生成技術。論文的研究人員發現,Text-Gen 在給定輸入文字的情況下,可以快速有效地生成對抗性文字。
論文地址:
https://openreview.net/pdf?id=EO4VJGAllb
例如,為了攻擊情感分類模型,Text-Gen 可以使用產品類別作為不應改變評論情感的屬性。研究人員在真實世界的 NLP 資料集上進行了實驗,從而證明與許多現有的對抗性文字生成方法相比,Text-Gen 可以生成更有意義和多樣化的對抗性文字。然後,論文的作者們還進一步使用生成的對抗性示例通過對抗性訓練來改進模型,並且證明了生成的攻擊對於模型重新訓練和不同的模型架構更加穩健。
匆匆一瞥,這貌似是一篇站在「巨人肩膀上」的又一推陳出新之作,且截止被發現抄襲前,這篇論文已經通過雙盲評審(double-blind review)。那麼,這篇論文為何會被認為抄襲呢?
從 ICLR 2022 給出的官方聲明中,我們發現,這篇論文被認為抄襲,屬實不冤。那它究竟觸犯了哪些大忌,讓創作者們的心血自此付之一炬?
首先,該論文的多處「採用」其實是直接複製/貼上自其它論文,但作者卻表明這是「引用」。例如,論文的圖 1,包括標題,就完全複製/貼上自另一篇論文 CAT-Gen: Improving Robustness in NLP Models via Controlled Adversarial Text Generation. Wang et al. EMNLP 2020.。
其次,該論文有兩處直接截圖自其他論文,但作者沒有註明來源。比如,文中的演算法 1 來自論文 FreeLB: Enhanced Adversarial Training for Natural Language Understanding. Zhu et al. ICLR 2020.
最後,也許作者在抄襲的過程中良心發現,對參考文獻做了一些修改,但卻遭到 ICLR 2022 工作人員的無情吐槽:改了還不如不改。例如,這篇論文表 3 的一些修改就沒有原文的好。
此番看來,這篇抄襲論文可謂罪行累累且證據充足。目前,這篇論文已退回至原作者手中。
reddit上關於此事的議論,大概是這幾種聲音:論文質量太差漏洞百出;害,這種事情見多了;這位作者難道在反向測試,看有沒有評審會發現論文抄襲了?
帖子地址:
https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/
有的網友對這種行為感到很迷惑:非常奇怪,也許作者根本不是ML研究人員,他們看起來像研究資料庫安全方面的。
還有網友指出論文粗製濫造,都沒有刻意想要隱瞞抄襲這件事情。
於是就有網友猜測,難道是為了釣魚可以在部落格寫一篇文章——我在ML頂會投了一篇滿是廢話的論文,而同行評審沒有發現!
不僅論文字身漏洞百出、疑點重重,還有網友表示馬上要釋出評審卻撤回了,這很奇怪。
這位網友還提出了自己的疑問:不太瞭解ICLR的評審過程:難不成論文在評審釋出前被撤回,就不釋出評審/評論?還是如果論文進入評審階段,無論如何都會發布評審?
另一波網友對論文抄襲事件已經見怪不怪了。他們認為ML和DL頂會論文被曝抄襲事件已經很多次了,不是沒有人發現,只是管控不到位,讓抄襲的人越來越放肆,漏洞百出公然挑釁評審。
一位網友表示,如果作者認為沒有人會注意到這篇論文低質量和抄襲痕跡,那就真的是妄想了!
對於此事,手機前的你怎麼看,歡迎加入前排吃瓜大隊~
相關文章
大資料文摘授權轉載自AI科技評論作者:杏花、王曄編輯:青暮最近,越來越多關於論文抄襲的訊息被爆出來,ICLR 2022 也成了「在逃之魚」。網友:第二頁都是空白的!這是又發生了啥?ICLR,全
2021-11-05 00:16:24
本章給大家演示一下在實際工作中如何結合 Pandas 庫和 openpyxl 庫來自動化生成報表。假設我們現在有如圖 1 所示的資料集。(圖1)現在需要根據這份資料集來製作每天的日報情況
2021-11-05 00:15:52
格局穩固的車載地圖市場,來了一個新玩家。剛剛,就在今年的數字生態大會上,騰訊釋出了最新的車載導航產品騰訊智駕地圖。不尋常是「智駕」二字,有意瞄準汽車智慧化變革,尤其是核心
2021-11-05 00:13:53
出品|開源中國作者|局長此前將 Linux 移植到搭載 Apple M1 的裝置的 Asahi Linux 項目最近有了新進展——項目團隊已經實現讓去年編寫的 Linux 補丁以及部分小改動在最新款
2021-11-05 00:13:22
所謂「1075工作制」即早上十點上班,晚上7點下班,每週工作5天。如果有員工需要加班,則要提交申請,最低可申請0.5小時加班。多位位元組跳動員工在社交平臺中確認此事屬實,位元組跳
2021-11-05 00:12:55
今天分享測試新人在職第一天。參與入職流程可以間接的感受公司管理體系和文化。初到公司,籤合同領電腦,加郵件組,剩下的就是加群、加群、還是加群。進一步瞭解公司福利,合理規劃
2021-11-05 00:12:45