ICLR 2022出現抄襲論文｜reddit 網友熱議：迷惑行為？

2021-11-05 00:16:24

大資料文摘授權轉載自AI科技評論

作者：杏花、王曄

編輯：青暮

最近，越來越多關於論文抄襲的訊息被爆出來，ICLR 2022 也成了「在逃之魚」。

網友：第二頁都是空白的！

這是又發生了啥？

ICLR，全稱 International Conference on Learning Representations（國際學習表徵會議），2013 年由位列深度學習三巨頭之二的 Yoshua Bengio 和 Yann LeCun 牽頭創辦。

眾所周知，Yoshua Bengio 是蒙特利爾大學教授，深度學習三巨頭之一，他領導蒙特利爾大學的人工智慧實驗室（MILA）進行 AI 技術的學術研究。MILA 是世界上最大的人工智慧研究中心之一，與谷歌也有著密切的合作。

而 Yann LeCun 就自不用提，同為深度學習三巨頭之一的他現任 Facebook 人工智慧研究院（FAIR）院長、紐約大學教授。作為卷積神經網路之父，他為深度學習的發展和創新作出了重要貢獻。

因此，這個一年一度的會議雖成立時間不長，但已獲得學術界廣泛認可，被認為是深度學習的頂級會議。然而，如此權威的學術會議上竟出現論文抄襲現象，ICLR 2022 出現抄襲論文在 reddit 引起網友熱議。僅針對此事，AI科技評論帶大家吃一波瓜。

事件回顧：

https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/

這篇文論講了什麼？

這篇被 ICLR 2022 認為抄襲的論文提出了 Text-Gen，一種新的對抗性文字生成技術。論文的研究人員發現，Text-Gen 在給定輸入文字的情況下，可以快速有效地生成對抗性文字。

論文地址：

https://openreview.net/pdf?id=EO4VJGAllb

例如，為了攻擊情感分類模型，Text-Gen 可以使用產品類別作為不應改變評論情感的屬性。研究人員在真實世界的 NLP 資料集上進行了實驗，從而證明與許多現有的對抗性文字生成方法相比，Text-Gen 可以生成更有意義和多樣化的對抗性文字。然後，論文的作者們還進一步使用生成的對抗性示例通過對抗性訓練來改進模型，並且證明了生成的攻擊對於模型重新訓練和不同的模型架構更加穩健。

匆匆一瞥，這貌似是一篇站在「巨人肩膀上」的又一推陳出新之作，且截止被發現抄襲前，這篇論文已經通過雙盲評審（double-blind review）。那麼，這篇論文為何會被認為抄襲呢？

三大罪證，屬實不冤

從 ICLR 2022 給出的官方聲明中，我們發現，這篇論文被認為抄襲，屬實不冤。那它究竟觸犯了哪些大忌，讓創作者們的心血自此付之一炬？

首先，該論文的多處「採用」其實是直接複製/貼上自其它論文，但作者卻表明這是「引用」。例如，論文的圖 1，包括標題，就完全複製/貼上自另一篇論文 CAT-Gen: Improving Robustness in NLP Models via Controlled Adversarial Text Generation. Wang et al. EMNLP 2020.。