設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

韓國 AI 團隊抄襲震動學(xué)界!1 個導(dǎo)師帶 51 個學(xué)生,還是抄襲慣犯

量子位 2022/6/28 14:56:53 責(zé)編:汪淼
感謝IT之家網(wǎng)友 我們的大哥哥 的線索投遞!

今年 CVPR,著實有點魔幻了!

先是韓國首爾大學(xué) AI 團隊的 Oral,即前 4% 的優(yōu)秀論文,被曝出涉嫌抄襲 10 篇論文。有的地方,連一個單詞都沒有變。事發(fā)當(dāng)日即登上韓國頭條,國內(nèi)外網(wǎng)友震驚:搞到 CVPR 上也太行了吧。

更多人爆料,這個團隊抄襲已經(jīng)不止一次,基本操作了屬于是。

結(jié)果這一波還未結(jié)束,另一波又開始了。IBM 發(fā)表在 CVPR 上的論文 TableFormer 被指抄襲國內(nèi) 2021 年發(fā)表的一篇文章。

爆料指出,IBM 論文剽竊了他們的方法,包括預(yù)處理、可視化、推理、系統(tǒng)解決方案等,但并沒有引用他們的論文。

……

抄襲事件頻出,于是乎不少網(wǎng)友感嘆:這屆 CVPR 太魔幻了。

甚至還有人直接在知乎上列出了這么一個問題:

大家一起來揭發(fā)吧。CVPR 2022 都有哪些論文是抄襲的?

韓國團隊被曝不止一次抄襲

先來看引發(fā)眾人關(guān)注的韓國團隊抄襲事件。

在通訊作者尹盛老和一作金某的最新公開回應(yīng)中,都表示這次抄襲屬于一作的個人行為,和團隊其他人無關(guān)。

尹盛老解釋說:

團隊其他合著者把各自的部分發(fā)給了一作,但是他最后卻沒有使用,而是抄襲了別的論文。

他還補充道,現(xiàn)在一作本人其他兩篇正在審閱的論文也都被撤回了。

不過,網(wǎng)友們順藤摸瓜后發(fā)現(xiàn),該團隊似乎不止這一篇論文存在抄襲嫌疑。

比如這篇:《Towards Fast and Accurate Object Detection in Bio-Inspired Spiking Neural Networks Through Bayesian Optimization》。

檢測軟件顯示,它有 40% 的抄襲嫌疑,文中有 27 處表達與之前研究高度相似。

還有另外一篇《Energy-aware Placement for SRAM-NVM Hybrid FPGAs》,也被發(fā)現(xiàn)存在類似問題。通訊作者都是尹盛老

與此同時,還有人指出尹教授的實驗室規(guī)模很大。博士生就有 37 位,加上碩士和博士后,實驗室共有 51 位學(xué)生由尹盛老指導(dǎo)。

這也讓有人擔(dān)憂,一位教授是否能同時指導(dǎo)好這么多學(xué)生,他們的實驗和論文質(zhì)量是否會受到影響。

而從事件爆發(fā)的起點 —— 油管曝光視頻的內(nèi)容來看,這次涉嫌抄襲的論文中,很多地方都是原封不動地搬運此前研究的表述。涉及到的部分有 Introduction、Preliminaries、Method 等。

甚至有的地方是一字不落的 copy。

全文出現(xiàn)的抄襲段落多達 25 處,曝光視頻展示問題就花了 7 分多鐘。被抄襲的論文很多被 NeureIPS、AAAI 等頂會接收,其中還有幾位一作是韓國人。

這也難怪上傳曝光視頻的人,會給視頻起一個如此“刺眼”的標題:

E2V-SDE or: How I Learned to Stop Worrying and Love Plagiarism。

E2V-SDE 又名:我是如何毫不擔(dān)憂并愛上抄襲的。

這里的 E2V-SDE,就來自尹盛老團隊此次被 CVPR 2022 接收的論文標題。

現(xiàn)在,隨著事件的不斷發(fā)酵,尹盛老團隊還引發(fā)了韓國網(wǎng)友的群憤

要知道,尹盛老是韓國人工智能領(lǐng)域的權(quán)威專家,來自首爾大學(xué)人工智能研究所。今年 6 月,他才剛剛被韓國科學(xué)技術(shù)部評選為“首席研究員”,每年享有大約 8 億韓元(折合人民幣約 416 萬)的科研經(jīng)費。

但如今,他的團隊卻深陷抄襲丑聞。

有人留言表示,希望相關(guān)單位能夠嚴肅處理這件事情,讓相關(guān)研究人員退出學(xué)術(shù)界。

過去 30 年里,很多人不分晝夜地努力研究,才讓韓國能在 CV 頂會里發(fā)表更多論文,而他們的行為卻如此過分!

實際上,韓國在 CVPR 2022 中的成績確實值得關(guān)注,僅首爾大學(xué)就有 25 篇論文入選。有人直接說,這件事太給韓國丟臉了。

而更為深層的原因還包括,韓國有聲音擔(dān)心,這次事件會是“黃禹錫事件”的二度上演。

2005 年,曾任首爾大學(xué)獸醫(yī)學(xué)院首席教授、一度被視為韓國民族英雄的黃禹錫,被揭發(fā)偽造多項研究成果。其在《Science》上發(fā)表的干細胞研究均屬子虛烏有。2009 年,黃禹錫被判處 2 年徒刑,緩刑 3 年。

IBM 被指抄襲

就在韓國抄襲事件這邊還在發(fā)酵,IBM 也被曝出其入選的 CVPR 論文涉嫌抄襲。

來自平安科技的研究員,列出了九大證據(jù),涉及方法論、預(yù)處理、后期處理、推理、文字行檢測與識別等內(nèi)容,目前已寫成郵件發(fā)給了 CVPR 2022 program chairs。

首先從核心方法論來看,兩者都是表格內(nèi)容識別任務(wù),取名也類似,一個是 TableMASTER,一個是 TableFormer。

其中,兩者的圖像輸入均為 448*448。前者(TableMASTER)訓(xùn)練長度為 500,而后者(TableFormer)則改成了 512。

爆料者表示,里面很多痕跡都可以看出,IBM 是在他們開源的預(yù)訓(xùn)練模型上跑的,只是改了些細節(jié)。而最隱晦的也是直呼“最無恥”的,還要屬文本單行檢測這塊,爆料者稱:他們只改變了顏色。

一般而言,官方提供的數(shù)據(jù)中每個表格都是多行的,不利于之后的訓(xùn)練。

于是,研究團隊對 3000 張圖像進行了重標注,將連在一起的多行拆分成單行。

而 IBM 的 PDF Cells 則是直接拿他們在 GitHub 上訓(xùn)練好的模型進行預(yù)測。

除此之外,根據(jù)爆料者描述,IBM 還將他們的 3 條規(guī)則根據(jù)開源的代碼,強行拆成 9 條規(guī)則。

目前,IBM 方也還沒有任何回應(yīng)。網(wǎng)友也持有各種意見。有人認為,這看起來像個人意見,作者有點情緒化。

還有網(wǎng)友則看完整個證據(jù),很難相信 IBM 是原創(chuàng)文章,建議直接向 CVPR 項目委員會投訴。

One More Thing

最后,再來簡單回顧一下今年有點魔幻的 CVPR。

CVPR 2022 投稿量高達 8161 篇,相比于去年 7093 分提交增長了 15%,其中 44.59% 的作者來自中國。

其中,共有 2064 篇論文被接收,接收率為 25.28%。在被接收的論文中,有 342 份被選為 Oral。

最佳論文頒向了 ETH Zurich、華盛頓大學(xué)、佐治亞理工學(xué)院、捷克理工大學(xué)等機構(gòu)的研究者。而最佳學(xué)生論文獎,則是頒給了達摩院的實習(xí)生。李飛飛教授獲得了本次大會的 Thomas S. Huang 紀念獎。

除此之外不得不承認,今年 CVPR 確實熱鬧,畢竟有近 6000 人來到線下參會。于是乎,另一個魔幻的事情發(fā)生了 —— 不少人因此染上新冠

網(wǎng)友還提問:到底是 CVPR 接收率高還是感染新冠率高?

參考文獻:

[1]https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/

[2]https://twitter.com/e2v_sde_parody/status/1540087877308239874

[3]https://arxiv.org/pdf/2105.01848.pdf

[4]https://arxiv.org/pdf/2203.01017.pdf

[5]https://www.youtube.com/watch?v=UCmkpLduptU&t=95s

[6]https://www.fmkorea.com/4760102853

[7]https://www.zhihu.com/question/539432448/answer/2543861341

[8]https://www.hankyung.com/society/article/2022062674031

[9]https://www.reddit.com/r/MachineLearning/comments/vjkssf/d_how_to_copy_text_from_more_than_10_previously/

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:抄襲韓國,AI論文

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知