當前位置：首頁 > 元宇宙 > AI

ChatGPT 也在評審你的頂會投稿，斯坦福新研究捅了馬蜂窩

來源：責編：時間：2024-04-06 17:12:07 205觀看

導讀尷了個大尬！人們還在嘲諷有人用 ChatGPT 寫論文忘了刪掉“狐貍尾巴”，另一邊審稿人也被曝出用 ChatGPT 寫同行評論了。而且，還是來自 ICLR、NeurIPS 等頂會的那種。來自斯坦福的學者對一些頂級 AI 會議（如 ICLR、

尷了個大尬！

人們還在嘲諷有人用 ChatGPT 寫論文忘了刪掉“狐貍尾巴”，另一邊審稿人也被曝出用 ChatGPT 寫同行評論了。而且，還是來自 ICLR、NeurIPS 等頂會的那種。

來自斯坦福的學者對一些頂級 AI 會議（如 ICLR、NeurIPS、CoRL 等）中的審稿意見進行了分析，結果發現 ——

在 ChatGPT 出現之后，這些同行評論的“AI 含量”大增，最多的高達 16.9%，而有 ChatGPT 之前這個比例大約是 2%。

證據也很直觀，AI 常用的詞匯出現頻率，在 ChatGPT 發布之后噌的一下就上去了。

消息一出，Reddit 的機器學習板塊立刻就炸了鍋，有網友直呼：閉環了！

在 X 上，也有人發出了同樣的疑問：

既然寫論文和審稿都是大模型在干，那科學家去干什么了？

那么，這究竟是怎么一回事呢？

頂會審稿意見 AI 含量超 1/6

來自斯坦福大學多個學院以及加州大學圣芭芭拉分校的研究人員發表了一項研究，主題是關于 ChatGPT 對 AI 學術會議同行評審的影響。

研究人員一共分析了 ICLR、NeurIPS、CoRL 和 EMNLP 這四個頂會中的同行評審意見，對其“AI 含量”進行了計算。

ICLR 2024：估計 α 值為 10.6%

NeurIPS 2023：估計 α 值為 9.1%

CoRL 2023：估計 α 值為 6.5%

EMNLP 2023：估計 α 值為 16.9%，超過了 1/6

（α 值指在所有內容中疑似由 AI 生成或“顯著修改”的內容所占的比例）

而在 ChatGPT 問世之前，α 值的水平大約是在 2%，作為對照的 Nature 系列期刊評審意見的 α 值則未發生顯著變化。

除了得出這些數據，研究人員還發現了“AI 含量”較高的評審意見大多具有一些共同特點。

從內容角度上看，“AI 含量”高的意見，引用的作者中包括“et al.”的學術內容也較少。

而且，“AI 含量”高的內容，在語義上也更加同質化，比如“commendable”（值得稱贊的）、“meticulous”（細致的）和“intricate”（復雜的）等形容詞大量出現。

同時作者也展示了在 AI 生成的內容中出現最頻繁的形容詞和副詞各 100 個，下圖中字號越大代表出現頻率越高。

而除了內容本身，高“AI 含量”的內容的作者在行為上也表現出了一些共同之處。

一是提交的時間更加接近截止期限，特別是截止前三天提交的意見“AI 含量”明顯更高。

除了提交時間晚，高“AI 含量”意見的作者，普遍對自己提交的內容自信程度也更低。

評審者對自己評審意見信心水平的自我評估（滿分 5 分）結果顯示，“AI 含量”較高的審稿人，自我評分也更低（不大于 2 分）。

此外，對自己的審稿意見自信程度低的另一個表現是，他們也較少對論文作者反駁做出回應。

在 ICLR 2024 和 NeurIPS 2023 上，這類審稿人中有超過 12.5% 從未對反駁意見做出任何回復，約 10% 只回復了一次。

那么，作者又是如何分析出這些審稿意見中的 AI 含量的呢？

為此，研究人員設計了一種分布式“GPT 量化”方法，能夠在語料庫級別有效估計 AI 含量，而不必逐篇分析。

首先，研究人員收集了已知由人類編寫（ChatGPT 出現前的審稿意見）和 AI 生成（由研究者直接用 ChatGPT 編寫）的文本的數據集，作為參考分布。

然后，作者估計了人工編寫的（P）和 AI 生成（Q）的內容的 token 分布，尤其重點關注形容詞的出現概率。

最后將這種分布模型擬合到未知成分的目標語料庫，假設每個文檔都是從人類和人工智能分布的加權組合中，即 (1-α) P+αQ，并使用最大似然估計來推斷 α 的值。

完成方法的構建之后，研究者又合成了多組 α 值確定的標準數據集，并在此之上對前面提出的方法進行了驗證，結果最大誤差僅有 2.4%。

于是，作者使用該方法分析了最近幾個會議中的審稿意見，最終得到了前面的結論。

而當這項研究被更多人所得知后，引發了廣泛的討論，其中有不少人對這種現象表達了擔憂。

不過，也有人猜測出現這種現象的原因，可能是審稿人母語不是英語，于是用 ChatGPT 對英文寫作進行了調整潤色。

基于此，有人提問到，用 ChatGPT 來改寫而不是直接生成評論也是錯的嗎？

有人給出了半肯定的答復，但理由不是關乎原創性，而是出于對文本質量的擔憂，人們還是應該謹慎使用 ChatGPT。

當然也有人說，科學寫作，本身就是 ChatGPT 的一種合理用途。

總之對于這件事，擔憂也好寬容也罷，這種現象都已然存在了，而按照原作者的觀點，這幾個問題是人們應該思考的：

是否應該披露 AI 在同行評審中的使用

在 AI 極具誘惑力的情況下，應該如何激勵好的實踐

在人工智能同質化的境地下，人們能否保持“智力多樣性”

是否應該重新考慮人類 / AI 混合知識工作的可信度

當然了，在學術界，ChatGPT 生成的內容，還遠不只是審稿意見。

論文作者也愛用

除了審稿人被曝用 ChatGPT 寫評論之外，拿它來寫論文的人更是屢見不鮮……

在谷歌學術中搜索 2023 年及以后包含“certainly, here is”這種 ChatGPT 常用開頭的論文，剔除直接包含“ChatGPT”和“LLM”的論文后，結果共有 50 余篇。

隨機翻閱其中的幾篇，果然是發現了 ChatGPT 的使用痕跡，ChatGPT 在這些論文中被用做了總結、翻譯、制作表格等多種用途。

甚至其中還包括正式出版的論文合集：

而另一個 ChatGPT 常用句式“As of my Last Knowledge Update”，在相同條件下的搜索結果有 114 條。

而且出現形式上也更加離譜，“Certainly 組”當中至少還有一些只是用 ChatGPT 做了些輔助工作，“As of my…”這一組干脆直接拿來搞正文內容了。

此外，“As an AI language model, I”也有 40 多條搜索結果，不過也不排除其中有誤傷的情況出現。

當然要論離譜，可能還要屬這種把 ChatGPT 的按鈕“Regenerate Response”也一起復制進去的了，而且數量還不算少，有將近一百篇。

露出雞腳馬腳被發現的論文數量尚且如此，刪去了這些關鍵字從而“躲過一劫”的究竟有多少，就更是不得而知了。

當然，并不是說研究者不能使用 ChatGPT 來輔助論文撰寫，包括 Elsevier、Springer（Nature 出版商）在內的許多知名出版機構都表示并不禁止 ChatGPT 的使用，只要進行聲明即可。

總之，無論是論文本身還是審稿意見，亦或是其他文本寫作，如何以更合理的方式運用 AI，值得人們繼續深入思考。

論文地址：

https://arxiv.org/abs/2403.07183

本文來自微信公眾號：量子位（ID：QbitAI），作者：克雷西

本文鏈接：http://www.www897cc.com/showinfo-45-3859-0.htmlChatGPT 也在評審你的頂會投稿，斯坦福新研究捅了馬蜂窩

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：全球首個涉 AI 安全雙邊協議，英美兩國建立人工智能安全科學合作伙伴關系

下一篇：號稱“音樂 ChatGPT 時刻”來臨，天工 SkyMusic 音樂生成大模型今日邀測

標簽：

熱門焦點

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

撰文/ 孟會緣近兩年間，要論引得無數互聯網巨頭競折腰的一大熱門產業，莫過于元宇宙領域中的數字人了。作為繼數字藏品之后，開發元宇宙的又一重點落地項目，互聯網
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現實世界，又與現實世界平行、相互影響，并且始終在線的虛擬世
保時捷推出虛擬超跑，車企元宇宙營銷這么香？

保時捷又出超跑了，不過這次不是在現實世界，而是在虛擬世界。這款Vision Gran Turismo概念車，由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造，將于202
星展銀行(DBS)計劃推出零售數字資產交易服務

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數字資產交易服務。據悉，DBS于2021年初開設了機構數字資產交易平臺，全
超級碗的加密時刻：是主流信號還是“網絡超級碗2.0”？

2 月 13 日，美東時間 18:30，有著“美國春晚”之譽的超級碗（Super Bowl）落下帷幕。超級碗是美國國家美式足球聯盟（也稱為國家橄欖球聯盟）的年度冠軍賽，勝者將成為“世
Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

目前來看元宇宙不會影響到小型企業的發展，但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞，你一定或
國內涌現70余家數字藏品平臺：合規、流量與利潤在博弈

作者：楊鄭君2月16日，迅雷鏈企業數字藏品服務平臺正式上線，繼阿里、騰訊、京東、百度、網易等之后，又一家互聯網企業正式加入到火熱的數字藏品平臺的競爭中。除互聯
虛擬數字人：元宇宙的主角破圈而來

虛擬數字人市場逐步進入成熟期，商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破，制
以用戶為中心，Web3和區塊鏈如何將用戶放在首位

競爭優勢正在改變競爭優勢是每個企業都在努力爭取的，由谷歌、Facebook和Netflix等大型科技公司主導的市場中，兩大重要類別的競爭優勢十分突出。第一個競爭優勢來

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

ChatGPT 也在評審你的頂會投稿，斯坦福新研究捅了馬蜂窩

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

游戲玩家才是最“元宇宙”的

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

星展銀行(DBS)計劃推出零售數字資產交易服務

超級碗的加密時刻：是主流信號還是“網絡超級碗2.0”？

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

國內涌現70余家數字藏品平臺：合規、流量與利潤在博弈

虛擬數字人：元宇宙的主角破圈而來

以用戶為中心，Web3和區塊鏈如何將用戶放在首位

最新推薦

雷克薩斯高管，“受賄”5000萬？

字節跳動，剛剛投了一位虛擬女生

摩根大通：元宇宙市場預計每年收入超1萬億美元

「國產良心」NFT嘲諷了誰？

Web 3如何改變傳統HR

元宇宙收割了誰

猜你喜歡

熱門推薦

相關資訊