日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

斯坦福團隊被曝抄襲清華系大模型,已刪庫跑路,創始人回應:也算國際認可

來源: 責編: 時間:2024-06-05 17:33:52 210觀看
導讀 斯坦福 AI 團隊,竟然曝出了抄襲事件,而且抄襲的還是中國國產的大模型成果 —— 模型結構和代碼,幾乎一模一樣!跟任何抄襲事故一樣……AI 圈內都驚呆了。斯坦福的這項研究叫做 Llama3-V,是于 5 月 29 日新鮮發布,宣

斯坦福 AI 團隊,竟然曝出了抄襲事件,而且抄襲的還是中國國產的大模型成果 —— 模型結構和代碼,幾乎一模一樣!跟任何抄襲事故一樣……AI 圈內都驚呆了。vwM28資訊網——每日最新資訊28at.com

斯坦福的這項研究叫做 Llama3-V,是于 5 月 29 日新鮮發布,宣稱只需要 500 美元就能訓出一個 SOTA 多模態大模型,比 GPT-4V、Gemini Ultra、Claude Opus 都強。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

Llama3-V 的 3 位作者或許是擁有名校頭銜加持,又有特斯拉、SpaceX 的大廠相關背景,這個項目短短幾天就受到了不小的關注。vwM28資訊網——每日最新資訊28at.com

甚至一度沖上了 HuggingFace 趨勢榜首頁:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

然而,戲劇性的一幕開始上演了。vwM28資訊網——每日最新資訊28at.com

有位細心的網友發現,咦?這“配方”怎么如此的熟悉?vwM28資訊網——每日最新資訊28at.com

然后他定睛一看,好家伙,這不就是 MiniCPM-Llama3-V 2.5(出自清華系明星創業公司面壁智能)嘛。vwM28資訊網——每日最新資訊28at.com

于是這位網友便跑到面壁智能 GitHub 項目下開始爆料了:vwM28資訊網——每日最新資訊28at.com

你們家大模型被斯坦福團隊抄襲了!vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

并且他還附上了一堆的證據,最直接的莫過于這張 2 個模型代碼的對比圖了:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

Emmm…… 用這位網友的話來說就是:vwM28資訊網——每日最新資訊28at.com

模型結構、代碼、配置文件,簡直一模一樣,只是變量名變了而已。vwM28資訊網——每日最新資訊28at.com

至于為什么這位網友要跑到面壁智能 GitHub 項目下面留言,是因為他之前已經給 Llama3-V 作者留過言了,但斯坦福團隊的做法竟是刪庫跑路……vwM28資訊網——每日最新資訊28at.com

沒錯,現在不論是 GitHub 還是 HuggingFace,統統都是 404:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

并且這事現在還在持續發酵的過程中,網上吃瓜的群眾也是越來越多。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

那么我先來一同回顧一下這件 drama 事情的始末。vwM28資訊網——每日最新資訊28at.com

“代碼和架構一模一樣”

正如剛才所述,一個網友爆料 Llama3-V 抄襲 MiniCPM-Llama3-V 2.5,跑到面壁智能的 GitHub 主頁提醒團隊注意,并把關鍵證據都一一截圖列舉整理了下來,這才有了整個抄襲門的還原現場。vwM28資訊網——每日最新資訊28at.com

以下是來自這位網友的證據。vwM28資訊網——每日最新資訊28at.com

證據一,Llama3-V 的模型架構和代碼與 MiniCPM-Llama3-V 2.5 幾乎完全相同:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

看下面的例子,配置文件就改了圖像切片、分詞器、重采樣器和數據加載等格式化和變量名:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

Llama3-V 作者表示參考了 LLaVA-UHD 架構,在 ViT 和 LLM 等選擇上有一些差異。但實際上,網友發現他們的具體實現在空間模式等很多方面都與 LLaVA-UHD 不同,卻出奇與 MiniCPM-Llama3-V 2.5 一致。vwM28資訊網——每日最新資訊28at.com

甚至,Llama3-V 還用了 MiniCPM-Llama3-V 2.5 的分詞器,連 MiniCPM-Llama3-V 2.5 定義的特殊符號都能“巧合”實屬離譜。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

證據二,網友質疑 Llama3-V 作者是如何在 MinicPM-Llama3-V2.5 項目發布之前就使用上 MinicPM-Llama3-V2.5 分詞器的。vwM28資訊網——每日最新資訊28at.com

Llama3-V 作者給的回復是這樣嬸兒的,說是用的面壁智能上一代 MinicPM-V-2 項目的:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

但事實卻是,HuggingFace 中,MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分別是兩個文件,文件大小也完全不同。vwM28資訊網——每日最新資訊28at.com

MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成,而 MiniCPM-V2 的發布都在 Llama3 開源之前,怎么會有 Llama3 分詞器。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

證據三,Llama3-V 作者隨后無故刪除了網友在 Llama3-V 頁面上提交的質疑他們抄襲的問題。vwM28資訊網——每日最新資訊28at.com

而且,他們似乎對 MiniCPM-Llama3-V 2.5 架構或他們自己的代碼都不完全了解。vwM28資訊網——每日最新資訊28at.com

感知器重采樣器(Perceiver resampler)是單層交叉注意力,而不是雙層自注意力。但是下圖所示 Llama3-V 的技術博客里作者的理解很明顯是錯的。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

SigLIP 的 Sigmoid 激活也不用于訓練多模態大語言模型,而僅用于預訓練 SigLIP。vwM28資訊網——每日最新資訊28at.com

視覺特征提取不需要 Sigmoid 激活:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

基于以上三點事實,這位網友認為證據足以證明 Llama3-V 項目竊取了 MiniCPM-Llama3-V 2.5 項目的學術成果。vwM28資訊網——每日最新資訊28at.com

但還沒完,他隨后又補充了兩點證據。vwM28資訊網——每日最新資訊28at.com

幾天前,當這位網友嘗試運行 Llama3-V 時,發現他們提供的代碼無法與 HuggingFace 的 checkpoint 一起使用,反饋問題沒有得到作者回復。vwM28資訊網——每日最新資訊28at.com

于是網友把從 HuggingFace 下載的 Llama3-V 模型權重中的變量名改成了 MiniCPM-Llama3-V 2.5 的,驚奇發現模型居然可以用 MiniCPM-V 代碼成功運行。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

此外,如果將高斯噪聲(由單個標量參數化)添加到 MiniCPM-Llama3-V 2.5 的 checkpoint,結果就是會得到一個行為與 Llama3-V 極其相似的模型。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

收到網友的提醒后,MiniCPM-Llama3-V 2.5 團隊這邊也迅速展開了調查,他們按照網友的在 GitHub 上的說明,使用 Llama3-V 的 checkpoint 和 MiniCPM-Llama3-V 2.5 的代碼和配置文件正確獲取了推理結果。vwM28資訊網——每日最新資訊28at.com

于是,一個更為關鍵性的證據出現了。vwM28資訊網——每日最新資訊28at.com

Llama3-V 在一些未公開的實驗性特征上表現出與 MiniCPM-Llama3-V 2.5 高度相似的行為,而這些特征是根據 MiniCPM-Llama3-V 2.5 團隊內部數據訓練的。vwM28資訊網——每日最新資訊28at.com

例如,識別清華簡!vwM28資訊網——每日最新資訊28at.com

MiniCPM-Llama3-V 2.5 特有的功能之一是識別清華簡,這是一種非常罕見、于戰國時期寫在竹子上的中國古代文字。vwM28資訊網——每日最新資訊28at.com

訓練圖像是從最近出土的文物中掃描出來的,由 MiniCPM-Llama3-V 2.5 團隊進行了標注,尚未公開發布。vwM28資訊網——每日最新資訊28at.com

而 Llama3-V 的識別情況和 MiniCPM-Llama3-V 2.5 極為相似。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

識別錯誤的情況竟也出奇一致:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

MiniCPM-Llama3-V 2.5 團隊還在 1000 張竹簡圖像上測試了幾種基于 Llama3 的視覺-語言模型,并比較了每對模型的預測精確匹配。vwM28資訊網——每日最新資訊28at.com

結果,每兩個模型之間的重疊為零,而 Llama3-V 和 MiniCPM-Llama3-V 2.5 之間的 && 重疊達到了驚人的 87%**。vwM28資訊網——每日最新資訊28at.com

此外,MiniCPM-Llama3-V 2.5 和 Llama3-V 甚至具有相似的錯誤分布。Llama3-V 和 MiniCPM-Llama3-V 2.5 分別做出 236 和 194 個錯誤預測,重疊部分為 182 個。vwM28資訊網——每日最新資訊28at.com

且按照網友在 GitHub 上的指令獲得的 MiniCPM-Llama3-V2.5-noisy 顯示出與 Llama3-V 幾乎相同的定量結果,真令人匪夷所思……vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

在另一個 MiniCPM-Llama3-V 2.5 內部數據上訓練的未公開功能 ——WebAgent 上,也出現了同樣的情況。vwM28資訊網——每日最新資訊28at.com

Llama3-V 甚至和 MiniCPM-Llama3-V 2.5 團隊新定義的 WebAgent 模式中犯的錯誤都一樣。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

鑒于這些結果,MiniCPM-Llama3-V 2.5 團隊表示很難將這種不尋常的相似性解釋為巧合,希望 Llama3-V 作者能對這個問題給出一個正式的解釋。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

斯坦福團隊已刪庫跑路

雖然斯坦福的 2 位本科生已經下架了幾乎所有與之相關的項目,但其實在此之前,他們最初在面對質疑的時候還是做出了些許的解釋。vwM28資訊網——每日最新資訊28at.com

例如他們強調,Llama3-V 這項工作的時間是要早于面壁智能的 MiniCPM,只是使用了他們的 tokenizer。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

不過作者對 Medium 上的聲明還是做了保留:vwM28資訊網——每日最新資訊28at.com

非常感謝那些在評論中指出與之前研究相似之處的人。vwM28資訊網——每日最新資訊28at.com

我們意識到我們的架構非常類似于 OpenBMB 的“MiniCPM-Llama3-V 2.5,他們在實現上比我們搶先一步。vwM28資訊網——每日最新資訊28at.com

我們已經刪除了關于作者的原始模型。vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

對此,一部分網友表示,既然選擇刪掉項目,那么就表示確實存在一定的問題。vwM28資訊網——每日最新資訊28at.com

不過另一方面,對于抄襲這事也有不一樣的聲音 ——vwM28資訊網——每日最新資訊28at.com

MiniCPM-Llama3-V 2.5 不也是在 Llama3 的基礎上做的改良嗎?不過連 tokenizer 都直接拿來用就應該不算是借鑒了。vwM28資訊網——每日最新資訊28at.com

而就在剛剛,另一個戲劇性的事情發生了。vwM28資訊網——每日最新資訊28at.com

斯坦福的作者在中午時間做出了最新的回應:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

但現在…… 這條回應又刪掉了。vwM28資訊網——每日最新資訊28at.com

而面壁智能這邊,CEO 李大海也做出了正式回應:vwM28資訊網——每日最新資訊28at.com

vwM28資訊網——每日最新資訊28at.com

參考鏈接:vwM28資訊網——每日最新資訊28at.com

[1]https://github.com/OpenBMB/MiniCPM-V/issues/196vwM28資訊網——每日最新資訊28at.com

[2]https://github.com/mustafaaljadery/Llama3-VvwM28資訊網——每日最新資訊28at.com

[3]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/vwM28資訊網——每日最新資訊28at.com

[4]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/?rdt=41696&onetap_auto=true&one_tap=truevwM28資訊網——每日最新資訊28at.com

[5]https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9eevwM28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:金磊 西風vwM28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4488-0.html斯坦福團隊被曝抄襲清華系大模型,已刪庫跑路,創始人回應:也算國際認可

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 字節豆包推出桌面客戶端:支持 Windows macOS,快捷啟動、AI 劃詞、 AI 搜索

下一篇: AI 電影來襲:翠貝卡電影節將展映 5 部使用 OpenAI Sora 制作的短篇

標簽:
  • 熱門焦點
  • 清華、北大等86所高校布局元宇宙,是風口還是噱頭?

    作者:徐賜豪來源:區塊鏈日報據全國高校人工智能與大數據創新聯盟元宇宙專委會不完全統計,截至2023年7月,全國共有86所高校戰略布局元宇宙領域,其中本科院校73所,高職專科院校13所
  • 保時捷推出虛擬超跑,車企元宇宙營銷這么香?

    保時捷又出超跑了,不過這次不是在現實世界,而是在虛擬世界。這款Vision Gran Turismo概念車,由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造,將于202
  • “任何國產元宇宙都是假元宇宙”

    上個月,華語樂壇的優質偶像之一,DOTA2資深玩家林俊杰,在國外元宇宙產品分布式大陸(Decentraland)上買了三塊虛擬地產,花了12.3萬美元(也就是人民幣接近80萬)。截至目
  • 新款英特爾芯片將使NFT鑄造變得更加方便

    科技巨頭和微處理器制造商英特爾(Intel)正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性,該公司的戰略是從加密興起與 NFT爆
  • Meta展示AI系統Builder Bot;《Pistol Whip》增加派對模式

    今日熱點:Meta展示AI系統Builder Bot;招聘信息顯示Meta正在探索具有蜂窩連接功能的VR/AR頭顯;英國VR工作室Coatsink Games正在為PSVR 2開發新游戲;VR節奏射擊游戲
  • 與元宇宙美少女藝術家的對話

    我最近宣布了我自己的NFT項目,這是我已經工作了幾個月的事情。由于我之前只是一個收藏家,擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
  • 音樂家如何利用NFTs來提高歌迷參與度

    "音樂是一種語言,不以特定的文字說話。它用情感說話,如果它在骨子里,它就在骨子里。" - Keith Richards音樂激勵著我們,使我們流淚,使我們充滿狂喜,并撫慰我們的靈魂
  • 虛擬人的3大紀律和6種品牌孵化模式

    作者:陳格雷(老小格)及團隊虛擬人很熱,我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點,整理出6種最主要的品牌虛擬人模式,后面一一介紹。
  • 我們離元宇宙的實現只差一副眼鏡?

    近日的蘋果春季新品發布會,想必許多人都守在了屏幕前,就為等待傳說中的首款AR Glass。在發布會之前,蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻
Top 主站蜘蛛池模板: 当阳市| 阿坝| 许昌县| 黑河市| 和林格尔县| 柳林县| 哈巴河县| 元氏县| 密山市| 石楼县| 页游| 崇州市| 灵川县| 定陶县| 保康县| 红河县| 宜春市| 香港| 大同市| 班玛县| 石狮市| 灵台县| 讷河市| 思茅市| 平陆县| 余干县| 廉江市| 牟定县| 贡嘎县| 奇台县| 刚察县| 石渠县| 镇宁| 荔浦县| 洛阳市| 鄂伦春自治旗| 天全县| 浦城县| 光泽县| 周至县| 上饶县|