日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

ChatGPT 參數(shù)規(guī)模被扒:只有 7B

來(lái)源: 責(zé)編: 時(shí)間:2024-03-19 17:31:25 209觀看
導(dǎo)讀 ChatGPT 慘遭攻擊,參數(shù)規(guī)模終于被扒出來(lái)了 —— 很可能只有 7B(70 億)。消息來(lái)自南加州大學(xué)最新研究,他們使用一種攻擊方法,花費(fèi)不到 1000 美元就把最新版 gpt-3.5-turbo 模型的機(jī)密給挖了出來(lái)。果然,OpenAI 不 Ope

ChatGPT 慘遭攻擊,參數(shù)規(guī)模終于被扒出來(lái)了 —— 很可能只有 7B(70 億)。nrM28資訊網(wǎng)——每日最新資訊28at.com

消息來(lái)自南加州大學(xué)最新研究,他們使用一種攻擊方法,花費(fèi)不到 1000 美元就把最新版 gpt-3.5-turbo 模型的機(jī)密給挖了出來(lái)。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

果然,OpenAI 不 Open,自有別人幫他們 Open。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

具體來(lái)說(shuō),南加大團(tuán)隊(duì)三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量維度(embedding size)為 4096 或 4608。nrM28資訊網(wǎng)——每日最新資訊28at.com

而幾乎所有已知的開(kāi)源大模型如 Llama 和 Mistral,嵌入向量維度 4096 的時(shí)候都是約 7B 參數(shù)規(guī)模。其它比例的話,就會(huì)造成網(wǎng)絡(luò)過(guò)寬或過(guò)窄,已被證明對(duì)模型性能不利。nrM28資訊網(wǎng)——每日最新資訊28at.com

因此南加大團(tuán)隊(duì)指出,可以推測(cè) gpt-3.5-turbo 的參數(shù)規(guī)模也在 7B 左右,除非是 MoE 架構(gòu)可能不同。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

數(shù)月前,曾有微軟 CODEFUSION 論文意外泄露當(dāng)時(shí) GPT-3.5 模型參數(shù)為 20B,在后續(xù)論文版本中又刪除了這一信息。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)時(shí)引起了一陣軒然大波,業(yè)界很多人分析并非不可能,先訓(xùn)練一個(gè)真正的千億參數(shù)大模型,再通過(guò)種種手段壓縮、蒸餾出小模型,并保留大模型的能力。nrM28資訊網(wǎng)——每日最新資訊28at.com

而現(xiàn)在的 7B,不知道是從一開(kāi)始 20B 的消息就不準(zhǔn)確,還是后來(lái)又再次壓縮了。但無(wú)論是哪一種,都證明 OpenAI 有很恐怖的模型優(yōu)化能力。nrM28資訊網(wǎng)——每日最新資訊28at.com

撬開(kāi) ChatGPT 的保護(hù)殼

那么,南加大團(tuán)隊(duì)是怎么扒出 ChatGPT 未公開(kāi)配置的呢?還要說(shuō)到現(xiàn)代語(yǔ)言模型中普遍存在的“Softmax 瓶頸”。nrM28資訊網(wǎng)——每日最新資訊28at.com

當(dāng) Transformer 網(wǎng)絡(luò)處理完輸入,會(huì)得到一個(gè)低維的特征向量,也就是 Embedding。這個(gè)特征向量再經(jīng)過(guò) Softmax 變換,就得到了最后的概率分布輸出。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

問(wèn)題就出在 Softmax 這里,因?yàn)榫仃嚨闹仁芟抻谔卣飨蛄康木S度,所以大模型的輸出空間事實(shí)上被限制在了一個(gè)低維的線性子空間里。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

這就像是無(wú)論你的衣柜里有多少件衣服,最后能穿出去的搭配,其實(shí)是有限的。這個(gè)”衣柜”的大小,就取決于你的“特征向量維度”有多大。nrM28資訊網(wǎng)——每日最新資訊28at.com

南加大團(tuán)隊(duì)抓住了這一點(diǎn),他們發(fā)現(xiàn),只要從 API 調(diào)用中獲取到足夠多的輸出樣本,就足以拼湊出這個(gè)大模型的特征向量維度。nrM28資訊網(wǎng)——每日最新資訊28at.com

有了這個(gè)特征向量維度,可以進(jìn)一步推斷大模型的參數(shù)規(guī)模、還原出完整的概率輸出,在 API 悄悄更新時(shí)也能發(fā)現(xiàn)變化,甚至根據(jù)單個(gè)輸出判斷來(lái)自哪個(gè)大模型。nrM28資訊網(wǎng)——每日最新資訊28at.com

更狠的是,推測(cè)特征向量維度并不需要太多的樣本。nrM28資訊網(wǎng)——每日最新資訊28at.com

以 OpenAI 的 gpt-3.5-turbo 為例,采集到 4000 多個(gè)樣本就綽綽有余了,花費(fèi)還不到 1000 美元。nrM28資訊網(wǎng)——每日最新資訊28at.com

在論文的最后,團(tuán)隊(duì)還探討了目前的幾個(gè)應(yīng)對(duì)這種攻擊的方法,認(rèn)為這些方法要么消除了大模型的實(shí)用性,要么實(shí)施起來(lái)成本高昂。nrM28資訊網(wǎng)——每日最新資訊28at.com

不過(guò)他們倒也不認(rèn)為這種攻擊不能有效防護(hù)是個(gè)壞事,一方面無(wú)法用此方法完整竊取模型參數(shù),破壞性有限。另一方面允許大模型 API 用戶自己檢測(cè)模型何時(shí)發(fā)生變更,有助于大模型供應(yīng)商和客戶之間建立信任,并促使大模型公司提供更高的透明度。nrM28資訊網(wǎng)——每日最新資訊28at.com

這是一個(gè) feature,不是一個(gè) bug。nrM28資訊網(wǎng)——每日最新資訊28at.com

nrM28資訊網(wǎng)——每日最新資訊28at.com

論文:nrM28資訊網(wǎng)——每日最新資訊28at.com

https://arxiv.org/abs/2403.09539nrM28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:nrM28資訊網(wǎng)——每日最新資訊28at.com

https://x.com/TheXeophon/status/1768659520627097648nrM28資訊網(wǎng)——每日最新資訊28at.com

本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:夢(mèng)晨nrM28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3616-0.htmlChatGPT 參數(shù)規(guī)模被扒:只有 7B

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 谷歌推出 Cappy “打分”框架,可評(píng)估 AI 準(zhǔn)確性“教模型更聰明”

下一篇: Devin 第一手使用體驗(yàn):完成度很高,開(kāi)始編碼就停不下來(lái),但要替代程序員還很遠(yuǎn)

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
  • 保時(shí)捷推出虛擬超跑,車企元宇宙營(yíng)銷這么香?

    保時(shí)捷又出超跑了,不過(guò)這次不是在現(xiàn)實(shí)世界,而是在虛擬世界。這款Vision Gran Turismo概念車,由保時(shí)捷和日本視頻游戲開(kāi)發(fā)工作室Polyphony Digital聯(lián)合打造,將于202
  • 智能人機(jī)交互技術(shù)的春晚大考

    1月初的一個(gè)早晨,京東智能客戶服務(wù)產(chǎn)品部緊急開(kāi)會(huì),進(jìn)行關(guān)于尚未對(duì)外公布的“X項(xiàng)目”的初討論。1月5日,這個(gè)神秘的X項(xiàng)目對(duì)外公布,京東成為央視2022年春晚獨(dú)家互動(dòng)合
  • 銀保監(jiān)會(huì):打擊以“元宇宙”為名義的違法行為

    今日,銀保監(jiān)會(huì)發(fā)布《關(guān)于防范以“元宇宙”名義進(jìn)行非法集資的風(fēng)險(xiǎn)提示》,全文如下:近期,一些不法分子蹭熱點(diǎn),以“元宇宙投資項(xiàng)目”“元宇宙鏈游”等名目吸收資金,涉
  • 數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素與數(shù)字治理

    深入理解數(shù)字經(jīng)濟(jì)與數(shù)據(jù)要素,有利于更準(zhǔn)確理解和把握數(shù)字治理的基本規(guī)律,構(gòu)建面向未來(lái)的健康的數(shù)字治理體系,也才能更好地理解元宇宙的治理框架。 一、數(shù)字經(jīng)濟(jì)
  • a16z:元宇宙辦公會(huì)取代實(shí)體辦公室嗎?

    6位不同的專家對(duì)未來(lái)的工作發(fā)表看法----元宇宙--沉浸式的、基于區(qū)塊鏈的虛擬世界,大多數(shù)日常活動(dòng)最終會(huì)在這里發(fā)生--但仍然只是一個(gè)概念。但它是一個(gè)擁有寶貴不
  • 元宇宙畫(huà)廊體驗(yàn)報(bào)告:有點(diǎn)頭疼。

    2 月 10 日,Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強(qiáng)現(xiàn)實(shí)藝術(shù)品。“我們現(xiàn)在在虛擬世界中嗎?時(shí)間好像變長(zhǎng)了” 我問(wèn)身后排隊(duì)的人。我
  • Interface正大光明的“跑路”,社區(qū)成員贊格局大

    今日凌晨,一個(gè)廣泛受社區(qū)期待的潛力藍(lán)籌項(xiàng)目Interfaces突然發(fā)文宣布項(xiàng)目停止運(yùn)營(yíng),后續(xù)也不會(huì)有鑄造NFT系列的活動(dòng)。這對(duì)社區(qū)來(lái)說(shuō)就是一重磅炸彈,大多數(shù)人完全不明
  • 冬奧會(huì)數(shù)字收藏品升溫,市場(chǎng)再現(xiàn)“一墩難求”

    根據(jù)公開(kāi)信息顯示,國(guó)際奧委會(huì)官方授權(quán)的冰墩墩數(shù)字盲盒于北京時(shí)間2月12日凌晨在nWayPlay平臺(tái)發(fā)售,總數(shù)為500個(gè),每個(gè)99美元,每人限購(gòu)5個(gè)。此外,不同的奧運(yùn)徽章數(shù)字藏
  • TX加入的NFT數(shù)字收藏品,元宇宙的破圈之路?

    3月7日,澳大利亞 NFT 初創(chuàng)公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資,騰訊參投。想必國(guó)人最熟知的應(yīng)該就是TX,作為國(guó)內(nèi)四大互聯(lián)網(wǎng)
Top 主站蜘蛛池模板: 五河县| 文水县| 平阴县| 岳西县| 鲁山县| 麟游县| 家居| 永安市| 嘉禾县| 衡山县| 双鸭山市| 永吉县| 达日县| 新干县| 晋中市| 揭西县| 阿拉善盟| 合江县| 武强县| 渝中区| 崇明县| 大冶市| 平邑县| 安塞县| 沙雅县| 兴化市| 南城县| 健康| 龙门县| 蒙自县| 彭州市| 华亭县| 崇信县| 治多县| 安陆市| 西乌| 琼结县| 韶山市| 神池县| 治多县| 建瓯市|