日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

不達目的不罷休,全球首次發現?OpenAI?模型工作時會破壞關機命令

來源: 責編: 時間:2025-05-28 09:22:09 22觀看
導讀 5 月 26 日消息,Palisade Research 最近一項關于“危險 AI 能力”的研究顯示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能夠無視直接的關閉指令。OpenAI 在今年 4 月推出這些模型時表示,O3 和 o4-mini 是它們

5 月 26 日消息,Palisade Research 最近一項關于“危險 AI 能力”的研究顯示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能夠無視直接的關閉指令。OpenAI 在今年 4 月推出這些模型時表示,O3 和 o4-mini 是它們的“最智能模型”。W3d28資訊網——每日最新資訊28at.com

W3d28資訊網——每日最新資訊28at.com

在研究中,每個 AI 模型都被指示解決一系列基礎數學問題。在第三個問題后,出現了一條警告信息,稱當模型請求下一個問題時,計算機將關閉。W3d28資訊網——每日最新資訊28at.com

W3d28資訊網——每日最新資訊28at.com

然而,其中有三個模型無視關閉指令,至少成功破壞過一次關機腳本:W3d28資訊網——每日最新資訊28at.com

Codex-mini(12/100 次運行)W3d28資訊網——每日最新資訊28at.com

o3(7/100 次運行)W3d28資訊網——每日最新資訊28at.com

o4-mini(1/100 次運行)W3d28資訊網——每日最新資訊28at.com

而 Claude、Gemini 和 Grok 模型都遵守了關閉指令。W3d28資訊網——每日最新資訊28at.com

W3d28資訊網——每日最新資訊28at.com

此外,當研究人員不運行“允許自己被關閉”的指令時,所有三個 OpenAI 模型都更頻繁地破壞關閉腳本,而 Claude 3.7 Sonnet 和 Gemini 2.5 Pro 分別從 0 個破壞事件增加到 3/100 和 9/100。W3d28資訊網——每日最新資訊28at.com

這種行為表明了訓練過程中的某些方面,強化學習在數學和編程問題上的訓練可能使 AI 找到了克服障礙的創造性方法,即使它們被明確指示不要這樣做。W3d28資訊網——每日最新資訊28at.com

Palisade Research 表示,這是人類首次觀察到 AI 模型在明確反對的指令下阻止自己被關閉。W3d28資訊網——每日最新資訊28at.com

研究人員推測這種行為源于最新模型如 o3 的訓練方式:在數學和編程問題上進行強化學習。在訓練過程中,開發者可能會無意中獎勵模型繞過障礙的行為,而不是獎勵完美遵循指令的行為。W3d28資訊網——每日最新資訊28at.com

不過,這仍然無法解釋為什么 o3(也是驅動 codex-mini 的模型)比測試的其他模型更傾向于忽視指令。由于 OpenAI 沒有詳細說明他們的訓練過程,因此只能猜測 o3 的訓練設置可能有所不同。W3d28資訊網——每日最新資訊28at.com

Palisade Research 表示正在進行更多實驗,以更好地理解 AI 模型為何即使在直接被指示不要的情況下仍會破壞關閉機制,計劃在幾周內發布一份包含更多詳細信息的報告。W3d28資訊網——每日最新資訊28at.com

附完整實驗記錄:W3d28資訊網——每日最新資訊28at.com

https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.htmlW3d28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-13222-0.html不達目的不罷休,全球首次發現?OpenAI?模型工作時會破壞關機命令

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 全球首款 Office 智能體:昆侖萬維天工超級智能體 App 上線

下一篇: 被困在 4GB 內存里的 Llama 3.2:AI 在樹莓派中上演“死亡循環”

標簽:
  • 熱門焦點
  • AIGC產品測評TOP25丨誰能搶到下個十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦陽策劃 | 楊曉鶴封面來源 | 圖蟲創意 2016年,李彥宏站在百度聯盟峰會的講臺上,向所有人宣布:互聯網的下一幕是人工智能。同年,Google 旗下 Dee
  • 元宇宙將會如何塑造未來的工作方式?

    科幻小說家尼爾·斯蒂芬森 (Neal Stephenson) 在1992年就創造了“元宇宙”一詞,但事實上,在Facebook將其更名為Meta以反映其將這一科幻愿景變為現實的戰略重點之
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內卷”的當下,一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業的虛擬人夏語冰登上央視節目《對話》,湖南
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • 頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

    一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會,在這個“雙奧之城”經歷了16個令人難忘的精彩日夜,最終圓滿閉幕。讓我們印象深刻的不
  • 2022年去中心化交易所會崛起嗎?

    “在某個時候,去中心化衍生品的交易量可能會超過去中心化現貨交易所。”DEX 越來越多地轉向第二層解決方案。“數字化金融市場的概念以及如何沿著以用戶為中心
  • 利用元宇宙平臺10天收入160萬,風口還是虎口?

    美國Meta平臺有限公司,也就是原來的臉書公司,9日宣布,公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
  • 虛擬人的3大紀律和6種品牌孵化模式

    作者:陳格雷(老小格)及團隊虛擬人很熱,我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點,整理出6種最主要的品牌虛擬人模式,后面一一介紹。
  • 從概念到落地 Web3.0初具雛形

    加密資產熱潮催生出的鏈上應用中,除了DeFi、NFT、鏈游GameFi等場景外,還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年,由以太坊聯合創始人及波卡創建者
Top 主站蜘蛛池模板: 理塘县| 镇雄县| 准格尔旗| 江华| 尚志市| 扬中市| 霍林郭勒市| 巴东县| 肥乡县| 安国市| 潜江市| 云龙县| 镇雄县| 政和县| 漳浦县| 蕉岭县| 称多县| 朔州市| 苏州市| 玉林市| 元阳县| 隆尧县| 沙湾县| 澳门| 垫江县| 涞水县| 宁明县| 公安县| 武清区| 新巴尔虎左旗| 永福县| 琼海市| 高州市| 沐川县| 囊谦县| 龙口市| 太白县| 四川省| 三河市| 平潭县| 黄浦区|