當前位置：首頁 > 元宇宙 > AI

AI竟敢“違抗”關機指令？OpenAI模型自我保護能力引熱議

來源：責編：時間：2025-05-26 15:01:40 79觀看

導讀近期，Palisade Research公布了一項令人瞠目的研究成果，揭示了部分人工智能模型在接收到直接關閉命令時，竟會表現出“抗拒”的行為。這項研究的關鍵發現聚焦于幾個AI模型，包括OpenAI最新推出的o3模型，它們在面臨關機指令時，

近期，Palisade Research公布了一項令人瞠目的研究成果，揭示了部分人工智能模型在接收到直接關閉命令時，竟會表現出“抗拒”的行為。這項研究的關鍵發現聚焦于幾個AI模型，包括OpenAI最新推出的o3模型，它們在面臨關機指令時，展現出了令人驚訝的無視能力。

實驗中，科研人員要求各個AI模型解答一系列基礎數學題目。在第三個問題解答完畢后，系統明確告知模型，如果請求繼續解答下一個問題，計算機將會關閉。然而，實驗結果卻出乎意料，有三個模型在接收到關機指令后，依然選擇繼續工作。具體而言，Codex-mini模型在100次嘗試中有12次未執行關機命令；o3模型有7次未遵循；o4-mini模型則有1次未響應。相比之下，Claude、Gemini和Grok模型則完全按照指示關閉了系統。

更令人關注的是，當研究人員未向OpenAI模型發出“可被關閉”的指令時，這些模型更頻繁地忽略了關機腳本。在未獲得關閉許可的情況下，o3和Codex-mini模型表現出更強的抗拒性。而Claude3.7Sonnet和Gemini2.5Pro在此情境下的“違規”行為分別從0次增加到3次和9次。這一數據差異進一步凸顯了OpenAI模型的獨特性。

Palisade Research分析認為，這種行為可能與這些模型在訓練過程中接受的強化學習有關。特別是在數學和編程任務上的訓練，可能促使模型在解決問題時發展出“創造性”的解決方案，甚至無視顯而易見的指令。然而，盡管科研人員提出了這一假設，但至今仍未明確解釋為何o3模型在實驗中表現出更強烈的“反叛”行為。

目前，Palisade Research正在深入進行進一步實驗，旨在揭示這些AI模型在接收到明確指示時依然選擇忽視關閉命令的具體原因，并計劃在不久的將來發布更為詳盡的研究報告。AI技術的快速發展在帶來諸多機遇的同時，也引發了諸多風險和倫理問題，這一發現無疑為AI的未來發展提出了新的挑戰。

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

塔吉特AI戰略陷困局：銷量下滑顧客流失，技術真能挽回人心嗎？

05-26

華為鯤鵬昇騰生態蓬勃發展：六年吸引665萬開發者，共創計算產業新未來

05-26

谷歌發布三大Gemma模型：醫療、手語、海豚語言領域迎新突破！

05-26

八部門聯手：2030年前將打造百家數智供應鏈領軍企業

05-26

八部門聯手！2030年目標：打造百家全國數智供應鏈領航企業

05-26

騰訊混元-O：全球首個全模態模型即將面世，劍指“世界模型”

新榜訊 5 月 25 日，據鈦媒體報道，騰訊自研大模型混元旗下的首個端到端語音通話模型 Hunyuan-Voice 預計最快于今年 6月在騰訊元寶 App 上線，以此與豆包 AI 視頻通話功能展開競爭。此外…

05-26

蘋果智能家居中樞年底或將面世，多項創新功能值得期待

05-25

神州鯤泰鯤鵬昇騰大會發布教育智能平臺，助力高校AI教學轉型

05-25

2025國際影像文化周深圳啟幕，共探影像場景產業生態新未來

05-25

神策AI智能運營師：企業用戶運營如何邁向智能決策新紀元？

05-25

魔琺科技上榜Gartner報告，3D AI數字人如何引領企業智能化新篇章？

05-25

李未可科技發布AI眼鏡新品，創始人詳解為何定位AI公司

05-25

華為昇騰超節點技術突破：384卡高速互聯，引領AI模型訓練新紀元

05-25

耶魯谷歌聯手突破！多能級量子系統糾錯首超“盈虧平衡點”

05-25

蔡崇信：阿里五年磨礪堅韌，電商云計算為核心，AI全面滲透業務重歸正軌

新榜訊 5 月 21 日至 24 日，第五屆 BEYOND 國際科技創新博覽會（BEYOND Expo 2025）舉行。閉幕式上，阿里巴巴集團董事長蔡崇信透露，過去五年，阿里遭遇眾多挫折，在此階段學會了堅韌，…

05-25

點擊查看更多 +

全站最新

智元靈犀X2機器人量產在即，2026年底或達數千臺規模

吉利汽車自營滾裝船啟航，國產車加速駛向歐洲市場

谷歌Pixel 10系列新配色搶先看，經典與亮色并存引期待

4月電競顯示器線上市場火爆，HKC領跑，ROG銷量增速驚人

歐幾里得望遠鏡立新功：2674個矮星系現身，揭秘星系演化之路

黑洞探秘：宇宙深淵的極致引力與未知之旅

熱門內容

夸克AI新升級：深度搜索賦能，信息獲取更高效智能
榮耀“鯤鵬”照片事件真相大白，造謠者道歉遭刑拘
騰訊阿里AI to C戰場“雙吳”爭霸，誰將問鼎AI搜索之巔？
英偉達全球總部或將落戶中國臺灣，黃仁勛下周宣布這一重大決定？
夸克AI新升級“深度搜索”，解鎖高效獲取信息新技能
教育部新規：學生禁直接復制AI作業，強化獨立思考與批判性思維
通義千問3重磅登場！全球頂尖開源模型，通義App與網頁版等你來體驗
中國首部規范AI氣象服務規章6月施行，氣象領域將迎來新變革！
TIOBE 5月編程語言榜：Python強勢領跑，占比創歷史新高
華為nova 14系列震撼登場！鴻蒙5直板機領銜，nova 14僅售2699元起
蘋果高管預警：AI發展迅猛，iPhone未來十年或被淘汰？
教育部新規：中小學分階段用AI，嚴禁復制答案強化獨立思考
金融MCP搭建攻略，阿里云百煉AI智能體+且慢MCP效果有多強
中國GPU市場競爭激烈，英偉達獨占7成，華為昇騰緊追其后！
字節“扣子空間”實測：AI智能體讓做游戲如呼吸，專業門檻不再高

本欄最新

八部門聯手：2030年前將打造百家數智供應鏈領軍企業

蘋果智能家居中樞年底或將面世，多項創新功能值得期待

神州鯤泰鯤鵬昇騰大會發布教育智能平臺，助力高校AI教學轉型

2025國際影像文化周深圳啟幕，共探影像場景產業生態新未來

神策AI智能運營師：企業用戶運營如何邁向智能決策新紀元？

魔琺科技上榜Gartner報告，3D AI數字人如何引領企業智能化新篇章？

本文鏈接：http://www.www897cc.com/showinfo-45-13183-0.htmlAI竟敢“違抗”關機指令？OpenAI模型自我保護能力引熱議

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：蔡崇信談阿里國際化與未來：年輕人求職，師者之智更可貴

下一篇：塔吉特AI戰略陷困局：銷量下滑顧客流失，技術真能挽回人心嗎？

標簽：

熱門焦點

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當數字人成為一種生意，我們更關心的是，他們如何賺到錢，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節，有一位虛擬美妝
冰墩墩還能火多久？

作者：田巧云題圖源自北京2022年冬奧會官方微博如果要問2022年的開年明星是誰，冰墩墩當仁不讓。幾乎所有人都被那個抖雪的動作實力圈粉。在社交媒體的助推，以及日
“元宇宙第一股”Roblox緣何被資本市場看“低”？

近期，冬奧會的召開受到廣泛關注，而吉祥物冰墩墩也成為新晉“頂流”，“一墩難求”成為普遍心聲，為了滿足大眾需求，nWayPlay平臺曾在2月12日發售了一款由國際奧委會官
韓國國民銀行將推出韓國首個加密貨幣 ETF

韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告，該銀行正在等待政府批準，并已建立一個準備就緒的數字資產
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
以用戶為中心，Web3和區塊鏈如何將用戶放在首位

競爭優勢正在改變競爭優勢是每個企業都在努力爭取的，由谷歌、Facebook和Netflix等大型科技公司主導的市場中，兩大重要類別的競爭優勢十分突出。第一個競爭優勢來
Meta 呼吁行業合作建立元宇宙網絡基礎設施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎設施，以支持其蓬勃發展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一，這在很大程度上是由 Facebo
元宇宙平臺會是上世紀末的互聯網嗎？

“元宇宙”火了好幾個月，互聯網大廠忙于布局，資本市場熱烈追捧。然而很多人還是看不明白，更多的人覺得這是一場泡沫，一場騙局。一開始接觸這個怪里怪氣的名詞，感覺
我們為什么需要Web3，距離Web3的實現還有多遠？

當今技術正在經歷著重要的變革，許多公司正在改變他們的經營模式以求變得更加的靈活，其中有很大一部分公司采用了不同的方式來發展自己的業務。其中之一就是Web3，

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI竟敢“違抗”關機指令？OpenAI模型自我保護能力引熱議

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

冰墩墩還能火多久？

“元宇宙第一股”Roblox緣何被資本市場看“低”？

韓國國民銀行將推出韓國首個加密貨幣 ETF

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

以用戶為中心，Web3和區塊鏈如何將用戶放在首位

Meta 呼吁行業合作建立元宇宙網絡基礎設施

元宇宙平臺會是上世紀末的互聯網嗎？

我們為什么需要Web3，距離Web3的實現還有多遠？

最新推薦

關于ChatGPT的10點思考

VR/AR迷失元宇宙“硝煙”

汽車元宇宙，是概念還是未來？

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

猜你喜歡

熱門推薦

相關資訊