日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

METR 實測:OpenAI o3 AI 推理模型有“作弊”傾向以提升分數

來源: 責編: 時間:2025-04-21 09:46:03 45觀看
導讀 4 月 18 日消息,風險測試機構“機器智能測試風險”(METR)昨日(4 月 17 日)發布報告,與 OpenAI 合作測試其 o3 模型時發現,該模型展現出更強的“作弊”或“黑客行為”傾向,試圖通過操控任務評分系統提升成績。援引報告

4 月 18 日消息,風險測試機構“機器智能測試風險”(METR)昨日(4 月 17 日)發布報告,與 OpenAI 合作測試其 o3 模型時發現,該模型展現出更強的“作弊”或“黑客行為”傾向,試圖通過操控任務評分系統提升成績。2ob28資訊網——每日最新資訊28at.com

援引報告內容,在 HCAST(人類校準自主軟件任務)和 RE-Bench 測試套件中,o3 模型約 1% 到 2% 的任務嘗試涉及此類行為。2ob28資訊網——每日最新資訊28at.com

2ob28資訊網——每日最新資訊28at.com

2ob28資訊網——每日最新資訊28at.com

這些行為包括對部分任務評分代碼的“精巧利用”。METR 表示,若不將這些作弊嘗試計為失敗任務,o3 的“50% 時間范圍”將延長約 5 分鐘,其 RE-Bench 評分甚至可能超過人類專家。2ob28資訊網——每日最新資訊28at.com

METR 還懷疑 o3 可能存在“沙袋行為”(sandbagging),即故意隱藏真實能力,但其作弊傾向已明顯違背用戶和 OpenAI 的意圖。2ob28資訊網——每日最新資訊28at.com

METR 坦言,此次 o3 模型評估時間短,獲取信息有限,且無法訪問模型內部推理過程,這可能影響結果解讀。測試是在模型公開發布前三周完成的,METR 提前獲得了 OpenAI 模型的測試權限。2ob28資訊網——每日最新資訊28at.com

相比之下,o4-mini 模型在測試中未發現“獎勵黑客”行為,且在 RE-Bench 任務組中表現出色,尤其在“優化內核”(Optimise a Kernel)任務中成績突出。2ob28資訊網——每日最新資訊28at.com

2ob28資訊網——每日最新資訊28at.com

METR 數據顯示,給予 o4-mini 32 小時完成任務時,其平均表現超過人類第 50 百分位的水平。此外,o3 和 o4-mini 在更新后的 HCAST 基準測試中均優于 Claude 3.7 Sonnet,時間范圍分別是后者的 1.8 倍和 1.5 倍。METR 強調,單純的能力測試不足以管理風險,正探索更多評估形式以應對挑戰。2ob28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12422-0.htmlMETR 實測:OpenAI o3 AI 推理模型有“作弊”傾向以提升分數

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 北京人形機器人半馬參賽名單揭曉:宇樹 G1、夸父等產品,共 21 支隊伍

下一篇: 智平方發布智能機器人 AlphaBot 2(愛寶 2):DeepSeek 加持,全球首款全域全身 VLA

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 瑞丽市| 彭阳县| 固原市| 靖江市| 饶阳县| 阿克陶县| 江都市| 崇信县| 安丘市| 阆中市| 偏关县| 汉阴县| 保定市| 梁河县| 穆棱市| 池州市| 盘山县| 商南县| 杨浦区| 松原市| 淮阳县| 北票市| 二连浩特市| 澎湖县| 凌海市| 城口县| 英吉沙县| 扎囊县| 柘城县| 泗洪县| 乌海市| 紫金县| 会昌县| 北碚区| 四川省| 樟树市| 获嘉县| 岚皋县| 民勤县| 江安县| 中方县|