日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

數(shù)月 → 幾天:OpenAI 被曝縮水模型安全測(cè)試,AI 競(jìng)賽埋下隱患

來(lái)源: 責(zé)編: 時(shí)間:2025-04-15 07:13:39 44觀看
導(dǎo)讀 4 月 12 日消息,金融時(shí)報(bào)(FT)昨日(4 月 11 日)發(fā)布博文,報(bào)道稱 OpenAI 大幅壓縮最新大型語(yǔ)言模型(LLM)安全測(cè)試時(shí)間,此前需要數(shù)月時(shí)間,而最新 o3 模型僅有幾天時(shí)間。競(jìng)爭(zhēng)驅(qū)動(dòng),安全讓步據(jù)八位知情人士透露,OpenAI 大幅壓縮

4 月 12 日消息,金融時(shí)報(bào)(FT)昨日(4 月 11 日)發(fā)布博文,報(bào)道稱 OpenAI 大幅壓縮最新大型語(yǔ)言模型(LLM)安全測(cè)試時(shí)間,此前需要數(shù)月時(shí)間,而最新 o3 模型僅有幾天時(shí)間。u5W28資訊網(wǎng)——每日最新資訊28at.com

競(jìng)爭(zhēng)驅(qū)動(dòng),安全讓步u5W28資訊網(wǎng)——每日最新資訊28at.com

據(jù)八位知情人士透露,OpenAI 大幅壓縮模型的安全測(cè)試時(shí)間,留給員工和第三方測(cè)試團(tuán)隊(duì)“評(píng)估”(evaluations,即測(cè)試模型風(fēng)險(xiǎn)和性能)時(shí)間僅有數(shù)天時(shí)間,而此前通常會(huì)耗時(shí)數(shù)月時(shí)間。u5W28資訊網(wǎng)——每日最新資訊28at.com

援引博文介紹,OpenAI 面臨來(lái)自 Meta、Google 及 xAI 等對(duì)手的激烈競(jìng)爭(zhēng),需快速推出新模型以維持市場(chǎng)優(yōu)勢(shì)。o3 模型計(jì)劃最早下周發(fā)布,留給測(cè)試者安全檢查時(shí)間不到一周,而此前 GPT-4 的測(cè)試期長(zhǎng)達(dá)六個(gè)月。u5W28資訊網(wǎng)——每日最新資訊28at.com

一位測(cè)試過(guò) GPT-4 的人士透露,過(guò)去安全測(cè)試更徹底,某些危險(xiǎn)能力在測(cè)試兩個(gè)月后才被發(fā)現(xiàn),而如今競(jìng)爭(zhēng)壓力迫使公司追求速度,忽視潛在風(fēng)險(xiǎn)。u5W28資訊網(wǎng)——每日最新資訊28at.com

測(cè)試不足,監(jiān)管缺位u5W28資訊網(wǎng)——每日最新資訊28at.com

全球目前尚未統(tǒng)一 AI 安全測(cè)試標(biāo)準(zhǔn),但歐盟《AI 法案》將于今年晚些時(shí)候上線,要求企業(yè)對(duì)其最強(qiáng)大的模型進(jìn)行安全測(cè)試。u5W28資訊網(wǎng)——每日最新資訊28at.com

AI Futures Project 負(fù)責(zé)人 Daniel Kokotajlo 表示,由于缺乏強(qiáng)制監(jiān)管,企業(yè)不會(huì)主動(dòng)披露模型的危險(xiǎn)能力,競(jìng)爭(zhēng)壓力進(jìn)一步加劇了風(fēng)險(xiǎn)。u5W28資訊網(wǎng)——每日最新資訊28at.com

OpenAI 曾承諾構(gòu)建定制模型版本,測(cè)試其潛在濫用風(fēng)險(xiǎn),例如是否能協(xié)助制造更具傳染性的生物病毒。u5W28資訊網(wǎng)——每日最新資訊28at.com

這種測(cè)試需投入大量資源,包括聘請(qǐng)外部專家、創(chuàng)建特定數(shù)據(jù)集并進(jìn)行“微調(diào)”(fine-tuning)。但 OpenAI 僅對(duì)較老舊的模型進(jìn)行有限微調(diào),最新模型如 o1 和 o3-mini 未全面測(cè)試。前 OpenAI 安全研究員 Steven Adler 批評(píng),若不兌現(xiàn)測(cè)試承諾,公眾有權(quán)知情。u5W28資訊網(wǎng)——每日最新資訊28at.com

u5W28資訊網(wǎng)——每日最新資訊28at.com

安全測(cè)試未覆蓋最終模型u5W28資訊網(wǎng)——每日最新資訊28at.com

另一問(wèn)題在于,安全測(cè)試通常基于早期“檢查點(diǎn)”(checkpoints),而非最終發(fā)布模型。一位前 OpenAI 技術(shù)人員表示,發(fā)布未經(jīng)測(cè)試的更新模型是“不良做法”,而 OpenAI 辯稱,其檢查點(diǎn)與最終模型“基本一致”,并通過(guò)自動(dòng)化測(cè)試提高效率,確保安全。u5W28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12245-0.html數(shù)月 → 幾天:OpenAI 被曝縮水模型安全測(cè)試,AI 競(jìng)賽埋下隱患

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 字節(jié)跳動(dòng)推出 VAPO 框架:突破 AI 推理極限,Qwen2.5-32B 提分 12 倍超 Deepseek-R1

下一篇: 谷歌 Gemini AI 新功能 Circle Screen 曝光:圈選截屏特定區(qū)域,實(shí)現(xiàn)精準(zhǔn)搜索

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
Top 主站蜘蛛池模板: 白山市| 富阳市| 琼中| 宁远县| 平乐县| 巨野县| 齐齐哈尔市| 分宜县| 山西省| 汉源县| 苏州市| 遵义市| 清徐县| 四子王旗| 南川市| 双鸭山市| 城口县| 盐边县| 肥乡县| 临汾市| 桦南县| 南丰县| 尉氏县| 弋阳县| 南昌县| 姜堰市| 阿拉善左旗| 澳门| 永和县| 镇康县| 延安市| 安顺市| 九江县| 宕昌县| 衡山县| 开鲁县| 泸定县| 通河县| 中江县| 宾川县| 白河县|