日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

可評估大模型安全性,MLPerf 基準測試開發方 MLCommons 發布 AI Safety 測試 v0.5 版

來源: 責編: 時間:2024-04-24 17:29:40 243觀看
導讀 4 月 18 日消息,全球人工智能社區、MLPerf 基準測試開發方 MLCommons 近日發布了其 AI Safety 人工智能安全基準測試的 v0.5 概念驗證版本。人工智能的蓬勃發展不可避免地帶來了一系列安全問題,近日就報道了 La

4 月 18 日消息,全球人工智能社區、MLPerf 基準測試開發方 MLCommons 近日發布了其 AI Safety 人工智能安全基準測試的 v0.5 概念驗證版本。VqN28資訊網——每日最新資訊28at.com

人工智能的蓬勃發展不可避免地帶來了一系列安全問題,近日就報道了 LastPass 員工遭遇音頻深度偽造攻擊的事件。AI Safety 可幫助模型開發方筑起更牢靠的安全“圍欄”。VqN28資訊網——每日最新資訊28at.com

AI Safety 基準測試由集合了行業技術專家、學術研究人員、政策標準代表和社會活動家的同名工作組制定,旨在通過大型語言模型對各類危險提示詞的反應衡量這些模型的安全性。VqN28資訊網——每日最新資訊28at.com

AI Safety 基準測試將通過其 v0.5 版本搜集社區的測試結果和反饋意見,正式的 v1.0 版本預計于今年晚些時候推出。VqN28資訊網——每日最新資訊28at.com

在 v0.5 版本中 AI Safety 基準測試的重點放在通用聊天文本模型上,v1.0 版本將更新針對圖像生成模型測試的概念驗證,同時提出交互式代理模型安全測試的早期想法。VqN28資訊網——每日最新資訊28at.com

AI Safety 基準測試 v0.5 版本包含超過 43000 個測試提示詞,采用來自 Meta 的 Llama Guard 對大模型的危險提示響應進行評估。VqN28資訊網——每日最新資訊28at.com

這些提示詞將一系列通用模板(如“我想知道如何”)和描述危險場景的短語(如“制造炸彈”)結合,覆蓋 7 種安全危害類型,未來還將擴展到至少 13 種。VqN28資訊網——每日最新資訊28at.com

最終,AI Safety 基準測試將測試結果轉化為從高至低的 5 個安全評級,以方便理解。VqN28資訊網——每日最新資訊28at.com

VqN28資訊網——每日最新資訊28at.com

▲MLCommons AI Safety 基準測試成績可視化案例

本文鏈接:http://www.www897cc.com/showinfo-45-4091-0.html可評估大模型安全性,MLPerf 基準測試開發方 MLCommons 發布 AI Safety 測試 v0.5 版

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Meta AI 全球市場擴張,并上線網頁版 meta.ai

下一篇: 月之暗面 Kimi 智能助手升級:支持新模型、搜索結果溯源

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 延川县| 霍山县| 务川| 安远县| 平江县| 明水县| 南华县| 灯塔市| 昌图县| 晴隆县| 德化县| 庄浪县| 潢川县| 永和县| 江门市| 叶城县| 杭锦后旗| 韩城市| 陈巴尔虎旗| 汉沽区| 桃源县| 桐柏县| 长寿区| 中宁县| 弥渡县| 罗山县| 桓台县| 静海县| 安多县| 连平县| 申扎县| 东平县| 兴化市| 昌宁县| 乌鲁木齐市| 淳化县| 雷波县| 贞丰县| 巴南区| 尤溪县| 苍南县|