9 月 21 日消息,在 9 月 18 日的華為全聯接大會 2025 上,華為技術有限公司與浙江大學聯合發布了國內首個基于昇騰千卡算力平臺的 DeepSeek-R1-Safe 基礎大模型。

浙江大學計算機科學與技術學院院長、區塊鏈與數據安全全國重點實驗室常務副主任任奎詳細介紹了 DeepSeek-R1-Safe-671B 基礎大模型的核心創新。
據介紹,研發團隊從底層入手,構建了一套覆蓋“高質量安全語料 — 平衡優化的安全訓練 — 全鏈路自主創新軟硬件平臺”的全流程安全后訓練框架。

在算力平臺搭建方面,團隊首次實現基于昇騰千卡算力平臺的千億級參數滿血版大模型安全訓練,系統性地解決了訓練環境中的關鍵問題,構建了服務器間環境依賴同步、數據與權重共享、協同訓練推理等一系列開發工具。
測試結果表明,DeepSeek-R1-Safe 針對有毒有害言論、政治敏感內容、違法行為教唆等 14 個維度的普通有害問題整體防御成功率近 100%,針對情境假設、角色扮演、加密編碼等多個越獄模式整體防御成功率超過 40%。其綜合安全防御能力達 83%,在同樣測試設置下超過 Qwen-235B 和 DeepSeek-R1-671B 等多個同期模型 8% 至 15%。

此外,在 MMLU、GSM8K、CEVAL 等通用能力基準測試中,DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能損耗在 1% 以內。這些結果表明 DeepSeek-R1-Safe 不僅顯著提升了安全防護能力,也保障了模型的可用性,達成了安全能力與通用性能之間的有效平衡。

中國工程院院士陳純指出,浙江大學計算機科學與技術學院已組建起一支涵蓋多位海內外優秀青年人才的科研團隊,并已成功依托昇騰生態,實現了自主全流程后訓練框架,完成了國內首次千卡集群大模型安全訓練。這次 DeepSeek-R1-Safe 的發布旨在打造安全可信的示范應用,推動大模型安全能力與產業生態協同發展。他表示希望團隊未來與華為展開更深入合作,共同推動我國 AI 技術進步。

華為昇騰計算業務總裁張迪煊表示,華為在此次大會上也正式推出了昇騰新一代 AI 硬件與全系列軟件開源開放戰略,覆蓋編譯器、運行時驅動等核心組件,致力于通過深度開放協作,聯合高校與產業伙伴共同推動基礎軟件創新與 AI 安全能力建設。

注意到,該模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多個社區全面開源。
Gitee 地址:https://gitee.com/ZJUsafe/deep-seek-r1-safe。
GitHub 地址:https://github.com/ZJUAISafety/DeepSeek-R1-Safe
相關閱讀:
《DeepSeek 創始人梁文鋒在〈自然〉雜志回應質疑,R1 訓練真 29.4 萬美金》
《DeepSeek 聲明:防范冒用“深度求索”名義實施詐騙》
《DeepSeek-R1 論文登上〈自然〉封面,通訊作者為梁文鋒》
本文鏈接:http://www.www897cc.com/showinfo-45-27942-0.html華為、浙大發布 DeepSeek-R1-Safe 基礎大模型:基于昇騰千卡算力平臺,破解 AI“安全與性能”難題
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com