日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

智譜發布新一代開源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 R1

來源: 責編: 時間:2025-04-17 06:44:23 40觀看
導讀 4 月 15 日消息,智譜昨日(4 月 14 日)發布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 億參數,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。該系列模型共有 GLM-4

4 月 15 日消息,智譜昨日(4 月 14 日)發布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 億參數,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。cG528資訊網——每日最新資訊28at.com

該系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。cG528資訊網——每日最新資訊28at.com

GLM-4-32B-Base-0414cG528資訊網——每日最新資訊28at.com

在預訓練階段,該模型采用 15T 高質量數據,其中包含大量推理類的合成數據,這為后續的強化學習擴展打下了基礎。cG528資訊網——每日最新資訊28at.com

cG528資訊網——每日最新資訊28at.com

在后訓練階段,除了針對對話場景進行了人類偏好對齊外,團隊還通過拒絕采樣和強化學習等技術強化了模型在指令遵循、工程代碼、函數調用方面的效果,加強了智能體任務所需的原子能力。cG528資訊網——每日最新資訊28at.com

GLM-4-32B-0414 在工程代碼、Artifacts 生成、函數調用、搜索問答及報告等方面都取得了不錯的效果,部分 Benchmark 甚至可以媲美更大規模的 GPT-4o、DeepSeek-V3-0324(671B)等模型。cG528資訊網——每日最新資訊28at.com

cG528資訊網——每日最新資訊28at.com

GLM-Z1-32B-0414cG528資訊網——每日最新資訊28at.com

該模型是具有深度思考能力的推理模型,在 GLM-4-32B-0414 的基礎上,通過冷啟動和擴展強化學習,以及在數學、代碼和邏輯等任務上對模型的進一步訓練得到的。cG528資訊網——每日最新資訊28at.com

cG528資訊網——每日最新資訊28at.com

相對于基礎模型,GLM-Z1-32B-0414 顯著提升了數理能力和解決復雜任務的能力。在訓練的過程中,該團隊還引入了基于堆棧排序反饋的通用強化學習,進一步增強了模型的通用能力。cG528資訊網——每日最新資訊28at.com

GLM-Z1-Rumination-32B-0414cG528資訊網——每日最新資訊28at.com

該模型是具有沉思能力的深度推理模型(對標 Open AI 的 Deep Research)。cG528資訊網——每日最新資訊28at.com

沉思模型通過更長時間的深度思考來解決更開放和復雜的問題(例如:撰寫兩個城市 AI 發展對比情況,以及未來的發展規劃),結合搜索工具處理復雜任務,并經過利用多種規則型獎勵來指導和擴展端到端強化學習訓練得到。cG528資訊網——每日最新資訊28at.com

GLM-Z1-9B-0414cG528資訊網——每日最新資訊28at.com

這是一個開源 9B 小尺寸模型,在數學推理和通用任務中依然展現出極為優秀的能力,其整體表現已處于同尺寸開源模型中的領先水平。cG528資訊網——每日最新資訊28at.com

cG528資訊網——每日最新資訊28at.com

測試結果cG528資訊網——每日最新資訊28at.com

GLM-4 系列在多項基準測試中表現優異。例如,在 IFEval 指令遵循測試中得分 87.6;在 TAU-Bench 任務自動化測試中,零售場景得分 68.7,航空場景得分 51.2;在 SimpleQA 搜索增強問答測試中得分 88.1。cG528資訊網——每日最新資訊28at.com

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代碼修復方面,GLM-4 在 SWE-bench 測試中的成功率達 33.8%。采用 MIT 許可的 GLM-4 降低了計算成本,為研究和企業提供了高性能 AI 解決方案。cG528資訊網——每日最新資訊28at.com

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

附上參考地址cG528資訊網——每日最新資訊28at.com

GLM-4-0414 系列模型cG528資訊網——每日最新資訊28at.com

THUDM Releases GLM 4: A 32B Parameter Model Competing Head-to-Head with GPT-4o and DeepSeek-V3cG528資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12317-0.html智譜發布新一代開源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 R1

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 人工智能開發平臺 Hugging Face 收購 Pollen Robotics,進軍人形機器人市場

下一篇: 真·質之選:北京現代OE四驅,讓安全與舒適超越配置堆砌

標簽:
  • 熱門焦點
  • 新周期,誰在堅守窄門?

    來源:錦緞今日的投資者恐怕已經忘記了,在OpenAI創造出ChatGPT這一殺器的前夜,生成式AI也曾經是一道窄門,窄到連馬斯克都差點失去了信心。在當時的輿論眼中,AGI的道路不夠性感,不夠
  • 這一超級富豪“逆襲”,身價大增4330億

    來源:侃見財經互聯網的突圍沒有“終點”。在快節奏的商業環境下,不斷的試錯成了互聯網企業的標配,一年一個風口,一個風口造就一個熱點,但是回頭來看,最終受益的還是身處
  • 數字虛擬人23年最新變化!

    作者:小資來源:米塔之家自2021年元宇宙“爆炸”后,作為現實世界連接元宇宙的媒介之一,大批虛擬人跑步入場。到了2022年底,據天眼查數據顯示,我國目前企業名稱或經營范圍
  • 亞馬遜AIGC全家桶來襲,巨頭AI大亂戰都有什么殺手锏

    此前,亞馬遜云科技發布多款AIGC產品,其中包括AI大模型服務Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、軟件
  • “任何國產元宇宙都是假元宇宙”

    上個月,華語樂壇的優質偶像之一,DOTA2資深玩家林俊杰,在國外元宇宙產品分布式大陸(Decentraland)上買了三塊虛擬地產,花了12.3萬美元(也就是人民幣接近80萬)。截至目
  • 韓國主權基金增加對硅谷初創公司投資 押注元宇宙和人工智能

    韓國投資公司(KIC)CEO Seoungho Jin預計,該公司在舊金山的辦事處今年將擴招人手,探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • 本周NFT領域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時,美聯社因其最新的NFT銷售被推到了風口浪尖,而Opensea正面臨
  • 超級賬本Julian Gordon:聯盟鏈與公鏈的競爭不是非此即彼

    在2021年《福布斯》區塊鏈50強榜單中,29家企業使用Hyperledger超級賬本技術,占比近60%。同年,研究機構Blockdata發布了的調查報告顯示,訪問Top100上市公司中,有 81
Top 主站蜘蛛池模板: 岱山县| 鄂托克前旗| 应城市| 如东县| 大新县| 三原县| 开原市| 肃南| 东兴市| 尉氏县| 涞水县| 屏山县| 望都县| 喀喇沁旗| 临沧市| 巴彦淖尔市| 新营市| 阿巴嘎旗| 饶河县| 娄底市| 河西区| 宁国市| 定结县| 商洛市| 平安县| 左贡县| 遵义县| 澄江县| 田林县| 正阳县| 宜昌市| 娱乐| 定日县| 溧阳市| 陈巴尔虎旗| 建水县| 秀山| 潜江市| 梓潼县| 延寿县| 都江堰市|