當前位置：首頁 > 元宇宙 > AI

微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

來源：責編：時間：2025-05-03 07:28:48 64觀看

導讀 5 月 1 日消息，微軟昨日（4 月 30 日）發布 Phi-4-reasoning 系列推理模型，通過監督微調 Phi-4，并利用 o3-mini 生成的高質量“可教導”提示數據集訓練，專為復雜推理任務設計。援引博文介紹，微軟本次共推出 Phi-4-reas

5 月 1 日消息，微軟昨日（4 月 30 日）發布 Phi-4-reasoning 系列推理模型，通過監督微調 Phi-4，并利用 o3-mini 生成的高質量“可教導”提示數據集訓練，專為復雜推理任務設計。

援引博文介紹，微軟本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型，官方稱該系列模型不僅延續了小型模型的高效特性，還在推理能力上實現重大突破。

該系列模型通過推理時間擴展（inference-time scaling）技術，擅長處理需要多步驟分解和內部反思的復雜任務，尤其在數學推理和代理型應用中表現突出，具備媲美大型前沿模型的潛力。

Phi-4-reasoning 是一款擁有 140 億參數的開源推理模型，通過監督微調（Supervised Fine-Tuning，SFT）Phi-4，結合 OpenAI o3-mini 的高質量推理演示數據，并充分利用額外計算資源，生成詳細的推理鏈條。

Phi-4-reasoning-plus 增強版通過強化學習（Reinforcement Learning，RL）進一步提升性能，tokens 用量比標準版多 1.5 倍，支持更高精度。

兩款模型在數學推理和博士級科學問題測試中，均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B，甚至在 AIME 2025（美國數學奧林匹克資格賽）中擊敗 6710 億參數的 DeepSeek-R1滿血模型。

Phi-4-mini-reasoning 專為計算資源有限的環境設計，是一款基于 Transformer 的緊湊型語言模型，優化用于數學推理。

該模型通過 DeepSeek-R1 生成的合成數據微調，能在低延遲場景下提供高質量的逐步問題解決方案。這款模型覆蓋從中學到博士級的百萬級多樣化數學問題，非常適合教育應用、嵌入式輔導和邊緣設備部署。

在多項數學基準測試中，其 3.8 億參數的表現超越 OpenThinker-7B 和 Llama-3.2-3B-instruct 等更大模型，甚至在部分測試中接近 OpenAI o1-mini 的水平。

本文鏈接：http://www.www897cc.com/showinfo-45-12692-0.html微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 2600 tokens s：Meta 發布 Llama API，攜手 Cerebras 打造最快 AI 推理解決方案

下一篇：網頁版 Claude AI 醞釀升級：將支持 MCP 定制鏈接，擴展第三方服務集成

標簽：

熱門焦點

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當數字人成為一種生意，我們更關心的是，他們如何賺到錢，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節，有一位虛擬美妝
中國銀保監管委提示：謹慎投資，勿做接盤俠

中國銀保監管委，發布一則風險提示，內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
“我沒搞懂元宇宙，但一天能賺9w塊”

作者：鄭宇軒最近幾個月，“元宇宙”爆火，除了 Facebook 改名為 Meta 高調進軍元宇宙外， BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間，元宇宙成為新風口，除了
借VR產業東風，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口，使人們可以在數字空間和物理空間自由穿梭。自2016年起
NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元，世界正在走向數字化。報告顯示，NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來
想進入web3.0？來看看哪些工作適合你

隨著對加密貨幣需求的增加，加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
NFT高玩必備：NFT分析工具大盤點

NFT市場的火熱讓越來越多的投資者投身其中，但當前的 NFT 生態系統存在幾個問題卻困擾了大多數人，如難以準確評估 NFT 項目的資產價格、缺乏 NFT 市場動態信息、
虛擬人行業研究報告

最早的虛擬人出現于 20 世紀 80 年代，受限于技術，當時的虛擬人制作以手繪為主。21 世紀初，隨著動捕、渲染等技術的逐步發展，虛擬人相關技術開始在影視領域逐漸普及

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

中國銀保監管委提示：謹慎投資，勿做接盤俠

“我沒搞懂元宇宙，但一天能賺9w塊”

借VR產業東風，江西搶灘布局“元宇宙”

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

在元宇宙開會是什么樣一種體驗

想進入web3.0？來看看哪些工作適合你

NFT高玩必備：NFT分析工具大盤點

虛擬人行業研究報告

最新推薦

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

元宇宙將會如何塑造未來的工作方式？

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

如何在元宇宙中建立品牌忠誠度

趙長鵬預測SoicalFi為今年主要驅動力，新的機會在哪里？

Ceramic：為Web3.0社交應用打造的中間件

猜你喜歡

熱門推薦

相關資訊