日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

微軟發布 Phi-4 系列小語言 AI 推理模型,AIME 2025 跑分超滿血版 Deepseek R1

來源: 責編: 時間:2025-05-03 07:28:48 64觀看
導讀 5 月 1 日消息,微軟昨日(4 月 30 日)發布 Phi-4-reasoning 系列推理模型,通過監督微調 Phi-4,并利用 o3-mini 生成的高質量“可教導”提示數據集訓練,專為復雜推理任務設計。援引博文介紹,微軟本次共推出 Phi-4-reas

5 月 1 日消息,微軟昨日(4 月 30 日)發布 Phi-4-reasoning 系列推理模型,通過監督微調 Phi-4,并利用 o3-mini 生成的高質量“可教導”提示數據集訓練,專為復雜推理任務設計。nll28資訊網——每日最新資訊28at.com

援引博文介紹,微軟本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方稱該系列模型不僅延續了小型模型的高效特性,還在推理能力上實現重大突破。nll28資訊網——每日最新資訊28at.com

nll28資訊網——每日最新資訊28at.com

該系列模型通過推理時間擴展(inference-time scaling)技術,擅長處理需要多步驟分解和內部反思的復雜任務,尤其在數學推理和代理型應用中表現突出,具備媲美大型前沿模型的潛力。nll28資訊網——每日最新資訊28at.com

Phi-4-reasoning 是一款擁有 140 億參數的開源推理模型,通過監督微調(Supervised Fine-Tuning,SFT)Phi-4,結合 OpenAI o3-mini 的高質量推理演示數據,并充分利用額外計算資源,生成詳細的推理鏈條。nll28資訊網——每日最新資訊28at.com

nll28資訊網——每日最新資訊28at.com

Phi-4-reasoning-plus 增強版通過強化學習(Reinforcement Learning,RL)進一步提升性能,tokens 用量比標準版多 1.5 倍,支持更高精度。nll28資訊網——每日最新資訊28at.com

nll28資訊網——每日最新資訊28at.com

兩款模型在數學推理和博士級科學問題測試中,均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B,甚至在 AIME 2025(美國數學奧林匹克資格賽)中擊敗 6710 億參數的 DeepSeek-R1滿血模型。nll28資訊網——每日最新資訊28at.com

Phi-4-mini-reasoning 專為計算資源有限的環境設計,是一款基于 Transformer 的緊湊型語言模型,優化用于數學推理。nll28資訊網——每日最新資訊28at.com

nll28資訊網——每日最新資訊28at.com

該模型通過 DeepSeek-R1 生成的合成數據微調,能在低延遲場景下提供高質量的逐步問題解決方案。這款模型覆蓋從中學到博士級的百萬級多樣化數學問題,非常適合教育應用、嵌入式輔導和邊緣設備部署。nll28資訊網——每日最新資訊28at.com

在多項數學基準測試中,其 3.8 億參數的表現超越 OpenThinker-7B 和 Llama-3.2-3B-instruct 等更大模型,甚至在部分測試中接近 OpenAI o1-mini 的水平。nll28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12692-0.html微軟發布 Phi-4 系列小語言 AI 推理模型,AIME 2025 跑分超滿血版 Deepseek R1

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2600 tokens s:Meta 發布 Llama API,攜手 Cerebras 打造最快 AI 推理解決方案

下一篇: 網頁版 Claude AI 醞釀升級:將支持 MCP 定制鏈接,擴展第三方服務集成

標簽:
  • 熱門焦點
  • 一個視頻漲粉百萬,柳夜熙們能成為元宇宙的“船票”嗎?

    當數字人成為一種生意,我們更關心的是,他們如何賺到錢,以及這意味著什么?01#“柳夜熙”爆火之后不知道大家還記不記得,去年10月31日萬圣節,有一位虛擬美妝
  • 中國銀保監管委提示:謹慎投資,勿做接盤俠

    中國銀保監管委,發布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • 借VR產業東風,江西搶灘布局“元宇宙”

    自2016年起就在VR上傾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口,使人們可以在數字空間和物理空間自由穿梭。自2016年起
  • NFT盜竊案:為什么NFT市場被盜竊和黑客所困擾?

    Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元,世界正在走向數字化。報告顯示,NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
  • 在元宇宙開會是什么樣一種體驗

    空間就是一切還記得面對面的會議嗎?就在不久前,與會者需要飛到遙遠的目的地,并進行鼓舞人心的對話、網絡、免費食物,甚至可能會有一兩個很好的小組討論。隨之而來
  • 想進入web3.0?來看看哪些工作適合你

    隨著對加密貨幣需求的增加,加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
  • NFT高玩必備:NFT分析工具大盤點

    NFT市場的火熱讓越來越多的投資者投身其中,但當前的 NFT 生態系統存在幾個問題卻困擾了大多數人,如難以準確評估 NFT 項目的資產價格、缺乏 NFT 市場動態信息、
  • 虛擬人行業研究報告

    最早的虛擬人出現于 20 世紀 80 年代,受限于技術,當時的虛擬人制作以手繪為主。21 世紀初,隨著動捕、渲染等技術的逐步發展,虛擬人相關技術開始在影視領域逐漸普及
Top 主站蜘蛛池模板: 司法| 澎湖县| 额济纳旗| 敖汉旗| 万载县| 茌平县| 阳泉市| 岢岚县| 连州市| 灵丘县| 惠州市| 准格尔旗| 始兴县| 两当县| 临潭县| 肇州县| 衡阳市| 南丹县| 巫山县| 札达县| 梓潼县| 宝兴县| 衡阳市| 沁阳市| 靖江市| 敦化市| 句容市| 富锦市| 伊吾县| 曲麻莱县| 璧山县| 新化县| 阿拉善左旗| 建平县| 凤凰县| 疏勒县| 洛宁县| 贵南县| 江西省| 乌鲁木齐县| 隆德县|