日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

微軟發布 Phi-4 系列小語言 AI 推理模型,AIME 2025 跑分超滿血版 Deepseek R1

來源: 責編: 時間:2025-05-03 07:28:48 33觀看
導讀 5 月 1 日消息,微軟昨日(4 月 30 日)發布 Phi-4-reasoning 系列推理模型,通過監督微調 Phi-4,并利用 o3-mini 生成的高質量“可教導”提示數據集訓練,專為復雜推理任務設計。援引博文介紹,微軟本次共推出 Phi-4-reas

5 月 1 日消息,微軟昨日(4 月 30 日)發布 Phi-4-reasoning 系列推理模型,通過監督微調 Phi-4,并利用 o3-mini 生成的高質量“可教導”提示數據集訓練,專為復雜推理任務設計。QII28資訊網——每日最新資訊28at.com

援引博文介紹,微軟本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方稱該系列模型不僅延續了小型模型的高效特性,還在推理能力上實現重大突破。QII28資訊網——每日最新資訊28at.com

QII28資訊網——每日最新資訊28at.com

該系列模型通過推理時間擴展(inference-time scaling)技術,擅長處理需要多步驟分解和內部反思的復雜任務,尤其在數學推理和代理型應用中表現突出,具備媲美大型前沿模型的潛力。QII28資訊網——每日最新資訊28at.com

Phi-4-reasoning 是一款擁有 140 億參數的開源推理模型,通過監督微調(Supervised Fine-Tuning,SFT)Phi-4,結合 OpenAI o3-mini 的高質量推理演示數據,并充分利用額外計算資源,生成詳細的推理鏈條。QII28資訊網——每日最新資訊28at.com

QII28資訊網——每日最新資訊28at.com

Phi-4-reasoning-plus 增強版通過強化學習(Reinforcement Learning,RL)進一步提升性能,tokens 用量比標準版多 1.5 倍,支持更高精度。QII28資訊網——每日最新資訊28at.com

QII28資訊網——每日最新資訊28at.com

兩款模型在數學推理和博士級科學問題測試中,均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B,甚至在 AIME 2025(美國數學奧林匹克資格賽)中擊敗 6710 億參數的 DeepSeek-R1滿血模型。QII28資訊網——每日最新資訊28at.com

Phi-4-mini-reasoning 專為計算資源有限的環境設計,是一款基于 Transformer 的緊湊型語言模型,優化用于數學推理。QII28資訊網——每日最新資訊28at.com

QII28資訊網——每日最新資訊28at.com

該模型通過 DeepSeek-R1 生成的合成數據微調,能在低延遲場景下提供高質量的逐步問題解決方案。這款模型覆蓋從中學到博士級的百萬級多樣化數學問題,非常適合教育應用、嵌入式輔導和邊緣設備部署。QII28資訊網——每日最新資訊28at.com

在多項數學基準測試中,其 3.8 億參數的表現超越 OpenThinker-7B 和 Llama-3.2-3B-instruct 等更大模型,甚至在部分測試中接近 OpenAI o1-mini 的水平。QII28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12692-0.html微軟發布 Phi-4 系列小語言 AI 推理模型,AIME 2025 跑分超滿血版 Deepseek R1

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2600 tokens s:Meta 發布 Llama API,攜手 Cerebras 打造最快 AI 推理解決方案

下一篇: 網頁版 Claude AI 醞釀升級:將支持 MCP 定制鏈接,擴展第三方服務集成

標簽:
  • 熱門焦點
  • 數字人的新革命,BAT的“沖高”戰場

    來源:劉曠ChatGPT橫空出世,讓人們看到了數字人的另一種可能,將ChatGPT與虛擬數字人融合,研發出更加智能化、擬人化的虛擬數字人成為數字人廠商的新命題、新方向。2月份,嶺南股份
  • 藍標虧錢、Meta裁員:天下秀還值得砸錢元宇宙嗎?

    日前,天下秀數字科技集團正式公布了2022年報及2023年一季報。報告顯示,2022年天下秀實現營收41.29億元,同比下滑8.48%;歸母凈利潤1.8億元,同比下滑49.2%,幾乎出現了盈利腰斬的態勢
  • 茅臺的元宇宙App火了,也被罵慘了

    元宇宙從概念走向大眾生活,并不是一件簡單的事情。技術、世界觀、填充內容、載體形式,每一個環節都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
  • 從虛擬餐廳到虛擬時裝秀,行業巨頭掀起元宇宙商標注冊潮

    自從 Facebook 更名為 Meta 后,關于元宇宙的討論愈發激烈,這一詞匯也越來越多的出現在我們的視野里。這是一個非常有趣的話題。伴隨著爭論,有些人認為是馬克·扎
  • 元宇宙社交時代,華麗歸來的超級QQ秀重構虛擬社交場景

    作者:狂人 不知不覺間,QQ已經迎來了第23個生日。作為國內社交平臺的起點,QQ可謂是睥睨全網,不僅有龐大的用戶群體,還將虛擬形象及QQ整合成在線虛擬社區,開啟了時髦
  • 用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

    你可能聽說過不可偽造的代幣,或NFTs。NFTs是數字代幣,代表完全獨特的項目的所有權;存儲在區塊鏈中并可追蹤,它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
  • 大廠打造元宇宙平臺的業務重心是什么?

    知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告,其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上,在2021年的最后一個季度,包括Meta、英偉達、
  • MR——元宇宙平臺的下一代入口

    作為“元宇宙”的領頭羊,Meta的一舉一動都受到業內的高度關注。華爾街見聞提及,2月17日周四,Facebook母公司Meta在透露,其混合現實技術(MR)將在幾年后實現,讓人們對元
  • 初探元宇宙

    2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺Roblox將“元宇宙”概念放入招股書中,被稱為“元宇宙”第一股后,Facebook更名為Meta, 引發全球范圍內
Top 主站蜘蛛池模板: 漳平市| 淮滨县| 两当县| 南开区| 博客| 紫阳县| 海淀区| 海城市| 玛纳斯县| 资中县| 拜城县| 新疆| 定边县| 女性| 武夷山市| 达州市| 剑川县| 铜陵市| 乡城县| 宕昌县| 双流县| 普宁市| 勐海县| 汾阳市| 平定县| 汉沽区| 竹北市| 龙门县| 宜宾市| 岱山县| 南昌县| 甘泉县| 青川县| 平遥县| 平乐县| 大理市| 元氏县| 鄂州市| 巴青县| 滦平县| 东海县|