微軟近期在人工智能領(lǐng)域邁出了重要一步,于4月30日正式發(fā)布了Phi-4-reasoning系列推理模型。這一系列模型專為應(yīng)對(duì)復(fù)雜推理任務(wù)而設(shè)計(jì),通過(guò)監(jiān)督微調(diào)Phi-4,并利用o3-mini生成的高質(zhì)量“可教導(dǎo)”提示數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)現(xiàn)了推理能力的顯著提升。
本次發(fā)布的Phi-4-reasoning系列包含三款模型:Phi-4-reasoning、Phi-4-reasoning-plus以及Phi-4-mini-reasoning。據(jù)微軟官方介紹,這些模型不僅繼承了小型模型的高效特性,還在推理能力上取得了重大突破。它們通過(guò)推理時(shí)間擴(kuò)展技術(shù),能夠處理需要多步驟分解和內(nèi)部反思的復(fù)雜任務(wù),尤其在數(shù)學(xué)推理和代理型應(yīng)用中表現(xiàn)卓越。
Phi-4-reasoning模型是一款擁有140億參數(shù)的開(kāi)源推理模型。它結(jié)合了OpenAI o3-mini的高質(zhì)量推理演示數(shù)據(jù),通過(guò)監(jiān)督微調(diào)Phi-4,并利用額外計(jì)算資源,生成了詳細(xì)的推理鏈條。這一特性使得Phi-4-reasoning在處理復(fù)雜推理任務(wù)時(shí),能夠展現(xiàn)出強(qiáng)大的解析和推理能力。
而Phi-4-reasoning-plus增強(qiáng)版則進(jìn)一步通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)提升了性能。與標(biāo)準(zhǔn)版相比,它的tokens用量增加了1.5倍,從而支持更高精度的推理任務(wù)。兩款模型在數(shù)學(xué)推理和博士級(jí)科學(xué)問(wèn)題測(cè)試中,均超越了OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B等模型,甚至在AIME 2025(美國(guó)數(shù)學(xué)奧林匹克資格賽)中擊敗了擁有6710億參數(shù)的DeepSeek-R1滿血模型。
針對(duì)計(jì)算資源有限的環(huán)境,微軟還推出了Phi-4-mini-reasoning模型。這是一款基于Transformer的緊湊型語(yǔ)言模型,專門(mén)優(yōu)化用于數(shù)學(xué)推理。它通過(guò)DeepSeek-R1生成的合成數(shù)據(jù)進(jìn)行了微調(diào),能夠在低延遲場(chǎng)景下提供高質(zhì)量的逐步問(wèn)題解決方案。這款模型覆蓋了從中學(xué)到博士級(jí)的百萬(wàn)級(jí)多樣化數(shù)學(xué)問(wèn)題,非常適合教育應(yīng)用、嵌入式輔導(dǎo)以及邊緣設(shè)備部署。
在多項(xiàng)數(shù)學(xué)基準(zhǔn)測(cè)試中,Phi-4-mini-reasoning模型憑借其3.8億參數(shù)的表現(xiàn),超越了OpenThinker-7B和Llama-3.2-3B-instruct等更大模型,甚至在部分測(cè)試中接近了OpenAI o1-mini的水平。這一成績(jī)充分展示了Phi-4-mini-reasoning在高效性和準(zhǔn)確性方面的卓越表現(xiàn)。
微軟Phi-4-reasoning系列的發(fā)布,無(wú)疑為人工智能領(lǐng)域注入了新的活力。這一系列模型不僅在推理能力上取得了重大突破,還兼顧了高效性和實(shí)用性,為未來(lái)的應(yīng)用和發(fā)展提供了廣闊的空間。
本文鏈接:http://www.www897cc.com/showinfo-45-12729-0.html微軟Phi-4推理模型發(fā)布,小型AI能否撼動(dòng)大型模型地位?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 微博辟謠董某某不實(shí)傳聞,多賬號(hào)被禁言處理
下一篇: 英偉達(dá)黃仁勛:中美AI競(jìng)爭(zhēng)激烈,華為實(shí)力強(qiáng)大不可忽視