4月23日消息,微軟研究院近日公布了一項(xiàng)令人矚目的技術(shù)成果——Phi-3系列AI模型。這一系列模型包含三個(gè)版本:mini(38億參數(shù))、small(70億參數(shù))以及medium(140億參數(shù)),分別滿足不同場(chǎng)景和需求的應(yīng)用。
據(jù)微軟技術(shù)報(bào)告顯示,擁有38億參數(shù)的phi-3-mini模型在經(jīng)過高達(dá)3.3萬(wàn)億個(gè)tokens的訓(xùn)練后,其在基準(zhǔn)測(cè)試中的跑分性能已經(jīng)成功超越了Mixtral8x7B和GPT-3.5等業(yè)界知名模型。這一成就彰顯了微軟在人工智能領(lǐng)域的深厚實(shí)力和創(chuàng)新能力。
phi-3-mini模型不僅可以部署在高性能計(jì)算機(jī)上,還可以輕松應(yīng)用于手機(jī)等便攜設(shè)備。該模型在27億參數(shù)的Phi-2模型基礎(chǔ)上進(jìn)行了進(jìn)一步優(yōu)化,通過整合嚴(yán)格過濾的網(wǎng)絡(luò)數(shù)據(jù)和合成數(shù)據(jù),提升了模型的通用性和準(zhǔn)確性。
盡管phi-3-mini模型在語(yǔ)言理解和推理能力方面表現(xiàn)出色,甚至可以媲美更大參數(shù)的AI模型,但微軟也坦誠(chéng)地指出,在某些特定任務(wù),如TriviaQA等,其性能仍然受到模型規(guī)模的限制。然而,這并不影響phi-3-mini模型在眾多領(lǐng)域中的廣泛應(yīng)用前景。
此外,微軟還公布了phi-3-small和phi-3-medium兩個(gè)模型在MMLU測(cè)試中的得分,分別為75.3和78.2,顯示出這兩個(gè)模型在處理復(fù)雜任務(wù)時(shí)也具備了相當(dāng)高的性能。
本文鏈接:http://www.www897cc.com/showinfo-45-5249-0.html微軟推出38億參數(shù)phi-3-mini模型:每秒可生成12個(gè)tokens
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 曝軟銀計(jì)劃到 2025 年投資 1500 億日元,加速推進(jìn)AI大模型創(chuàng)新研
下一篇: 迪顯咨詢與MAXHUB共推《2024未來會(huì)議白皮書》 AI引領(lǐng)會(huì)議行業(yè)新變革