6 月 28 日消息,Hugging Face 聯合創始人兼首席執行 Clem Delangue 于 6 月 26 日在 X 平臺發布推文,表示阿里云開源的通義千問(Qwen)指令微調模型 Qwen2-72B 在開源模型排行榜上榮登榜首。
Hugging Face 公布了全新的開源大語言模型排行榜,通過 300 片英偉達 H100 GPU,重新運行 MMLU-pro 等標準評估目前主流的大語言模型,并在其要點介紹中稱 Qwen2-72B 為“王者”,并表示中國的諸多開源模型在榜單上有一席之位。
他表示,為了提供全新的開源大模型排行榜,使用了 300 塊 H100 對目前全球 100 多個主流開源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基準測試集上進行了全新評估。
阿里巴巴開源的 Qwen-2 72B 模型在激烈競爭中脫穎而出,不僅超越了科技巨頭 Meta 的 Llama-3,還超越了法國知名大模型平臺 Mistralai 的 Mixtral,成為了新的行業領軍者。援引官方博文附上榜單排行如下:
排名新的榜單排名?Qwen/Qwen2-72B-Instruct2meta-llama/Meta-Llama-3-70B-Instruct3microsoft/Phi-3-medium-4k-instruct401-ai/Yi-1.5-34B-Chat5CohereForAI/c4ai-command-r-plus6abacusai/Smaug-72B-v0.17Qwen/Qwen1.5-110B8Qwen/Qwen1.5-110B-Chat9microsoft/Phi-3-small-128k-instruct1001-ai/Yi-1.5-9B-Chat本文鏈接:http://www.www897cc.com/showinfo-45-4878-0.html開源 AI 大模型“洗牌”:阿里通義千問 Qwen2-72B 成“王者”,傲視 Meta Llama-3、微軟 Phi-3 等群雄
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com