當前位置：首頁 > 元宇宙 > AI

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

來源：責編：時間：2024-06-11 17:44:56 243觀看

導讀 6 月 7 日消息，通義千問（Qwen）今天宣布經過數月的努力，Qwen 系列模型從 Qwen1.5 到 Qwen2 的重大升級，并已在 Hugging Face 和 ModelScope 上同步開源。附上 Qwen 2.0 主要內容如下：5 個尺寸的預訓練和指令微調模型

6 月 7 日消息，通義千問（Qwen）今天宣布經過數月的努力，Qwen 系列模型從 Qwen1.5 到 Qwen2 的重大升級，并已在 Hugging Face 和 ModelScope 上同步開源。

附上 Qwen 2.0 主要內容如下：

5 個尺寸的預訓練和指令微調模型，包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B

在中文英語的基礎上，訓練數據中增加了 27 種語言相關的高質量數據；

多個評測基準上的領先表現；

代碼和數學能力顯著提升；

增大了上下文長度支持，最高達到 128K tokens（Qwen2-72B-Instruct）。

模型基礎信息

Qwen2 系列包含 5 個尺寸的預訓練和指令微調模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B參數量0.49B1.54B7.07B57.41B72.71B非 Embedding 參數量0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTie EmbeddingTrueTrueFalseFalseFalse上下文長度32K32K128K64K128K

在 Qwen1.5 系列中，只有 32B 和 110B 的模型使用了 GQA。這一次，所有尺寸的模型都使用了 GQA，以便讓大家體驗到 GQA 帶來的推理加速和顯存占用降低的優勢。

模型評測

相比 Qwen1.5，Qwen2 在大規模模型實現了非常大幅度的效果提升。我們對 Qwen2-72B 進行了全方位的評測。

在針對預訓練語言模型的評估中，對比當前最優的開源模型，Qwen2-72B 在包括自然語言理解、知識、代碼、數學及多語言等多項能力上均顯著超越當前領先的模型，如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

附上參考地址

你好，Qwen2

本文鏈接：http://www.www897cc.com/showinfo-45-4549-0.html阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：五糧液濃香酒：勞動節送禮的精致藝術

下一篇：號稱效果對標 Sora：快手視頻生成大模型“可靈”開放邀測

標簽：

熱門焦點

元宇宙是投資中國的第五次重大機遇

作者為凱思博投資董事長導語：投資邏輯要來自于人性在社會發展過程中的普遍規律，由第一性原理出發找出重大的投資機會來。1978年的改革開放到今天，中國總共經歷了
關于年度熱詞NFT，除了錢，我們還可以聊點啥？

每到年底，社交媒體總少不了年度盤點、年度總結、年度熱詞。如果讓你來總結2021年度熱詞，你會想到什么？柯林斯詞典將年度熱詞頒給了“NFT”，而其理由是：一個縮寫詞的
中文在線的“元宇宙”故事，資本聽膩了？

被譽為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國移動通信聯合會元宇宙產業委員會揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
超級碗的加密時刻：是主流信號還是“網絡超級碗2.0”？

2 月 13 日，美東時間 18:30，有著“美國春晚”之譽的超級碗（Super Bowl）落下帷幕。超級碗是美國國家美式足球聯盟（也稱為國家橄欖球聯盟）的年度冠軍賽，勝者將成為“世
城市數字孿生標準化白皮書（2022版）

當前，城市數字孿生已經發展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯，實
從虛擬餐廳到虛擬時裝秀，行業巨頭掀起元宇宙商標注冊潮

自從 Facebook 更名為 Meta 后，關于元宇宙的討論愈發激烈，這一詞匯也越來越多的出現在我們的視野里。這是一個非常有趣的話題。伴隨著爭論，有些人認為是馬克·扎
過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

Web 2.0 是由幾家“直男”大公司塑造的。接下來的Web3世界中，如果女性在創造性方面發揮更大的作用，可能會讓這個新時代更受歡迎、更安全和公平。當我們談論 Web3
藝術創作者能否永久收取版稅？

NFTs正在改變我們理解互聯網所有權的方式，社區管理的所有權有很多好處，但如果創作者想為他/她的創作獲得永久的收益（版稅），會發生什么？這不是一個容易解決的問題，版稅
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

元宇宙是投資中國的第五次重大機遇

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

中文在線的“元宇宙”故事，資本聽膩了？

超級碗的加密時刻：是主流信號還是“網絡超級碗2.0”？

城市數字孿生標準化白皮書（2022版）

從虛擬餐廳到虛擬時裝秀，行業巨頭掀起元宇宙商標注冊潮

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

藝術創作者能否永久收取版稅？

如何在元宇宙中建立品牌忠誠度

最新推薦

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

Kitten Coup社區反轉Cool Kittens NFT騙局

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

Meta 在衰落嗎？

以太坊面臨來自Fantom的巨大挑戰

MR——元宇宙平臺的下一代入口

猜你喜歡

熱門推薦

相關資訊

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

最新推薦

猜你喜歡

熱門推薦

相關資訊

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens