當(dāng)前位置：首頁 > 元宇宙 > AI

支持 100 萬 Tokens 上下文，阿里通義千問推出 Qwen2.5-1M 開源模型

來源：責(zé)編：時(shí)間：2025-01-29 18:59:45 73觀看

導(dǎo)讀 1 月 27 日消息，阿里通義千問今日宣布，正式推出開源的 Qwen2.5-1M 模型及其對(duì)應(yīng)的推理框架支持。從官方介紹獲悉，通義千問本次發(fā)布了兩個(gè)新的開源模型，分別是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，這

1 月 27 日消息，阿里通義千問今日宣布，正式推出開源的 Qwen2.5-1M 模型及其對(duì)應(yīng)的推理框架支持。

從官方介紹獲悉，通義千問本次發(fā)布了兩個(gè)新的開源模型，分別是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，這是通義千問首次將開源的 Qwen 模型的上下文擴(kuò)展到 1M 長度。

為了幫助開發(fā)者更高效地部署 Qwen2.5-1M 系列模型，Qwen 團(tuán)隊(duì)完全開源了基于 vLLM 的推理框架，并集成了稀疏注意力方法，使得該框架在處理 1M 標(biāo)記輸入時(shí)的速度提升了 3 倍到 7 倍。

長上下文任務(wù)

在上下文長度為 100 萬 Tokens 的大海撈針（Passkey Retrieval）任務(wù)中，Qwen2.5-1M 系列模型能夠準(zhǔn)確地從 1M 長度的文檔中檢索出隱藏信息，其中僅有 7B 模型出現(xiàn)了少量錯(cuò)誤。

對(duì)于更復(fù)雜的長上下文理解任務(wù)，選擇了 RULER、LV-Eval 和 LongbenchChat 測(cè)試集。

從這些結(jié)果中，Qwen 得出以下幾點(diǎn)關(guān)鍵結(jié)論：

顯著超越 128K 版本：Qwen2.5-1M 系列模型在大多數(shù)長上下文任務(wù)中顯著優(yōu)于之前的 128K 版本，特別是在處理超過 64K 長度的任務(wù)時(shí)表現(xiàn)出色。

性能優(yōu)勢(shì)明顯：Qwen2.5-14B-Instruct-1M 模型不僅擊敗了 Qwen2.5-Turbo，還在多個(gè)數(shù)據(jù)集上穩(wěn)定超越 GPT-4o-mini，為長上下文任務(wù)提供了開源模型的選擇。

短序列任務(wù)

可以發(fā)現(xiàn)：

Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M 在短文本任務(wù)上的表現(xiàn)與其 128K 版本相當(dāng)，確保了基本能力沒有因?yàn)樵黾恿碎L序列處理能力而受到影響。

與 GPT-4o-mini 相比，Qwen2.5-14B-Instruct-1M 和 Qwen2.5-Turbo 在短文本任務(wù)上實(shí)現(xiàn)了相近的性能，同時(shí)上下文長度是 GPT-4o-mini 的八倍。

模型鏈接：https://www.modelscope.cn/collections/Qwen25-1M-d6cf9fd33f0a40

技術(shù)報(bào)告：https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2.5-1M/Qwen2_5_1M_Technical_Report.pdf

體驗(yàn)鏈接：https://modelscope.cn/studios/Qwen/Qwen2.5-1M-Demo

本文鏈接：http://www.www897cc.com/showinfo-45-10254-0.html支持 100 萬 Tokens 上下文，阿里通義千問推出 Qwen2.5-1M 開源模型

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：全球首個(gè)港口服務(wù)類大模型方舟 TaaS 開啟公測(cè)，支持智能規(guī)劃路線并估算費(fèi)用

下一篇：小米SU7車模春晚亮相成焦點(diǎn)，碳纖維后視鏡版賣斷貨！

標(biāo)簽：

熱門焦點(diǎn)

搭上“谷愛凌”，“柳夜熙們”站上風(fēng)口？

作者：張琳曹楊從“永不塌房”的藝人到頻頻亮相北京冬奧會(huì)，作為元宇宙細(xì)分賽道之一的虛擬數(shù)字人又火了一把。2月7日，即谷愛凌摘得冬奧會(huì)自由式滑雪大跳臺(tái)金牌的
參加元宇宙里的招聘會(huì)是什么樣一種體驗(yàn)？

求職者可以在活動(dòng)中走動(dòng)，就像他們?cè)诂F(xiàn)實(shí)生活中一樣。長話短說看亮點(diǎn)：招聘公司Hirect為Y-combinator支持的初創(chuàng)公司舉辦了一場元宇宙招聘會(huì)。這里有一個(gè)大廳、一
想進(jìn)入web3.0？來看看哪些工作適合你

隨著對(duì)加密貨幣需求的增加，加密領(lǐng)域的工作的數(shù)量也在增加。以下是一些非技術(shù)性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導(dǎo)致區(qū)塊鏈領(lǐng)域的求職
以太坊面臨來自Fantom的巨大挑戰(zhàn)

眾所周知，區(qū)塊鏈和加密貨幣項(xiàng)目經(jīng)常因其對(duì)環(huán)境的影響而受到批評(píng)。但是有一個(gè)非營利性的加密貨幣和區(qū)塊鏈項(xiàng)目說它比其他的更環(huán)保。今天老雅痞就給大家聊一聊加
音樂家如何利用NFTs來提高歌迷參與度

"音樂是一種語言，不以特定的文字說話。它用情感說話，如果它在骨子里，它就在骨子里。" - Keith Richards音樂激勵(lì)著我們，使我們流淚，使我們充滿狂喜，并撫慰我們的靈魂
趙長鵬預(yù)測(cè)SoicalFi為今年主要驅(qū)動(dòng)力，新的機(jī)會(huì)在哪里？

作者：五火球教主前不久，趙長鵬在《財(cái)富》雜志印度版塊刊登評(píng)論。他表示：“DeFi 在 2021 年出現(xiàn)了快速創(chuàng)新，我們可能會(huì)在 2022 年看到蓬勃發(fā)展的興趣和創(chuàng)新，其中 Soc
花旗集團(tuán)前高管加入Provenance區(qū)塊鏈，擔(dān)任CEO

No.1 花旗集團(tuán)前高管加入Provenance區(qū)塊鏈，擔(dān)任CEO3月1日消息，Provenance區(qū)塊鏈基金會(huì)已任命花旗集團(tuán)前高管摩根·麥肯尼（Morgan McKenney）為新任首席執(zhí)行官。麥肯
頂級(jí)NFT收藏家Gary Vaynerchuk 與百威推出NFT

特別聲明，我們的文章不作為投資建議，請(qǐng)各位讀者獨(dú)立思考，還是那句話：投資要慎之又慎，誰也不要相信。Gary Verneychuk 和百威 NFT 之一。由 VeynerNFT 提供百威推出
76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

“元宇宙的開拓者”是我們針對(duì)元宇宙的發(fā)展而設(shè)立的專欄，主要面向那些深挖元宇宙產(chǎn)業(yè)或者在元宇宙進(jìn)行“淘金”的從業(yè)者，分享這些企業(yè)或者創(chuàng)業(yè)者們的故事，以獨(dú)特

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

支持 100 萬 Tokens 上下文，阿里通義千問推出 Qwen2.5-1M 開源模型

搭上“谷愛凌”，“柳夜熙們”站上風(fēng)口？

參加元宇宙里的招聘會(huì)是什么樣一種體驗(yàn)？

想進(jìn)入web3.0？來看看哪些工作適合你

以太坊面臨來自Fantom的巨大挑戰(zhàn)

音樂家如何利用NFTs來提高歌迷參與度

趙長鵬預(yù)測(cè)SoicalFi為今年主要驅(qū)動(dòng)力，新的機(jī)會(huì)在哪里？

花旗集團(tuán)前高管加入Provenance區(qū)塊鏈，擔(dān)任CEO

頂級(jí)NFT收藏家Gary Vaynerchuk 與百威推出NFT

76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

最新推薦

餐桌上怎么變出元宇宙？

傳統(tǒng)互聯(lián)網(wǎng)與區(qū)塊鏈場景下數(shù)據(jù)權(quán)利法律分析

NFT世界的藝術(shù)家名單

3月份值得關(guān)注的5個(gè)NFT項(xiàng)目

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

我們離元宇宙的實(shí)現(xiàn)只差一副眼鏡？

猜你喜歡

熱門推薦

相關(guān)資訊