日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

阿里通義千問Qwen2.5-1M模型開源,長上下文處理能力大幅提升!

來源: 責(zé)編: 時間:2025-01-27 09:28:56 70觀看
導(dǎo)讀阿里通義千問于近日正式宣布,開源了其最新的Qwen2.5-1M模型及其配套的推理框架。這一舉措標(biāo)志著通義千問在人工智能領(lǐng)域邁出了重要一步。據(jù)悉,通義千問此次發(fā)布的開源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Inst

阿里通義千問于近日正式宣布,開源了其最新的Qwen2.5-1M模型及其配套的推理框架。這一舉措標(biāo)志著通義千問在人工智能領(lǐng)域邁出了重要一步。oe028資訊網(wǎng)——每日最新資訊28at.com

據(jù)悉,通義千問此次發(fā)布的開源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M兩個版本。尤為引人注目的是,這兩個版本首次將Qwen模型的上下文長度擴展到了1M(即100萬標(biāo)記),這在業(yè)界尚屬首次。oe028資訊網(wǎng)——每日最新資訊28at.com

為了幫助開發(fā)者更好地部署和應(yīng)用這些模型,Qwen團隊還開源了基于vLLM的推理框架。該框架集成了稀疏注意力方法,使得在處理長達1M標(biāo)記的輸入時,推理速度有了顯著提升,達到了3倍至7倍的增長。oe028資訊網(wǎng)——每日最新資訊28at.com

在長上下文任務(wù)方面,Qwen2.5-1M系列模型展現(xiàn)出了強大的能力。在一項名為“大海撈針”的任務(wù)中,這些模型能夠準(zhǔn)確地從1M長度的文檔中檢索出隱藏信息。盡管7B版本的模型在極少數(shù)情況下出現(xiàn)了錯誤,但整體上,其表現(xiàn)仍然令人矚目。oe028資訊網(wǎng)——每日最新資訊28at.com

為了全面評估Qwen2.5-1M系列模型在長上下文任務(wù)中的表現(xiàn),研究團隊還選擇了RULER、LV-eval和LongbenchChat等多個測試集進行測試。測試結(jié)果顯示,這些模型在大多數(shù)任務(wù)中都顯著優(yōu)于之前的128K版本,特別是在處理超過64K長度的任務(wù)時,其優(yōu)勢更加明顯。oe028資訊網(wǎng)——每日最新資訊28at.com

Qwen2.5-14B-Instruct-1M模型不僅在性能上擊敗了Qwen2.5-Turbo,還在多個數(shù)據(jù)集上穩(wěn)定超越了GPT-4o-mini。這一結(jié)果無疑為長上下文任務(wù)提供了更多開源模型的選擇。oe028資訊網(wǎng)——每日最新資訊28at.com

除了長上下文任務(wù)外,Qwen2.5-1M系列模型在短序列任務(wù)上的表現(xiàn)同樣出色。測試結(jié)果顯示,Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M在短文本任務(wù)上的表現(xiàn)與其128K版本相當(dāng),這意味著增加長序列處理能力并沒有犧牲其基本能力。oe028資訊網(wǎng)——每日最新資訊28at.com

與GPT-4o-mini相比,Qwen2.5-14B-Instruct-1M和Qwen2.5-Turbo在短文本任務(wù)上實現(xiàn)了相近的性能,但它們的上下文長度卻是GPT-4o-mini的八倍。這一結(jié)果進一步證明了Qwen2.5-1M系列模型在短序列任務(wù)上的強大實力。oe028資訊網(wǎng)——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0
 
 
更多>同類資訊
點擊查看更多 +
全站最新
智慧電子產(chǎn)業(yè)園沖刺:未來兩年總產(chǎn)值目標(biāo)十億元!
智慧電子產(chǎn)業(yè)園沖刺:未來兩年總產(chǎn)值目標(biāo)十億元!
“天關(guān)”衛(wèi)星探測:宇宙早期爆發(fā)軟X射線信號首現(xiàn)!
“天關(guān)”衛(wèi)星探測:宇宙早期爆發(fā)軟X射線信號首現(xiàn)!
家中謎團:我每月寄回4000,母親仍喊窮,弟弟卻開上了20萬新車
家中謎團:我每月寄回4000,母親仍喊窮,弟弟卻開上了20萬新車
比亞迪日本市場高歌猛進,插電混動技術(shù)能否再掀浪潮?
比亞迪日本市場高歌猛進,插電混動技術(shù)能否再掀浪潮?
蘋果AirPods未來大升級:將配紅外攝像頭,聽歌同時還能“感知”世界?
蘋果AirPods未來大升級:將配紅外攝像頭,聽歌同時還能“感知”世界?
蘋果2025年大動作:HomePod變身7英寸智能家居控制中樞?
蘋果2025年大動作:HomePod變身7英寸智能家居控制中樞?
熱門內(nèi)容
  • 95后AI天才少女羅福莉跳槽小米,DeepSeek-V3模型已上線并開源
  • 三星Galaxy S25系列真機曝光,明日發(fā)布會將有何驚喜?
  • 95后AI天才少女羅福莉,棄幻方量化投小米,雷軍千萬年薪有何吸引力?
  • 支付寶集五福新升級,2025年1月20日活動盛大啟幕!
  • 掃地機器人進化新形態(tài),追覓機械手引領(lǐng)家庭服務(wù)智能革命
  • 三星Galaxy S25系列評測:AI大升級,Ultra版全面領(lǐng)跑
  • CES 2025:Aria機器人亮相,高度擬人可換臉,專為陪伴而生
  • DeepSeek實測:低成本AI大模型能否媲美行業(yè)巨頭?
  • 三星S25系列發(fā)布會前瞻:手機迭代溫和,OneUI 7與AI硬件成亮點?
  • 英偉達CES發(fā)布Project Digits:3000美元迷你AI超算實拍亮相
  • 字節(jié)跳動自建數(shù)據(jù)中心,2025年計劃投資1600億打造大規(guī)模集群
  • 2025杰出雇主榜單發(fā)布:企業(yè)如何應(yīng)對市場挑戰(zhàn),人才戰(zhàn)略是關(guān)鍵
  • DeepSeek團隊揭秘:清北應(yīng)屆生領(lǐng)銜,年輕力量如何撐起AI大模型新篇章?
  • 中部最大智算中心“河南空港”正式投產(chǎn),算力規(guī)模將達10萬P!
  • CES現(xiàn)場直擊:萌友智能Ropet,讓大白式陪伴機器人走進現(xiàn)實?
本欄最新
萬通發(fā)展重大資產(chǎn)重組告吹,轉(zhuǎn)型高端光模塊之路何去何從?
萬通發(fā)展重大資產(chǎn)重組告吹,轉(zhuǎn)型高端光模塊之路何去何從?
DeepSeek短時閃崩后回應(yīng),已沖進美區(qū)蘋果App Store免費榜前三
DeepSeek短時閃崩后回應(yīng),已沖進美區(qū)蘋果App Store免費榜前三
AI狂潮背后的隱形富豪:SK海力士利潤暴漲22倍
AI狂潮背后的隱形富豪:SK海力士利潤暴漲22倍
劉慶峰揭秘百模大戰(zhàn):科大訊飛如何在巨頭夾擊下堅守AI初心?
劉慶峰揭秘百模大戰(zhàn):科大訊飛如何在巨頭夾擊下堅守AI初心?
百川智能全模態(tài)模型Baichuan-Omni-1.5發(fā)布,能否引領(lǐng)AI新潮流?
百川智能全模態(tài)模型Baichuan-Omni-1.5發(fā)布,能否引領(lǐng)AI新潮流?
百度iRAG技術(shù):萌寵拜年圖也能生成,AI生圖走向?qū)嵱眯聲r代
百度iRAG技術(shù):萌寵拜年圖也能生成,AI生圖走向?qū)嵱眯聲r代

本文鏈接:http://www.www897cc.com/showinfo-45-10196-0.html阿里通義千問Qwen2.5-1M模型開源,長上下文處理能力大幅提升!

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 全球首發(fā)的港口服務(wù)大模型方舟TaaS,公測正式啟動!

下一篇: DeepSeek開源AI模型崛起,Meta科學(xué)家楊立昆:這就是開源的魅力?

標(biāo)簽:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

Top 主站蜘蛛池模板: 富平县| 定襄县| 高清| 夏河县| 仲巴县| 绥棱县| 漳州市| 井陉县| 萨迦县| 林周县| 灵宝市| 玉田县| 清水河县| 焉耆| 米林县| 抚顺市| 莱州市| 沙湾县| 长春市| 南康市| 从江县| 台南市| 怀来县| 牡丹江市| 平利县| 合江县| 赫章县| 元朗区| 门源| 南江县| 溆浦县| 大丰市| 赤峰市| 伽师县| 封丘县| 巢湖市| 甘肃省| 绥化市| 琼结县| 固始县| 林芝县|