6 月 6 日消息,阿里今日凌晨開源了 Qwen3-Embedding 系列模型(Embedding 及 Reranker),專為文本表征、檢索與排序任務(wù)設(shè)計,基于 Qwen3 基礎(chǔ)模型進(jìn)行訓(xùn)練。
官方表示,在多項基準(zhǔn)測試中,Qwen3-Embedding 系列在文本表征和排序任務(wù)中展現(xiàn)了卓越的性能。
其具備如下特點:
卓越的泛化性:Qwen3-Embedding 系列在多個下游任務(wù)評估中達(dá)到行業(yè)領(lǐng)先水平。其中,8B 參數(shù)規(guī)模的 Embedding 模型在 MTEB 多語言 Leaderboard 榜單中位列第一(截至 2025 年 6 月 6 日,得分 70.58),性能超越眾多商業(yè) API 服務(wù)。此外,該系列的排序模型在各類文本檢索場景中表現(xiàn)出色,顯著提升了搜索結(jié)果的相關(guān)性。
靈活的模型架構(gòu):Qwen3-Embedding 系列提供從 0.6B 到 8B 參數(shù)規(guī)模的 3 種模型配置,以滿足不同場景下的性能與效率需求。開發(fā)者可以靈活組合表征與排序模塊,實現(xiàn)功能擴(kuò)展。
此外,模型支持以下定制化特性:
表征維度自定義:允許用戶根據(jù)實際需求調(diào)整表征維度,有效降低應(yīng)用成本;
指令適配優(yōu)化:支持用戶自定義指令模板,以提升特定任務(wù)、語言或場景下的性能表現(xiàn)。
全面的多語言支持:Qwen3-Embedding 系列支持超過 100 種語言,涵蓋主流自然語言及多種編程語言。該系列模型具備強(qiáng)大的多語言、跨語言及代碼檢索能力,能夠有效應(yīng)對多語言場景下的數(shù)據(jù)處理需求。
據(jù)介紹,Embedding 模型接收單段文本作為輸入,取模型最后一層「EOS」標(biāo)記對應(yīng)的隱藏狀態(tài)向量,作為輸入文本的語義表示;Reranker 模型則接收文本對(例如用戶查詢與候選文檔)作為輸入,利用單塔結(jié)構(gòu)計算并輸出兩個文本的相關(guān)性得分。
附開源地址如下:
ModelScope:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48
https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f
Hugging Face:https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f
https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea
GitHub:https://github.com/QwenLM/Qwen3-Embedding
技術(shù)報告:https://github.com/QwenLM/Qwen3-Embedding/blob/main/qwen3_embedding_technical_report.pdf
本文鏈接:http://www.www897cc.com/showinfo-45-13535-0.html阿里開源 Qwen3 新模型 Embedding 及 Reranker,帶來強(qiáng)大多語言、跨語言支持
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 硬剛到底,OpenAI 將就《紐約時報》的訴訟請求提出上訴
下一篇: 谷歌更新 Gemini 2.5 Pro 預(yù)覽版模型至 06-05 版本,多項 AI 性能基準(zhǔn)測試評分提升