當(dāng)前位置：首頁 > 科技 > 網(wǎng)絡(luò)

首個圖像生成基礎(chǔ)模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

來源：責(zé)編：時間：2025-08-05 09:21:25 11觀看

導(dǎo)讀快科技8月5日消息，今天凌晨，阿里通義千問宣布開源Qwen-Image，一個20B的MMDiT模型。這是通義千問系列中首個圖像生成基礎(chǔ)模型，其在復(fù)雜文本渲染和精確圖像編輯方面取得顯著進展。據(jù)了解，該模型專注于提升AI在兩大

快科技8月5日消息，今天凌晨，阿里通義千問宣布開源Qwen-Image，一個20B的MMDiT模型。

這是通義千問系列中首個圖像生成基礎(chǔ)模型，其在復(fù)雜文本渲染和精確圖像編輯方面取得顯著進展。

據(jù)了解，該模型專注于提升AI在兩大核心場景的能力：復(fù)雜的文本渲染與精準的圖像編輯。

功能亮點：

強大的文字渲染能力（本次開源）

效果領(lǐng)先：在多個文本測評榜單中，文字渲染均獲得SOTA。

原生渲染：文字是圖像生成時直出的，而非后期添加，效果更真實。

功能全面：支持中英雙語，多變字體，超長段落，超小文字，并可實現(xiàn)復(fù)雜的多位置圖文布局。

基礎(chǔ)扎實：除了文字，模型在人物情緒、細節(jié)刻畫和多樣的風(fēng)格渲染上也同樣表現(xiàn)出色。

精準的圖像編輯能力（即將發(fā)布）

效果穩(wěn)定：多個圖像編輯測評榜單SOTA。

鏈式編輯：在多輪連續(xù)修改后，仍能保持主體ID的一致性。

文字編輯：可以編輯圖像中的文字。

復(fù)雜編輯：可編輯人物姿勢，提取圖像紋理等。

首個圖像生成基礎(chǔ)模型通義千問深夜開源Qwen-Image 支持中英雙語

通義千問在多個公開基準上對Qwen-Image進行全面評估，包括用于通用圖像生成的GenEval、DPG和OneIG-Bench，以及用于圖像編輯的GEdit、ImgEdit和GSO。

Qwen-Image在所有基準測試中均取得了先進的性能，展現(xiàn)出其在圖像生成與圖像編輯方面的強大能力。

首個圖像生成基礎(chǔ)模型通義千問深夜開源Qwen-Image 支持中英雙語

此外，在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的結(jié)果表明，Qwen-Image在文本渲染方面表現(xiàn)尤為出色，特別是在中文文本渲染上，大幅領(lǐng)先現(xiàn)有的先進模型。

首個圖像生成基礎(chǔ)模型通義千問深夜開源Qwen-Image 支持中英雙語

除了文本處理，Qwen-Image在通用圖像生成方面也表現(xiàn)出色，支持多種藝術(shù)風(fēng)格。

在圖像編輯方面，Qwen-Image支持風(fēng)格遷移、增刪改、細節(jié)增強、文字編輯，人物姿態(tài)調(diào)整等多種操作，讓普通用戶也能輕松實現(xiàn)專業(yè)級圖像編輯。

首個圖像生成基礎(chǔ)模型通義千問深夜開源Qwen-Image 支持中英雙語

本文鏈接：http://www.www897cc.com/showinfo-17-175593-0.html首個圖像生成基礎(chǔ)模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：官方提醒警惕AI“數(shù)據(jù)投毒” 0.01%虛假訓(xùn)練文本可致有害內(nèi)容增加11.2%

下一篇： 10歲小女孩快遞站玩耍手臂被卷入傳送帶整個身體懸空

標簽：

熱門焦點

5月iOS設(shè)備性能榜：M1 M2依舊是榜單前五

和上個月一樣，沒有新品發(fā)布的iOS設(shè)備性能榜的上榜設(shè)備并沒有什么更替，僅僅只有跑分變化而產(chǎn)生的排名變動，剛剛開始的蘋果WWDC2023，推出的產(chǎn)品也依舊是新款Mac Pro、新款Mac Stu
十個可以手動編寫的 JavaScript 數(shù)組 API

JavaScript 中有很多API，使用得當(dāng)，會很方便，省力不少。你知道它的原理嗎? 今天這篇文章，我們將對它們進行一次小總結(jié)。現(xiàn)在開始吧。1.forEach()forEach()用于遍歷數(shù)組接收一參
Java NIO內(nèi)存映射文件：提高文件讀寫效率的優(yōu)秀實踐！

Java的NIO庫提供了內(nèi)存映射文件的支持，它可以將文件映射到內(nèi)存中，從而可以更快地讀取和寫入文件數(shù)據(jù)。本文將對Java內(nèi)存映射文件進行詳細的介紹和演示。內(nèi)存映射文件概述內(nèi)存
得物效率前端微應(yīng)用推進過程與思考

一、背景效率工程隨著業(yè)務(wù)的發(fā)展，組織規(guī)模的擴大，越來越多的企業(yè)開始意識到協(xié)作效率對于企業(yè)團隊的重要性，甚至是決定其在某個行業(yè)競爭中突圍的關(guān)鍵，是企業(yè)長久生存的根本。得物
之家push系統(tǒng)迭代之路

前言在這個信息爆炸的互聯(lián)網(wǎng)時代，能夠及時準確獲取信息是當(dāng)今社會要解決的關(guān)鍵問題之一。隨著之家用戶體量和內(nèi)容規(guī)模的不斷增大，傳統(tǒng)的靠"主動拉"獲取信息的方式已不能滿足用
零售大模型“干中學(xué)”，攀爬數(shù)字化珠峰

文/侯煜編輯/cc來源/華爾街科技眼對于絕大多數(shù)登山愛好者而言，攀爬珠穆朗瑪峰可謂終極目標。攀登珠峰的商業(yè)路線有兩條，一是尼泊爾境內(nèi)的南坡路線，一是中國境內(nèi)的北坡路線。相
慕巖炮轟抖音，百合網(wǎng)今何在？

來源：價值研究所作者：Hernanderz“難道就因為自己的一個產(chǎn)品牛逼了，從客服到總裁，都不愿意正視自己產(chǎn)品和運營上的問題，選擇逃避了嗎？”這一番話，出自百合網(wǎng)聯(lián)合創(chuàng)
騰訊蓋樓，字節(jié)拆墻

來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎？一起上晶核，即刻暴打！”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
引領(lǐng)旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機市場長期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首個圖像生成基礎(chǔ)模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

5月iOS設(shè)備性能榜：M1 M2依舊是榜單前五

十個可以手動編寫的 JavaScript 數(shù)組 API

Java NIO內(nèi)存映射文件：提高文件讀寫效率的優(yōu)秀實踐！

得物效率前端微應(yīng)用推進過程與思考

之家push系統(tǒng)迭代之路

零售大模型“干中學(xué)”，攀爬數(shù)字化珠峰

慕巖炮轟抖音，百合網(wǎng)今何在？

騰訊蓋樓，字節(jié)拆墻

引領(lǐng)旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

首個圖像生成基礎(chǔ)模型 阿里通義千問深夜開源Qwen-Image 支持中英雙語

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

首個圖像生成基礎(chǔ)模型阿里通義千問深夜開源Qwen-Image 支持中英雙語