日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

騰訊混元 DiT 文生圖大模型開源 6G 小顯存版本,一同開源打標模型

來源: 責編: 時間:2024-07-06 07:40:53 191觀看
導讀 7 月 4 日消息,騰訊混元文生圖大模型(混元 DiT)今日宣布開源小顯存版本,僅需 6G 顯存即可運行,對使用個人電腦本地部署的開發者比較友好。此外,騰訊宣布混元文生圖打標模型“混元 Captioner”正式對外開源。該模型

7 月 4 日消息,騰訊混元文生圖大模型(混元 DiT)今日宣布開源小顯存版本,僅需 6G 顯存即可運行,對使用個人電腦本地部署的開發者比較友好。Gvr28資訊網——每日最新資訊28at.com

此外,騰訊宣布混元文生圖打標模型“混元 Captioner”正式對外開源。該模型支持中英文雙語,針對文生圖場景進行專門優化,可幫助開發者快速制作文生圖數據集。Gvr28資訊網——每日最新資訊28at.com

騰訊混元 DiT 模型升級

騰訊混元 DiT 模型宣布了三大更新:推出小顯存版本與 Kohya 訓練界面,并升級至 1.2 版本,進一步降低使用門檻的同時提升圖片質量。Gvr28資訊網——每日最新資訊28at.com

基于 DiT 架構的文生圖模型生成圖片質感更佳,但對顯存的要求卻非常高,混元 DiT 因此推出小顯存版本,最低 6G 顯存即可運行優化推理框架,對使用個人電腦本地部署的開發者比較友好。Gvr28資訊網——每日最新資訊28at.com

經過與 Hugging Face 合作,小顯存版本、LoRA 與 ControlNet 插件,都已經適配到 Diffusers 庫中。開發者無需下載原始代碼,僅用三行代碼僅可調用,簡化了使用成本。Gvr28資訊網——每日最新資訊28at.com

同時,混元 DiT 宣布接入 Kohya,讓開發者可以低門檻地訓練專屬 LoRA 模型。Gvr28資訊網——每日最新資訊28at.com

Kohya 是一個開源的、輕量化模型微調訓練服務,提供了圖形化的用戶界面,被廣泛用于擴散模型類文生圖模型的訓練。Gvr28資訊網——每日最新資訊28at.com

用戶可以通過圖形化界面,完成模型的全參精調及 LoRA 訓練,無需涉及到代碼層面的細節。訓練好的模型符合 Kohya 生態架構,可以低成本與 WebUI 等推理界面結合,實現一整套“訓練-生圖”工作流。Gvr28資訊網——每日最新資訊28at.com

混元 Captioner

在提升模型易用性的同時,騰訊混元團隊最新開源了打標模型 —— 混元 Captioner。Gvr28資訊網——每日最新資訊28at.com

借助打標模型,開發者可以快速生成數據集。具體來說,文生圖開發者將原始圖片集導入混元 Captioner,后者將生成標注;也可以導入圖片與原始描述,利用混元 Captioner 過濾其中的無關信息,并完善和優化圖片描述,以提高數據質量。Gvr28資訊網——每日最新資訊28at.com

目前,業界對于圖片描述文本的生成,主要使用通用多模態 Captioner 模型,存在描述過于簡單或繁瑣(與畫面描述的無關信息過多)、缺少背景知識導致無法識別知名人物和地標等問題,并且許多模型并非中文原生,中文描述不夠精準。Gvr28資訊網——每日最新資訊28at.com

Gvr28資訊網——每日最新資訊28at.com

▲混元 Captioner 對圖片描述進行結構化與準確度提升混元

Captioner 模型號稱針對文生圖場景專門進行優化:Gvr28資訊網——每日最新資訊28at.com

構建了結構化的圖片描述體系;Gvr28資訊網——每日最新資訊28at.com

在模型層面,通過注入人工標注、模型輸出、公開數據等多種來源提升 Caption 描述的完整性;Gvr28資訊網——每日最新資訊28at.com

注入知名文學作品形象、地標、食物、動物、中國元素與知識等背景知識。Gvr28資訊網——每日最新資訊28at.com

Gvr28資訊網——每日最新資訊28at.com

▲Capiton 模型的背景知識更好,能夠識別宮保雞丁

Gvr28資訊網——每日最新資訊28at.com

▲Captioner 模型結構化圖片描述體系

附騰訊混元開源文生圖大模型相關鏈接:Gvr28資訊網——每日最新資訊28at.com

官網:https://dit.hunyuan.tencent.com/Gvr28資訊網——每日最新資訊28at.com

代碼:https://github.com/Tencent/HunyuanDiTGvr28資訊網——每日最新資訊28at.com

模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDiTGvr28資訊網——每日最新資訊28at.com

論文:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdfGvr28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4968-0.html騰訊混元 DiT 文生圖大模型開源 6G 小顯存版本,一同開源打標模型

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 商湯科技 CEO 徐立:AI 行業很熱但未到“超級時刻”,需要應用來支撐

下一篇: 一張照片創造 1 分鐘人物視頻,商湯發布首個“可控”人物視頻生成大模型 Vimi

標簽:
  • 熱門焦點
  • 元宇宙里賣酸奶,好炸裂的操作!

    作者 | 李東陽 來源 | 首席營銷官有沒有發現,當下的熱搜出現一個有意思的現象,那就是“情懷”不知不覺成為了主流,爺青回話題討論性非常高。前有名偵探柯南和優衣庫
  • 從冰墩墩到無聊猿,解秘未來IP爆款的模因

    打造IP,是建設元宇宙的剛需。NFT能直接讓IP的價值變現;虛擬人IP是元宇宙的第一入口,而元宇宙要搭建的,就是一個個品牌IP星球,考驗的是IP世界觀的建設能力。如果說在
  • 虛擬數字人:元宇宙的主角破圈而來

    虛擬數字人市場逐步進入成熟期,商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • Kitten Coup社區反轉Cool Kittens NFT騙局

    當狂熱的加密愛好者將金錢投入到NFT圖片時,渾水摸魚的騙局隨之而來,Cool Kittens NFT便是其中一個作惡者,該項目于去年11月在Sonala鏈上啟動小貓形象的NFT鑄造及
  • 扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

    前身為Facebook的Meta公司今天展示了一個人工智能系統的Demo,該系統使人們能夠通過語音命令生成或導入虛擬世界中的事物。該公司認為這個被稱為 "Builder Bot "
  • 知識產權可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點:一些公司開始采取積極的方式來保護他們在元宇宙的知識產權。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識產權。Inside
  • 元宇宙存在的意義和價值

    科技公司目前都在猶豫,看誰能在元宇宙上押下更大的賭注。然而,除了巨額的資金投入,到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當前數字景觀
  • 趙長鵬預測SoicalFi為今年主要驅動力,新的機會在哪里?

    作者:五火球教主前不久,趙長鵬在《財富》雜志印度版塊刊登評論。他表示:“DeFi 在 2021 年出現了快速創新,我們可能會在 2022 年看到蓬勃發展的興趣和創新,其中 Soc
  • 在互聯網考古后,我被豆瓣上這座元宇宙古城征服了

    最近一段時間,豆瓣可謂命途多舛:APP屢次下架,平臺也被相關部門約談、處罰,國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能:這個曾經小
Top 主站蜘蛛池模板: 卢湾区| 大兴区| 丹巴县| 秦皇岛市| 江门市| 辽宁省| 万源市| 天全县| 乐清市| 綦江县| 深州市| 辽中县| 伽师县| 府谷县| 北流市| 竹山县| 德惠市| 南投县| 林口县| 桃园市| 乐安县| 玉山县| 兰溪市| 呼和浩特市| 资中县| 彭州市| 阳谷县| 竹北市| 抚州市| 宣城市| 丽水市| 商都县| 敦煌市| 嘉义市| 五莲县| 灵璧县| 明星| 成都市| 潜山县| 广丰县| 古田县|