日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

限時免費!通義千問多模態大模型重磅升級:性能趕超GPT-4V和谷歌Gemini

來源: 責編: 時間:2024-01-26 17:04:51 253觀看
導讀 快科技1月26日消息,今日,阿里云公布多模態大模型研究進展。據悉,通義千問視覺理解模型Qwen-VL再次升級,繼Plus版本之后,再次推出Max版本,升級版模型擁有更強的視覺推理能力和中文理解能力,能夠根據圖片識人、答題

快科技1月26日消息,今日,阿里云公布多模態大模型研究進展。lvY28資訊網——每日最新資訊28at.com

據悉,通義千問視覺理解模型Qwen-VL再次升級,繼Plus版本之后,再次推出Max版本,升級版模型擁有更強的視覺推理能力和中文理解能力,能夠根據圖片識人、答題、創作、寫代碼,并在多個權威測評中獲得佳績,整體性能堪比GPT-4V和Gemini Ultra。lvY28資訊網——每日最新資訊28at.com

限時免費!通義千問多模態大模型重磅升級:性能趕超GPT-4V和谷歌GeminilvY28資訊網——每日最新資訊28at.com

Qwen-VL-Plus和Qwen-VL-Max在MMMU、MathVista等測評中遠超業界所有開源模型,在文檔分析(DocVQA)、中文圖像相關(MM-Bench-CN)等任務上超越GPT-4V,達到世界佳水平。lvY28資訊網——每日最新資訊28at.com

基礎能力方面,升級版模型能夠準確描述和識別圖片信息,并且根據圖片進行信息推理、擴展創作;具備視覺定位能力,還可針對畫面指定區域進行問答。lvY28資訊網——每日最新資訊28at.com

視覺推理方面,Qwen-VL-Plus和Qwen-VL-Max可以理解流程圖等復雜形式圖片,可以分析復雜圖標,看圖做題、看圖作文、看圖寫代碼也不在話下。lvY28資訊網——每日最新資訊28at.com

限時免費!通義千問多模態大模型重磅升級:性能趕超GPT-4V和谷歌GeminiQwen-VL-Max看圖做題lvY28資訊網——每日最新資訊28at.com

圖像文本處理方面,升級版Qwen-VL的中英文文本識別能力顯著提高,支持百萬像素以上的高清分辨率圖和極端寬高比的圖像,既能完整復現密集文本,也能從表格和文檔中提取信息。lvY28資訊網——每日最新資訊28at.com

限時免費!通義千問多模態大模型重磅升級:性能趕超GPT-4V和谷歌GeminiQwen-VL-Max復現密集文本lvY28資訊網——每日最新資訊28at.com

LLM(大語言模型)之后,大模型領域的下一個爆點是什么?多模態是當前具共識的方向。過去半年來,OpenAI、谷歌等爭相推出多模態模型,阿里云也在2023年8月發布并開源具備圖文理解能力的Qwen-VL模型,Qwen-VL取得了同期遠超同等規模通用模型的表現。lvY28資訊網——每日最新資訊28at.com

視覺是多模態能力中重要的模態,作為人類感知世界、認知世界的第一感官,視覺傳遞的信息占據了“五感”信息的80%。通義千問視覺語言模型基于通義千問LLM開發,通過將視覺表示學習模型與LLM對齊,賦予AI理解視覺信息的能力,在大語言模型的“心靈”上開了一扇視覺的“窗”。lvY28資訊網——每日最新資訊28at.com

相比LLM,多模態大模型擁有更大的應用想象力。比如,有研究者在探索將多模態大模型與自動駕駛場景結合,為“完全自動駕駛”找到新的技術路徑;將多模態模型部署到手機、機器人、智能音箱等端側設備,讓智能設備自動理解物理世界的信息;或者基于多模態模型開發應用,輔助視力障礙群體的日常生活等等。lvY28資訊網——每日最新資訊28at.com

目前,Qwen-VL-Plus和Qwen-VL-Max限時免費,用戶可以在通義千問官網、通義千問APP直接體驗Max版本模型的能力,也可以通過阿里云靈積平臺(DashScope)調用模型API。lvY28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-17-68940-0.html限時免費!通義千問多模態大模型重磅升級:性能趕超GPT-4V和谷歌Gemini

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 微軟的2.5倍:蘋果公司人均創收達1680萬元!

下一篇: 銷量領跑!vivo奪得2023年中國手機市場國產品牌第一

標簽:
  • 熱門焦點
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 把LangChain跑起來的三個方法

    使用LangChain開發LLM應用時,需要機器進行GLM部署,好多同學第一步就被勸退了,那么如何繞過這個步驟先學習LLM模型的應用,對Langchain進行快速上手?本片講解3個把LangChain跑起來
  • 一文看懂為蘋果Vision Pro開發應用程序

    譯者 | 布加迪審校 | 重樓蘋果的Vision Pro是一款混合現實(MR)頭戴設備。Vision Pro結合了虛擬現實(VR)和增強現實(AR)的沉浸感。其高分辨率顯示屏、先進的傳感器和強大的處理能力
  • 這款新興工具平臺,讓你的電腦效率翻倍

    隨著信息技術的發展,我們獲取信息的渠道越來越多,但是處理信息的效率卻成為一個瓶頸。于是各種工具應運而生,都在爭相解決我們的工作效率問題。今天我要給大家介紹一款效率
  • Windows 11發布,微軟一改往常對老機型開放的態度

    距離 Windows 11 發布已經過去一周,在過去一周里,很多數碼愛好者圍繞其對 Android 應用的支持、對老機型的升級問題展開了激烈討論。與以往不同的是,在這次大
  • 電博會上海爾智家模擬500平大平層,還原生活空間沉浸式體驗

    電博會為了更好地讓參展觀眾真正感受到智能家居的絕妙之處,海爾智家的程傳嶺先生同樣介紹了展會上海爾智家的模擬500平大平層,還原生活空間沉浸式體驗。程傳
  • “買真退假” 這種“羊毛”不能薅

    □ 法治日報 記者 王春   □ 本報通訊員 胡佳麗  2020年初,還在上大學的小東加入了一個大學生兼職QQ群。群主“七王”在群里介紹一些刷單賺
  • Meta盲目擴張致超萬人被裁,重金押注元宇宙而前景未明

    圖片來源:圖蟲創意日前,Meta創始人兼CEO 馬克·扎克伯發布公開信,宣布Meta計劃裁員超11000人,占其員工總數13%。他公開承認了自己的預判失誤:“不僅
  • 北京:科技教育體驗基地開始登記

      北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌,后續還將開展常態化登記。  北京科技教育體驗基
Top 主站蜘蛛池模板: 乌海市| 绩溪县| 陇川县| 潞城市| 玛曲县| 兴海县| 滦南县| 珠海市| 溧水县| 康定县| 江陵县| 老河口市| 洮南市| 车险| 安平县| 米脂县| 淮阳县| 曲水县| 海安县| 荆门市| 白水县| 灵寿县| 河南省| 琼结县| 丽江市| 临城县| 甘南县| 宝丰县| 措美县| 台中县| 科技| 汤原县| 牙克石市| 镇赉县| 长治县| 长治市| 临清市| 巢湖市| 襄垣县| 永康市| 封开县|