日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

DeepSeek昨天開源的新模型 有點邪門

來源: 責編: 時間:2025-10-22 13:25:10 24觀看
導讀 DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。更是直接把一堆老外給釣成了翹嘴。昨天,DeepSeek 發布了新模型 Dee

DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。EdE28資訊網——每日最新資訊28at.com

更是直接把一堆老外給釣成了翹嘴。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

昨天,DeepSeek 發布了新模型 DeepSeek-OCR,OCR 這東西咱們都熟悉,就是把圖片里的文字給識別出來。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

經常用微信的差友應該知道,微信客戶端里的圖片,被咱們點開后,是可以直接復制文字的。EdE28資訊網——每日最新資訊28at.com

沒錯,這就是一種 OCR 技術的應用。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

但是 DeepSeek 這次的 「技能 OCR」則是剛好相反,它可以把大量文字變成一張圖片,作為 AI 的“記憶載體”。EdE28資訊網——每日最新資訊28at.com

是的,用文字來存儲信息,已經不夠滿足它了。EdE28資訊網——每日最新資訊28at.com

過去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、還是 DeepSeek 過去的自己,在讀取數據的用的都是一種方式:文字,也就是平時常說的 token。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

我們寫的 Prompt,會被轉換成一大堆的 token 給大模型,我們提供的參考資料,會被轉換成一大堆的 token 給大模型,就算是能識別圖像的多模態的大模型,也是要先把圖片轉換成了一段文字描述,來交給大模型來做辨認才行。EdE28資訊網——每日最新資訊28at.com

但文字 token 真的就是大模型理解世界的唯一方式么?EdE28資訊網——每日最新資訊28at.com

DeepSeek 決定試一試新的路子,畢竟,如果咱們把一張圖片和一段文字放在一起,前者明顯可以包含下更多的信息。EdE28資訊網——每日最新資訊28at.com

比如這個描述,就不夠全面EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

既然如此,那我們能不能直接用圖片來訓練大模型?EdE28資訊網——每日最新資訊28at.com

于是 DeepSeek 就開始整,結果發現這個用圖片訓練出來的模型,既中看,又中用。EdE28資訊網——每日最新資訊28at.com

一方面,它可以用更少的 token,來記住更多的內容。EdE28資訊網——每日最新資訊28at.com

在測試文檔理解能力的任務里,DeepSeek-OCR 只用了 100 個視覺 token, 就超過了需要 256 個 token 的 GOT-OCR 2.0。EdE28資訊網——每日最新資訊28at.com

再放狠點,它用 不到 800 個視覺 token, 就吊打了平均要 6000+ token 的 MinerU 2.0。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

這就意味著、當我們讓大模型開始使用圖像的這種方式來記住數據了之后,模型就有能力用更少的token資源,來取得更好的表達效果。EdE28資訊網——每日最新資訊28at.com

另外,DeepSeek-OCR 還支持多種分辨率和壓縮模式,來適應不同復雜度的文檔:EdE28資訊網——每日最新資訊28at.com

比如說一張只有圖片背景和標題文案的 PPT,可能只需要 64 個 視覺token 就足夠表示了。EdE28資訊網——每日最新資訊28at.com

如果這頁的文字內容比較多,那就會自動切換到 Large 模式,用上多 400 個 視覺token 來記錄。EdE28資訊網——每日最新資訊28at.com

如果覺得還不夠的話,DeepSeek-OCR 還能支持動態調整的 Gundam 模式來記憶圖片,主打一個應記就記,分清輕重緩急的記。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

而且比起過去只能識別文字的傳統模型來說,DeepSeek-OCR 能記住的數據還會更多。EdE28資訊網——每日最新資訊28at.com

論文里的一張柱狀體,DeepSeek-OCR 能夠自動把它給識別成 Excel 格式給保存下來。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

文章里出現的有機化合物的分子結構圖片,也能自動轉化為標準的 SMILES(簡化分子線性輸入規范)格式存儲。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

不但能記住圖片本身,DeepSeek-OCR 還會同時記住這張圖片的位置,記住圖片附近的文字在寫些什么東西。。。EdE28資訊網——每日最新資訊28at.com

過去很多看不到的二維信息,都會被 DeepSeek-OCR 給再次捕獲。EdE28資訊網——每日最新資訊28at.com

這玩意的價值有多大,可能大家一下都還沒意識到。EdE28資訊網——每日最新資訊28at.com

這兩年做大模型,除了顯卡不夠之外的大問題,就是沒有訓練的數據了。EdE28資訊網——每日最新資訊28at.com

常規的數據集之前都用過了,想要再搞點高質量的數據集,要么偷偷去網上爬,要么花大價錢去買,再要么就是想辦法自己合成。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

但現在,很多過去沒采集到的數據,就可以在二維信息里被采集到了。EdE28資訊網——每日最新資訊28at.com

就比如說很多論文文件,過去,大模型只能學到里面的文字信息,但是里面的各種圖表,插圖那都是兩眼一摸黑。EdE28資訊網——每日最新資訊28at.com

但用上了 DeepSeek-OCR 之后,就可以把之前缺的這部分給無痛補上了。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

實際上 DeepSeek 也是這么想的,在論文里還特意提了一嘴,說這個新模型在一張 A100 上,一天可以給大模型采集出 20 萬頁以上的訓練數據。EdE28資訊網——每日最新資訊28at.com

所以說,在有了 DeepSeek-OCR 之后,過去的所有數據都值得用它來再識別一遍。EdE28資訊網——每日最新資訊28at.com

毫無疑問,這些數據,又會成為下一個大模型的養料。EdE28資訊網——每日最新資訊28at.com

另一方面,用二維的方式來存儲數據后,整個模型運行起來也變得更省資源了。EdE28資訊網——每日最新資訊28at.com

咱都知道,我們在用大模型的時候,聊天聊的越久、上下文越長,這個模型就越容易出 bug。EdE28資訊網——每日最新資訊28at.com

這是因為大模型在運行的時候,要處理每一個單詞,和其他所有單詞的關系。EdE28資訊網——每日最新資訊28at.com

你把對話的長度增加一倍,整個模型的計算量就增加了四倍,增加了兩倍,那整個模型的計算量就變成了原本的九倍。EdE28資訊網——每日最新資訊28at.com

這也是為啥現在大模型廠商都在給你限制上下文長度的原因之一,你要是在一個對話里聊的太嗨了的話,成本要直接卷上天去了。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

而在用上了圖像記憶之后,DeepSeek 可以把 token 的數量,壓縮到原本的十分之一。。。EdE28資訊網——每日最新資訊28at.com

同時,還不會讓性能有太大的損失。EdE28資訊網——每日最新資訊28at.com

在論文里可以看到,初出茅廬的 DeepSeek-OCR,就能用原本 1/10 的token 數量,達到原模型 96.5%的準確率。EdE28資訊網——每日最新資訊28at.com

即使哥們再狠點,給它壓縮個20倍,模型的準確率,也還能保持個六成左右。。。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

同時,DeepSeek 的研究人員還發現了一件好玩的事情。EdE28資訊網——每日最新資訊28at.com

他們會感覺大模型通過不同的清晰度來存儲圖像的方式,其實和我們人類遺忘信息的方式很像。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

對我們人類來說,遺忘是一個循序漸進的過程。EdE28資訊網——每日最新資訊28at.com

剛發生的事情,就有點像是 DeepSeek 用 Gundam 模式存下來的數據,清晰。EdE28資訊網——每日最新資訊28at.com

而隨著時間的推移,這件事的重要性也會逐漸降低,存儲它的格式也會從大的 Gundam 一路降級,從 Large 一路降到小的 Tiny,占用的 token 數量也會越來越少。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

把這個概念引入到大模型里的話,咱們就可以把近的聊天記錄,用“4K HDR藍光” 的格式來存儲,而那些早年不太重要的聊天記錄,則是給壓縮成 480P 的文件保存。EdE28資訊網——每日最新資訊28at.com

通過這種主動遺忘的方式,是否能讓大模型的上下文能力變得更強呢?EdE28資訊網——每日最新資訊28at.com

這個想法很有意思,只不過目前就連 DeepSeek 自己也沒能給出一個明確的答案。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

不過好在 DeepSeek-OCR 還是和過去一樣開源的,相信這個問題,要不了多久就會變成熱門,整出不少新東西來。EdE28資訊網——每日最新資訊28at.com

后,提到開源,我還注意到另外一件事。。。EdE28資訊網——每日最新資訊28at.com

這次研究不但是 DeepSeek 自己的成果,也是開源社區集體的勝利EdE28資訊網——每日最新資訊28at.com

比如訓練數據里,用到了 華為的 Wukong 數據集,在生成樣本文字時,借助了 百度的 PaddleOCR,而在圖像特征提取部分,核心組件竟然是 Meta 開源的 SAM,在視覺語義理解層面,還整合了 OpenAI 的 CLIP 模型。EdE28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門EdE28資訊網——每日最新資訊28at.com

正是這些來自全球的開源成果,被 DeepSeek 重新編織成了一個能“用圖片思考”的 AI。EdE28資訊網——每日最新資訊28at.com

所以,R2 什么時候會來呢。EdE28資訊網——每日最新資訊28at.com


文章出處:差評

本文鏈接:http://www.www897cc.com/showinfo-17-184425-0.htmlDeepSeek昨天開源的新模型 有點邪門

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI也缺卡!僧多粥少 自曝內部搶卡搶到發瘋

下一篇: 又菜又愛玩的荷蘭人 在安世半導體上翻車了

標簽:
  • 熱門焦點
  • 紅魔電競平板評測:大屏幕硬實力

    前言:三年的疫情因為要上網課的原因激活了平板市場,如今網課的時代已經過去,大家的生活都恢復到了正軌,這也就意味著,真正考驗平板電腦生存的環境來了。也就是面對著這種殘酷的
  • 一篇聊聊Go錯誤封裝機制

    %w 是用于錯誤包裝(Error Wrapping)的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞,用于將一個錯誤(或其他可打印的值)包裝在一個新的錯誤中。使
  • 得物效率前端微應用推進過程與思考

    一、背景效率工程隨著業務的發展,組織規模的擴大,越來越多的企業開始意識到協作效率對于企業團隊的重要性,甚至是決定其在某個行業競爭中突圍的關鍵,是企業長久生存的根本。得物
  • 東方甄選單飛:有些鳥注定是關不住的

    作者:彭寬鴻來源:華爾街科技眼‍‍‍‍‍‍‍‍‍‍東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
  • 認真聊聊東方甄選:如何告別低垂的果實

    來源:山核桃作者:財經無忌爆火一年后,俞敏洪和他的東方甄選依舊是頗受外界關心的“網紅”。7月5日至9日,為期5天的東方甄選“甘肅行”首次在自有App內直播,
  • 微博大門常打開,迎接海外畫師漂洋東渡

    作者:互聯網那些事“起猛了,我能看得懂日語了”。“為什么日本人說話我能聽懂?”“中文不像中文,日語不像日語,但是我竟然看懂了”…&hell
  • 支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發布限時優惠價369元

    2023年7月4日,“無損音質,聲動人心”iQOO TWS 1正式發布,支持aptX Lossless無損傳輸,限時優惠價369元。iQOO TWS 1耳機率先支持端到端aptX Lossless無
  • 上海舉辦人工智能大會活動,建設人工智能新高地

    人工智能大會在上海浦江兩岸隆重拉開帷幕,人工智能新技術、新產品、新應用、新理念集中亮相。8月30日晚,作為大會的特色活動之一的上海人工智能發展盛典人工
  • Meta盲目擴張致超萬人被裁,重金押注元宇宙而前景未明

    圖片來源:圖蟲創意日前,Meta創始人兼CEO 馬克·扎克伯發布公開信,宣布Meta計劃裁員超11000人,占其員工總數13%。他公開承認了自己的預判失誤:“不僅
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
销魂美女一区二区三区视频在线| 黄色小说综合网站| 欧美日韩国产在线| 欧美日韩免费视频| 国产日韩一区二区三区| 黄色在线成人| 99re在线精品| 欧美在线观看天堂一区二区三区| 久久婷婷影院| 欧美视频在线观看一区| 国产精品一区二区久久精品| 在线观看91精品国产入口| 亚洲免费不卡| 久久不射中文字幕| 欧美激情一区二区三区高清视频| 国产精品久在线观看| 永久久久久久| 亚洲永久在线| 美日韩在线观看| 欧美视频观看一区| 伊人久久综合| 亚洲影视综合| 麻豆亚洲精品| 国产精品腿扒开做爽爽爽挤奶网站| 在线成人激情视频| 亚洲欧美在线视频观看| 欧美大色视频| 国模精品一区二区三区色天香| 日韩亚洲欧美精品| 久久久综合免费视频| 国产精品久久久久久久久久久久| 亚洲第一在线| 久久不射中文字幕| 欧美午夜片欧美片在线观看| 在线视频成人| 久久成人免费电影| 国产精品久久久久久久第一福利 | 欧美高清在线精品一区| 国产美女精品| 一区二区三区日韩在线观看| 美女视频黄免费的久久| 国产欧美日韩综合| 一区二区三区视频在线播放| 免费观看在线综合| 国模 一区 二区 三区| 亚洲香蕉在线观看| 欧美精品一区二区三区视频| 激情综合网址| 欧美在线你懂的| 国产精品第三页| 亚洲精品一区二区三区在线观看| 久久久国际精品| 国产农村妇女毛片精品久久莱园子| 亚洲精品综合精品自拍| 老司机免费视频久久| 国产亚洲欧美一级| 午夜天堂精品久久久久| 欧美先锋影音| 99伊人成综合| 欧美另类一区二区三区| 亚洲国产专区校园欧美| 久久综合网色—综合色88| 国产亚洲人成a一在线v站| 亚洲欧美日韩综合国产aⅴ| 欧美三级免费| 中日韩美女免费视频网址在线观看| 欧美大片免费观看| 亚洲国产成人精品女人久久久| 久久九九全国免费精品观看| 国产亚洲免费的视频看| 欧美一区二区视频观看视频| 国产精品一区久久久久| 亚洲欧美国产精品专区久久| 国产精品久久久久久影视 | 久久九九免费| 国产综合色产在线精品| 久久精品视频免费播放| 国产一区二区三区在线免费观看| 欧美一区二区播放| 国产日韩在线亚洲字幕中文| 欧美一区二区三区男人的天堂| 国产精品―色哟哟| 午夜精品福利一区二区三区av| 国产精品视频一二三| 午夜精品亚洲一区二区三区嫩草| 国产精品一区一区| 篠田优中文在线播放第一区| 国产日韩欧美一区二区三区四区| 欧美在线一区二区| 国内自拍视频一区二区三区| 久久久亚洲午夜电影| 在线不卡免费欧美| 欧美国产欧美综合| 99天天综合性| 国产精品麻豆va在线播放| 午夜精品久久久久久久蜜桃app | 老司机免费视频一区二区三区| 亚洲第一伊人| 欧美日韩国产在线播放| 亚洲婷婷国产精品电影人久久| 国产精品免费观看视频| 欧美一区二区国产| 精品99一区二区| 欧美第一黄网免费网站| 一本色道久久综合亚洲91| 国产精品va在线播放我和闺蜜| 午夜精品剧场| 在线免费观看日本一区| 欧美日韩国产电影| 午夜精品久久久久久久男人的天堂| 国产亚洲免费的视频看| 欧美成人黄色小视频| 99精品热视频只有精品10| 国产精品一区二区三区久久久| 久久经典综合| 亚洲精品社区| 国产精品一二三| 久久综合一区| 一本久道久久综合狠狠爱| 国产美女搞久久| 欧美成人国产va精品日本一级| 中国日韩欧美久久久久久久久| 国产一区二区三区成人欧美日韩在线观看 | 欧美日韩不卡在线| 亚洲欧美在线视频观看| 在线观看日韩av先锋影音电影院| 欧美日韩国产区| 欧美一区二区在线免费观看| 亚洲激情在线播放| 国产精品美女久久福利网站| 久久先锋资源| 亚洲一区二区精品在线观看| 一区二区视频免费完整版观看| 欧美日韩在线视频观看| 久久久久国产精品www| 日韩午夜精品| 国产综合激情| 欧美性理论片在线观看片免费| 久久色在线观看| 亚洲一级特黄| 亚洲国产精品va在线看黑人动漫| 国产精品久久久久久影院8一贰佰| 久久亚洲私人国产精品va媚药| 亚洲亚洲精品三区日韩精品在线视频 | 久久久久久亚洲综合影院红桃| 一区二区免费在线视频| 激情丁香综合| 国产精品美女主播| 欧美国产一区二区在线观看| 欧美一区二区三区在线看| 99re66热这里只有精品3直播 | 亚洲精品乱码久久久久| 国产日韩欧美| 欧美日韩视频一区二区| 久久先锋影音| 午夜久久美女| 洋洋av久久久久久久一区| 在线观看91精品国产入口| 国产精品伦一区| 欧美日本在线观看| 老司机精品视频网站| 欧美一级片久久久久久久| 9l国产精品久久久久麻豆| 在线观看视频一区二区欧美日韩| 国产农村妇女精品| 欧美亚洲成人免费| 欧美激情一区| 美女性感视频久久久| 久久黄色级2电影| 亚洲免费在线| 中日韩午夜理伦电影免费| 亚洲欧洲综合另类在线| 精品999成人| 国产亚洲欧美另类中文 | 日韩午夜在线观看视频| 在线看片第一页欧美| 国产亚洲在线观看| 国产精品欧美日韩一区二区| 欧美日韩国产欧美日美国产精品| 久久午夜视频| 久久裸体艺术| 久久久国产视频91| 欧美在线播放| 午夜视频在线观看一区二区三区 | 国产亚洲欧洲| 国产农村妇女精品一区二区| 国产精品草莓在线免费观看| 欧美日韩爆操| 欧美日韩亚洲视频| 欧美日韩精品一二三区| 欧美理论片在线观看| 欧美精品电影| 欧美精品一区三区| 欧美精品尤物在线| 欧美激情在线观看| 欧美另类99xxxxx| 欧美日本在线播放| 欧美日韩p片| 欧美日韩播放| 欧美日韩综合一区| 国产精品白丝av嫩草影院| 国产精品久久久久久久久果冻传媒 | 欧美高清视频一区| 欧美国产三区|