當前位置：首頁 > 元宇宙 > AI

商湯“書生?浦語”2.0 大語言模型開源：200K 上下文，一次可讀 30 萬漢字

來源：責編：時間：2024-01-22 08:39:10 334觀看

導(dǎo)讀 1 月 17 日消息，商湯科技與上海 AI 實驗室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)今日發(fā)布了新一代大語言模型書生?浦語 2.0（InternLM2）。據(jù)介紹，InternLM2 是在 2.6 萬億 token 的語料上訓(xùn)練得到的。沿襲第一代書生?浦語（I

1 月 17 日消息，商湯科技與上海 AI 實驗室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)今日發(fā)布了新一代大語言模型書生?浦語 2.0（InternLM2）。

據(jù)介紹，InternLM2 是在 2.6 萬億 token 的語料上訓(xùn)練得到的。沿襲第一代書生?浦語（InternLM）設(shè)定，InternLM2 包含 7B 及 20B 兩種參數(shù)規(guī)格及基座、對話等版本，繼續(xù)開源，提供免費商用授權(quán)。

目前，浦語背后的數(shù)據(jù)清洗過濾技術(shù)已經(jīng)歷三輪迭代升級，號稱僅使用約 60% 的訓(xùn)練數(shù)據(jù)即可達到使用第二代數(shù)據(jù)訓(xùn)練 1T tokens 的性能表現(xiàn)。

與第一代 InternLM 相比，InternLM2 在大規(guī)模高質(zhì)量的驗證語料上的 Loss 分布整體左移，表明其語言建模能力增強。

通過拓展訓(xùn)練窗口大小和位置編碼改進，InternLM2 支持 20 萬 tokens 的上下文，能夠一次性接受并處理約 30 萬漢字（約五六百頁的文檔）的輸入內(nèi)容。

下面表格對比了 InternLM2 各版本與 ChatGPT（GPT-3.5）以及 GPT-4 在典型評測集上的表現(xiàn)。可以看到，InternLM2 在20B 參數(shù)的中等規(guī)模上，整體表現(xiàn)接近 ChatGPT。

附開源鏈接：

Github：

https://github.com/InternLM/InternLM

HuggingFace：

https://huggingface.co/internlm

ModelScope：

https://modelscope.cn/organization/Shanghai_AI_Laboratory

本文鏈接：http://www.www897cc.com/showinfo-45-3249-0.html商湯“書生?浦語”2.0 大語言模型開源：200K 上下文，一次可讀 30 萬漢字

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：小米申請注冊“ChatMI”“小米大模型”商標，用于智能音箱、電動汽車等

下一篇： “文生圖”再升級！學(xué)習(xí)個性化參照，無限生成多樣圖片，輕松設(shè)計玩具建筑

標簽：

熱門焦點

VR/AR迷失元宇宙“硝煙”

不溫不火的VR/AR可穿戴設(shè)備因元宇宙崛起火了一陣，又隨著元宇宙回歸平靜。1月份，微軟在 Surface 設(shè)備、HoloLens 混合現(xiàn)實硬件和 Xbox 等部門裁員，其中負責混合現(xiàn)實硬件（MR）的Holo
“任何國產(chǎn)元宇宙都是假元宇宙”

上個月，華語樂壇的優(yōu)質(zhì)偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產(chǎn)品分布式大陸(Decentraland)上買了三塊虛擬地產(chǎn)，花了12.3萬美元（也就是人民幣接近80萬）。截至目
【量子位】虛擬數(shù)字人深度產(chǎn)業(yè)報告 | 元宇宙Meta洞見

虛擬數(shù)字人行業(yè)未來的主要驅(qū)動力包括：用戶代際變化，新一代消費者對內(nèi)容消費和虛擬世界更為渴求；虛擬數(shù)字人相關(guān)技術(shù)門檻相對降低，成本有所回落；資本熱度上升，受Metav
冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

《區(qū)塊鏈日報》記者查證，近日來冰墩墩數(shù)字藏品交易數(shù)量出現(xiàn)大幅下滑，而所謂的暴漲千倍更是有價無市的自嗨。昨日，北京冬奧會正式閉幕。在這屆冬奧會上，吉祥物“冰
好萊塢：一股新的電影制作加密浪潮將顛覆這個行業(yè)

在Moviecoin.com平臺上，有一部電影設(shè)定了一個前所未有的目標，即通過預(yù)售NFT獲得100%的全額融資，這部電影就是馬克·奧康納(Mark O’connor)執(zhí)導(dǎo)的《Oui Cannes》，
元宇宙社交時代，華麗歸來的超級QQ秀重構(gòu)虛擬社交場景

作者:狂人不知不覺間，QQ已經(jīng)迎來了第23個生日。作為國內(nèi)社交平臺的起點，QQ可謂是睥睨全網(wǎng)，不僅有龐大的用戶群體，還將虛擬形象及QQ整合成在線虛擬社區(qū)，開啟了時髦
Snoop Dogg 計劃推出致力于數(shù)字媒體NFT的專業(yè)公司

雅痞哥不知道這人是誰還上新聞，問了助理，解釋，相當于美版劉歡的地位吧。Snoop Dogg 在 NFT 領(lǐng)域已經(jīng)有一段時間了，尤其是在最近有消息稱人們在元宇宙中購買房地產(chǎn)
元宇宙專題二：GameFi 深度解析，元宇宙內(nèi)容雛形顯現(xiàn)

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術(shù)與去中心化價值觀賦能，GameFi 游戲資產(chǎn)化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開
我們?yōu)槭裁葱枰猈eb3，距離Web3的實現(xiàn)還有多遠？

當今技術(shù)正在經(jīng)歷著重要的變革，許多公司正在改變他們的經(jīng)營模式以求變得更加的靈活，其中有很大一部分公司采用了不同的方式來發(fā)展自己的業(yè)務(wù)。其中之一就是Web3，

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

商湯“書生?浦語”2.0 大語言模型開源：200K 上下文，一次可讀 30 萬漢字

VR/AR迷失元宇宙“硝煙”

“任何國產(chǎn)元宇宙都是假元宇宙”

【量子位】虛擬數(shù)字人深度產(chǎn)業(yè)報告 | 元宇宙Meta洞見

冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業(yè)

元宇宙社交時代，華麗歸來的超級QQ秀重構(gòu)虛擬社交場景

Snoop Dogg 計劃推出致力于數(shù)字媒體NFT的專業(yè)公司

元宇宙專題二：GameFi 深度解析，元宇宙內(nèi)容雛形顯現(xiàn)

我們?yōu)槭裁葱枰猈eb3，距離Web3的實現(xiàn)還有多遠？

最新推薦

茅臺的元宇宙App火了，也被罵慘了

萬字專訪Vitalik Buterin：以太坊將成為主流和最安全的基礎(chǔ)層

字節(jié)覓《原神》，騰訊元宇宙，游戲新王戰(zhàn)舊神？

元宇宙“概念股”集體崩塌，背后究竟發(fā)生了什么？

Interface正大光明的“跑路”，社區(qū)成員贊格局大

從NFT數(shù)字收藏，洞察數(shù)字音樂版權(quán)市場發(fā)展趨勢

猜你喜歡

熱門推薦

相關(guān)資訊