日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

斯坦福大模型評測榜 Claude 3 排名第一,阿里 Qwen2、零一萬物 Yi Large 國產(chǎn)模型進入前十

來源: 責編: 時間:2024-06-25 17:11:53 212觀看
導讀 6 月 22 日消息,斯坦福大學基礎模型研究中心(CRFM)6 月 11 日發(fā)布了大規(guī)模多任務語言理解能力評估(Massive Multitask Language Understanding on HELM)排行榜,其中綜合排名前十的大語言模型中有兩款來自中國廠商,分

6 月 22 日消息,斯坦福大學基礎模型研究中心(CRFM)6 月 11 日發(fā)布了大規(guī)模多任務語言理解能力評估(Massive Multitask Language Understanding on HELM)排行榜,其中綜合排名前十的大語言模型中有兩款來自中國廠商,分別是阿里巴巴的 Qwen2 Instruct(72B)和零一萬物的 Yi Large(Preview)。DIL28資訊網(wǎng)——每日最新資訊28at.com

據(jù)悉大規(guī)模多任務語言理解能力評估(MMLU on HELM)采用了 Dan Hendrycks 等人提出的一種測試方法,用于衡量文本模型在多任務學習中的準確性。這個測試內(nèi)容包括基礎數(shù)學、美國歷史、計算機科學、法律等領域的 57 個任務。要在這個測試中獲得高分,模型必須具備廣泛的世界知識和解決問題的能力。附排名如下:DIL28資訊網(wǎng)——每日最新資訊28at.com

DIL28資訊網(wǎng)——每日最新資訊28at.com

▲ 圖源斯坦福大學基礎模型研究中心官網(wǎng)

1、Claude 3 Opus(20240229): Anthropic(美國,亞馬遜投資)DIL28資訊網(wǎng)——每日最新資訊28at.com

2、GPT-4o(2024-05-13):OpenAI(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

3、Gemini 1.5 Pro:谷歌(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

4、GPT-4(0613):OpenAI(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

5、Qwen2 Instruct(72B):阿里巴巴(中國)DIL28資訊網(wǎng)——每日最新資訊28at.com

6、GPT-4 Turbo(2024-04-09):OpenAI(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

7、Gemini 1.5 Pro(0409 preview):谷歌(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

8、GPT-4 Turbo(1106 preview):OpenAI(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

9、Llama 3(70B):Meta(美國)DIL28資訊網(wǎng)——每日最新資訊28at.com

10、Yi Large(Preview):零一萬物(中國)DIL28資訊網(wǎng)——每日最新資訊28at.com

Qwen2 是由阿里巴巴開發(fā)的一款開源大語言模型,發(fā)布于今年 6 月 6 日。Qwen2 系列包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B 在內(nèi)的五個不同規(guī)模的預訓練及指令微調(diào)模型;支持除英語和中文外的額外 27 種語言的數(shù)據(jù)訓練;Qwen2-7B-Instruct 和 Qwen2-72B-Instruct 支持長 128K 個 token 的上下文。DIL28資訊網(wǎng)——每日最新資訊28at.com

Yi Large 是由零一萬物公司開發(fā)的一款閉源大模型,Yi 模型系列基于 6B 和 34B 預訓練語言模型,然后擴展到聊天模型、200K 長上下文模型、深度升級模型和視覺語言模型。官方宣稱“其在關(guān)鍵基準測試分數(shù)上優(yōu)于 GPT-4 和 Claude 3 Opus 等領先模型”。DIL28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4773-0.html斯坦福大模型評測榜 Claude 3 排名第一,阿里 Qwen2、零一萬物 Yi Large 國產(chǎn)模型進入前十

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: GPT-4o 差點沒及格!首個多任務長視頻評測基準,它有億點難

下一篇: 消息稱蘋果與 Meta 討論合作,將生成式 AI 引入 Apple Intelligence

標簽:
  • 熱門焦點
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關(guān)的大新聞——雷克薩斯中國區(qū)一個高管受賄10億日元(約合人民幣5000
  • AI大模型“戰(zhàn)火”燒到了教育領域

    作者:劉曠自2023年開年以來,AI大模型這股風是越吹越猛烈了。隨著ChatGPT的出圈爆火,再度掀起了一波AI熱浪,無論是在國內(nèi)還是國外都有不少企業(yè)宣布入局或者跟進AI大模型領域。與
  • 茅臺的元宇宙App火了,也被罵慘了

    元宇宙從概念走向大眾生活,并不是一件簡單的事情。技術(shù)、世界觀、填充內(nèi)容、載體形式,每一個環(huán)節(jié)都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
  • 8個最適合藝術(shù)家發(fā)行NFT的交易市場

    近年來,加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創(chuàng)建稱為NFT 的數(shù)字資產(chǎn)。從 CyberKitties 到 Cyber Galleries,NFT 已成為藝術(shù)家和藝術(shù)鑒賞家的
  • 摩根大通:元宇宙市場預計每年收入超1萬億美元

    今日《元宇宙新鮮事》有:香港首屆元宇宙藝博會將于5月舉辦;NH-Amundi Asset Management上市其第二支元宇宙ETF;Meta虛擬現(xiàn)實平臺Horizon Worlds月活躍用戶在三個
  • NFT自動售貨機來啦!

    “紐約市有一臺售賣 Solana NFT 的自動售貨機,用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT,無需使用加密貨幣。由于基于 Solana 鏈的 N
  • 為什么元宇宙將永遠改變體育和你的生活?

    自從Facebook更名為Meta以來,Metaverse這個詞已經(jīng)被大家所熟知。但是當Metaverse仍然被許多人視為一個虛擬的平行世界時,一些項目已經(jīng)顯示出Metaverse將如何永遠
  • 又一家數(shù)字營銷公司入局元宇宙,國內(nèi)首個藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

    作者:董宇佳2月28日,智度股份在北京舉辦產(chǎn)品發(fā)布會,宣布其與國光電器聯(lián)手打造的國內(nèi)首個藝術(shù)元宇宙社區(qū)——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
  • 元宇宙平臺會是上世紀末的互聯(lián)網(wǎng)嗎?

    “元宇宙”火了好幾個月,互聯(lián)網(wǎng)大廠忙于布局,資本市場熱烈追捧。然而很多人還是看不明白,更多的人覺得這是一場泡沫,一場騙局。一開始接觸這個怪里怪氣的名詞,感覺
Top 主站蜘蛛池模板: 育儿| 通榆县| 黄龙县| 新野县| 温泉县| 北碚区| 靖安县| 红桥区| 双桥区| 东光县| 石门县| 梨树县| 波密县| 中山市| 巴青县| 若尔盖县| 邢台市| 皋兰县| 吉安市| 太和县| 宝鸡市| 石楼县| 襄垣县| 宁武县| 沛县| 商都县| 怀远县| 内丘县| 大方县| 大洼县| 淳化县| 庆安县| 罗平县| 平泉县| 邹城市| 澄迈县| 呼和浩特市| 武隆县| 阜平县| 玛沁县| 宁陕县|