日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

斯坦福大模型評(píng)測(cè)榜 Claude 3 排名第一,阿里 Qwen2、零一萬(wàn)物 Yi Large 國(guó)產(chǎn)模型進(jìn)入前十

來(lái)源: 責(zé)編: 時(shí)間:2024-06-25 17:11:53 180觀(guān)看
導(dǎo)讀 6 月 22 日消息,斯坦福大學(xué)基礎(chǔ)模型研究中心(CRFM)6 月 11 日發(fā)布了大規(guī)模多任務(wù)語(yǔ)言理解能力評(píng)估(Massive Multitask Language Understanding on HELM)排行榜,其中綜合排名前十的大語(yǔ)言模型中有兩款來(lái)自中國(guó)廠(chǎng)商,分

6 月 22 日消息,斯坦福大學(xué)基礎(chǔ)模型研究中心(CRFM)6 月 11 日發(fā)布了大規(guī)模多任務(wù)語(yǔ)言理解能力評(píng)估(Massive Multitask Language Understanding on HELM)排行榜,其中綜合排名前十的大語(yǔ)言模型中有兩款來(lái)自中國(guó)廠(chǎng)商,分別是阿里巴巴的 Qwen2 Instruct(72B)和零一萬(wàn)物的 Yi Large(Preview)。rUU28資訊網(wǎng)——每日最新資訊28at.com

據(jù)悉大規(guī)模多任務(wù)語(yǔ)言理解能力評(píng)估(MMLU on HELM)采用了 Dan Hendrycks 等人提出的一種測(cè)試方法,用于衡量文本模型在多任務(wù)學(xué)習(xí)中的準(zhǔn)確性。這個(gè)測(cè)試內(nèi)容包括基礎(chǔ)數(shù)學(xué)、美國(guó)歷史、計(jì)算機(jī)科學(xué)、法律等領(lǐng)域的 57 個(gè)任務(wù)。要在這個(gè)測(cè)試中獲得高分,模型必須具備廣泛的世界知識(shí)和解決問(wèn)題的能力。附排名如下:rUU28資訊網(wǎng)——每日最新資訊28at.com

rUU28資訊網(wǎng)——每日最新資訊28at.com

▲ 圖源斯坦福大學(xué)基礎(chǔ)模型研究中心官網(wǎng)

1、Claude 3 Opus(20240229): Anthropic(美國(guó),亞馬遜投資)rUU28資訊網(wǎng)——每日最新資訊28at.com

2、GPT-4o(2024-05-13):OpenAI(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

3、Gemini 1.5 Pro:谷歌(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

4、GPT-4(0613):OpenAI(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

5、Qwen2 Instruct(72B):阿里巴巴(中國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

6、GPT-4 Turbo(2024-04-09):OpenAI(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

7、Gemini 1.5 Pro(0409 preview):谷歌(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

8、GPT-4 Turbo(1106 preview):OpenAI(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

9、Llama 3(70B):Meta(美國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

10、Yi Large(Preview):零一萬(wàn)物(中國(guó))rUU28資訊網(wǎng)——每日最新資訊28at.com

Qwen2 是由阿里巴巴開(kāi)發(fā)的一款開(kāi)源大語(yǔ)言模型,發(fā)布于今年 6 月 6 日。Qwen2 系列包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B 在內(nèi)的五個(gè)不同規(guī)模的預(yù)訓(xùn)練及指令微調(diào)模型;支持除英語(yǔ)和中文外的額外 27 種語(yǔ)言的數(shù)據(jù)訓(xùn)練;Qwen2-7B-Instruct 和 Qwen2-72B-Instruct 支持長(zhǎng) 128K 個(gè) token 的上下文。rUU28資訊網(wǎng)——每日最新資訊28at.com

Yi Large 是由零一萬(wàn)物公司開(kāi)發(fā)的一款閉源大模型,Yi 模型系列基于 6B 和 34B 預(yù)訓(xùn)練語(yǔ)言模型,然后擴(kuò)展到聊天模型、200K 長(zhǎng)上下文模型、深度升級(jí)模型和視覺(jué)語(yǔ)言模型。官方宣稱(chēng)“其在關(guān)鍵基準(zhǔn)測(cè)試分?jǐn)?shù)上優(yōu)于 GPT-4 和 Claude 3 Opus 等領(lǐng)先模型”。rUU28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4773-0.html斯坦福大模型評(píng)測(cè)榜 Claude 3 排名第一,阿里 Qwen2、零一萬(wàn)物 Yi Large 國(guó)產(chǎn)模型進(jìn)入前十

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: GPT-4o 差點(diǎn)沒(méi)及格!首個(gè)多任務(wù)長(zhǎng)視頻評(píng)測(cè)基準(zhǔn),它有億點(diǎn)難

下一篇: 消息稱(chēng)蘋(píng)果與 Meta 討論合作,將生成式 AI 引入 Apple Intelligence

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
  • 歐盟人工智能法案:四種AI系統(tǒng)風(fēng)險(xiǎn)類(lèi)型的劃分及監(jiān)管措施

    作者:趙志東 蔡佳雯來(lái)源:區(qū)塊鏈日?qǐng)?bào)該法案采用風(fēng)險(xiǎn)分級(jí)的規(guī)制路徑,將人工智能系統(tǒng)的風(fēng)險(xiǎn)劃分成不可接受的風(fēng)險(xiǎn)、高風(fēng)險(xiǎn)、有限風(fēng)險(xiǎn)和輕微風(fēng)險(xiǎn)四種類(lèi)型,并針對(duì)不同類(lèi)型施加了不同
  • AIGC產(chǎn)品測(cè)評(píng)TOP25丨誰(shuí)能搶到下個(gè)十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦陽(yáng)策劃 | 楊曉鶴封面來(lái)源 | 圖蟲(chóng)創(chuàng)意 2016年,李彥宏站在百度聯(lián)盟峰會(huì)的講臺(tái)上,向所有人宣布:互聯(lián)網(wǎng)的下一幕是人工智能。同年,Google 旗下 Dee
  • 25萬(wàn)虛擬er在“元宇宙”追星

    “默嘰默嘰,我是默默醬,我是在真元宇宙也有頭有臉的人。”12月11日晚20:00,虛擬偶像@默默醬的首場(chǎng)個(gè)人元宇宙演唱會(huì)《以夢(mèng)為馬,抵達(dá)繁星》在大有空間APP
  • 花房集團(tuán)上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集團(tuán)在港交所成功上市,首日便受到追捧,當(dāng)日最高漲幅達(dá)28.75%。繼360、360數(shù)科、魯大師后,這是“紅衣教主”周
  • 完美世界被元宇宙“拒之門(mén)外”

    春節(jié)期間,游戲是消磨時(shí)間最好的方式,完美世界的《幻塔》作為選擇的首要目標(biāo),倒不是因?yàn)樗奈τ卸啻螅兇馐菑V大網(wǎng)友的吐槽。繼《原神》之后,進(jìn)擊元宇宙的游戲
  • 多地釋放積極信號(hào),元宇宙正成為地方爭(zhēng)先競(jìng)逐的主戰(zhàn)場(chǎng)?

    2月21日,2022中國(guó)·金魚(yú)嘴元宇宙生態(tài)賦能大會(huì)在南京建鄴區(qū)金魚(yú)嘴基金街區(qū)舉辦,南京建鄴區(qū)金魚(yú)嘴基金街區(qū)宣布計(jì)劃出資1億元,支持元宇宙行業(yè)發(fā)展。同時(shí),會(huì)上發(fā)布了
  • 2022年元宇宙系列報(bào)告:UGC當(dāng)?shù)溃琗R帶來(lái)新交互體驗(yàn)

    UGC作為元宇宙的主要內(nèi)容創(chuàng)作模式,已經(jīng)越來(lái)越多的呈現(xiàn)于游戲、娛樂(lè)、社交、傳媒等方面,UGC模式勾勒了元宇宙的邊界,現(xiàn)今元宇宙UGC模式的主要呈現(xiàn)方式以元宇宙概念
  • 從概念到落地 Web3.0初具雛形

    加密資產(chǎn)熱潮催生出的鏈上應(yīng)用中,除了DeFi、NFT、鏈游GameFi等場(chǎng)景外,還有一個(gè)熱詞叫「Web3.0」。Web3.0的概念最早出現(xiàn)在2014年,由以太坊聯(lián)合創(chuàng)始人及波卡創(chuàng)建者
  • 全球十大元宇宙概念游戲

    A股市場(chǎng)中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱(chēng)將發(fā)布一款元宇宙概念的模擬經(jīng)營(yíng)類(lèi)游戲,盡管游戲尚在研發(fā)中,這一消息已經(jīng)讓中青寶的股價(jià)在51個(gè)交易
Top 主站蜘蛛池模板: 肃宁县| 昌图县| 山东省| 子长县| 六盘水市| 娄烦县| 深泽县| 泾阳县| 白玉县| 昌平区| 梁平县| 元氏县| 当阳市| 巴楚县| 株洲县| 高碑店市| 新蔡县| 华坪县| 玛沁县| 汤原县| 钟山县| 类乌齐县| 东乡| 房山区| 新宾| 清镇市| 申扎县| 扶风县| 陆川县| 增城市| 内黄县| 章丘市| 佛学| 贡嘎县| 苍南县| 富川| 福鼎市| 大埔区| 儋州市| 城固县| 天镇县|