Mixtral 8x22B:法國AI公司Mistral于2024年4月17日開源的對話" />

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 手機

AI“高考”成績出爐:數學全滅

來源: 責編: 時間:2024-06-20 15:13:40 119觀看
導讀 近日,上海人工智能實驗室公布了首個AI高考全卷評測結果,展示了GPT-4o與六個開源模型在面對高考語文、數學、英語試卷時的表現。此次參與測試的開源模型如下:
Mixtral 8x22B:法國AI公司Mistral于2024年4月17日開源的對話

近日,上海人工智能實驗室公布了首個AI高考全卷評測結果,展示了GPT-4o與六個開源模型在面對高考語文、數學、英語試卷時的表現。qem28資訊網——每日最新資訊28at.com

此次參與測試的開源模型如下:qem28資訊網——每日最新資訊28at.com


qem28資訊網——每日最新資訊28at.com

  • Mixtral 8x22B:法國AI公司Mistral于2024年4月17日開源的對話模型。
  • Yi-1.5-34B:零一萬物公司于2024年5月12日開源的Yi-1.5系列最大的模型。
  • GLM-4-9B:智譜AI于2024年6月4日推出的最新一代預訓練模型GLM-4系列的開源版本。
  • InternLM2-20B-WQX:上海人工智能實驗室于2024年6月4日開源的書生?浦語2.0系列文曲星大語言模型。
  • Qwen2-57B:阿里巴巴于2024年6月6日開源的Qwen2系列MoE對話模型。
  • Qwen2-72B:阿里巴巴于2024年6月6日開源的72B稠密模型。


qem28資訊網——每日最新資訊28at.com

此次選擇的六款模型均在高考前開源,這避免了開發者使用高考試題訓練模型,從而“作弊”。qem28資訊網——每日最新資訊28at.com

此次測試結果如下:qem28資訊網——每日最新資訊28at.com

qem28資訊網——每日最新資訊28at.com

可以看出,總成績方面阿里的Qwen2-72B排名第一,成績303分;GPYT-4o得分296分排名第二;第三則是來自上海人工智能實驗室的InternLM2-20B-WQX,295.5分。qem28資訊網——每日最新資訊28at.com

不過,有趣的是,數學成為了此次測試中所有大模型的短板,150分的試卷,沒有一款模型能夠達到90分的及格分。qem28資訊網——每日最新資訊28at.com

從結果來看,目前各家的大模型對于語義理解、文字溝通已經有了相對不錯的表現,但面對數學這樣強邏輯運算的領域,AI還是會力不從心。qem28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-22-95035-0.htmlAI“高考”成績出爐:數學全滅

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: MIX Flip消息匯總:可能是最強8Gen3小折疊

下一篇: 產能充足 華為Pura 70系列也開始降價了

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 杭锦后旗| 南康市| 古丈县| 苗栗县| 怀来县| 前郭尔| 修水县| 安泽县| 潞西市| 开阳县| 仙居县| 葵青区| 浦县| 宣化县| 额尔古纳市| 铜川市| 厦门市| 蓝山县| 沙河市| 龙江县| 西峡县| 平安县| 卓尼县| 锡林郭勒盟| 邹城市| 峨眉山市| 天峻县| 潢川县| 桦南县| 青浦区| 盐山县| 德令哈市| 古丈县| 巴林右旗| 惠来县| 宜春市| 景东| 修武县| 石景山区| 修文县| 故城县|