當前位置：首頁 > 元宇宙 > AI

大模型高考作文比拼，騰訊墊底百度ChatGPT并列第一，幻覺問題成關鍵

來源：責編：時間：2025-06-09 09:39:14 84觀看

導讀在萬眾矚目的高考日，一場別開生面的“大模型高考作文賽”悄然拉開帷幕。這場由大模型之家主辦的賽事，不僅是對莘莘學子知識檢驗的呼應，更是對當下人工智能領域大模型能力的一次集中考量。今年的高考作文題并未直接涉及“

在萬眾矚目的高考日，一場別開生面的“大模型高考作文賽”悄然拉開帷幕。這場由大模型之家主辦的賽事，不僅是對莘莘學子知識檢驗的呼應，更是對當下人工智能領域大模型能力的一次集中考量。

今年的高考作文題并未直接涉及“人工智能”，但大模型之家巧妙地將北京卷的一道考題作為了比賽的試題，以“當數字閃耀時”為題，要求參賽的大模型們創作一篇記敘文。這不僅考驗了大模型的創作能力，更是一次對其“生活感知力”的檢驗。

在緊張激烈的角逐中，國內外7家主流大模型產品悉數登場，包括百度的文心一言、阿里的通義千問、騰訊的元寶、字節的豆包、深度求索的DeepSeek、月之暗面的Kimi，以及OpenAI的ChatGPT。它們各自開啟聯網能力，準備在這場“寫作+幻覺”的比拼中一展身手。

進入第二輪寫作能力比拼，各家大模型紛紛拿出看家本領，從取材到寫作風格各有千秋，但都能緊扣“數字閃耀時”這一主題，展開豐富的敘述。百度文心、阿里通義、ChatGPT通過多個生活片段的串聯，展現了數字在不同場景下的閃耀時刻；而元寶、豆包、Kimi、DeepSeek則更傾向于講述一個完整的故事，以細膩的筆觸描繪數字的魔力。

在閱卷環節，大模型之家采用了智能體閱卷的方式，確保判卷的公平性和準確性。經過智能體的細致評判，騰訊元寶憑借一篇以ICU監護儀數字變化為線索的文章脫穎而出，以49分的高分奪得作文環節的榜首。該文章通過搶救、康復、告別三個場景的串聯，深刻詮釋了數字作為生命體征載體的意義，情感真摯，敘事流暢。

這場大模型高考作文賽不僅是一次技術的較量，更是一次對人工智能未來發展的深刻思考。它提醒我們，大模型在面對開放性任務時，一旦脫離事實檢索或知識邊界的校驗機制，幻覺問題就可能成為其最大的“絆腳石”。因此，在追求技術進步的同時，我們更應關注模型的準確性和可靠性，確保人工智能能夠真正服務于人類社會。

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

面壁智能MiniCPM4：端側模型極限提速，8B性能超12B競品引關注

MiniCPM4-8B訓練開銷僅22%，加了長下文稀疏化版本，做到同等參數、性能更強，綜合得分對標Qwen3-8B、超越Gemma3-12B，在下列同類端側模型排行榜中分數排名第一。總體來看，MiniCP…

06-07

AI助力高考志愿填報，夸克百度訊飛誰更懂你的心？

06-07

數禾科技：自研反詐技術亮相網安博覽會，守護用戶數據安全獲好評

06-07

蘋果iPadOS 26大改版：新界面、手寫筆升級，AI與應用全面進化！

06-07

喜臨門榮獲中國專利優秀獎，智能睡眠技術創新實力獲國家級認可

06-07

小碼王與黑龍江工程學院強強聯手，打造信息學創新人才培育新高地

06-07

抖音重拳出擊：高考季嚴查AI押題、虛假志愿規劃等營銷騙局

06-07

抖音高考護航：嚴查AI押題、作弊服務等違規行為

06-07

AI爭霸賽，谷歌何以從領跑者變追趕者？

Bard初期表現不佳，與ChatGPT存在明顯差距，未能贏得用戶和市場的廣泛認可；看似能打的Gemini系列模型，實際使用卻引發不小爭議，圖像生成功能因出現種族偏見被迫下線；谷歌內部，搜索、Android、…

06-07

抖音嚴打高考作弊與虛假營銷，守護考生權益

06-07

AI高考作文大比拼：誰才是真正的“狀元”之才？

06-07

2025高考作文大比拼，DeepSeek、豆包、文心一言誰最亮眼？

它們不是悠揚的牧歌，而是生命在重壓下迸發的絕唱，是靈魂在荊棘中綻放的薔薇，讓我們看見：真正的歌唱從不在于聲音的完美，而在于生命最本真的震顫。嫦娥四號傳回的每一張照片，都是人類向宇宙發出的詰問與宣言，讓探索的火…

06-07

蘋果WWDC25或將重推游戲戰略，AI能力進展緩慢成隱憂？

06-07

Win11照片應用大升級！AI光線調控與自然語義搜索來襲

06-07

周鴻祎豪言：單挑360市場部，一人撐起新品發布會，AI智能體能否成真？

06-07

點擊查看更多 +

全站最新

面壁智能MiniCPM4：端側模型極限提速，8B性能超12B競品引關注

雷軍親證：購買小米YU7，一視同仁需自費

極氪001榮膺中國外觀設計金獎，展現中國高端豪華新能源設計魅力

蘋果iPhone 17配置大曝光：120Hz屏幕、A18芯片等亮點搶先看

全球首位QQ256級用戶誕生，解鎖“時光企鵝”等級圖標

東風本田銷量斷崖式下滑，新能源戰略失誤成主因？

熱門內容

榮耀“鯤鵬”照片事件真相大白，造謠者道歉遭刑拘
騰訊阿里AI to C戰場“雙吳”爭霸，誰將問鼎AI搜索之巔？
英偉達全球總部或將落戶中國臺灣，黃仁勛下周宣布這一重大決定？
教育部新規：學生禁直接復制AI作業，強化獨立思考與批判性思維
聯發科天璣9400e發布：天璣9300+升級版，藍牙升級至6.0
TIOBE 5月編程語言榜：Python強勢領跑，占比創歷史新高
中國知網CNKI AI：重塑知識服務新生態，四大核心力引領未來
中國GPU市場競爭激烈，英偉達獨占7成，華為昇騰緊追其后！
華為Mate 40系列（5G）已支持5G-A網絡，性能再升級！
華為nova 14系列震撼登場！鴻蒙5直板機領銜，nova 14僅售2699元起
教育部新規：中小學分階段用AI，嚴禁復制答案強化獨立思考
華為nova14 Ultra震撼登場！鴻蒙5系統加持，售價4199元起
vivo領跑！2025第18周中國手機份額華為小米緊追其后
DeepSeek新論文揭秘：梁文鋒領銜探索AI訓練推理成本效益之道
華為昇騰超節點技術突破：384卡高速互聯，引領AI模型訓練新紀元

本欄最新

AI助力高考志愿填報，夸克百度訊飛誰更懂你的心？

蘋果iPadOS 26大改版：新界面、手寫筆升級，AI與應用全面進化！

喜臨門榮獲中國專利優秀獎，智能睡眠技術創新實力獲國家級認可

小碼王與黑龍江工程學院強強聯手，打造信息學創新人才培育新高地

AI爭霸賽，谷歌何以從領跑者變追趕者？

AI高考作文大比拼：誰才是真正的“狀元”之才？

本文鏈接：http://www.www897cc.com/showinfo-45-13564-0.html大模型高考作文比拼，騰訊墊底百度ChatGPT并列第一，幻覺問題成關鍵

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI高考作文大比拼：誰是真才實學，誰在玩套路？

下一篇：面壁智能MiniCPM4：端側模型極限提速，8B性能超12B競品引關注

標簽：

熱門焦點

人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
沉寂3年，大模型激活小度天貓精靈？

Tech星球（微信ID：tech618）文 | 何煦陽沉寂了許久的智能音箱，在今年大模型橫空出世之后，又再次燃起了新的希望。 2月9日，小度宣布將融合文心一言，打造針對智能設備場景的AI模型&ldq
汽車元宇宙，是概念還是未來？

作者｜何文元宇宙是未來趨勢已經無需驗證。從概念上來看，元宇宙是兩種存在多年的概念的融合：虛擬現實和數字第二人生。這也就意味著，元宇宙所代表的是一種新的數
百度元宇宙希壤是什么？（附下載）

百度元宇宙希壤是什么，最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入？今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

擴展現實（XR）通過計算機將真實與虛擬相結合，打造了一個可人機交互的虛擬環境，將AR、VR、MR多種技術相融合，為體驗者帶來了虛擬世界與現實世界之間無縫轉換的“沉浸
摩根大通：元宇宙市場預計每年收入超1萬億美元

今日《元宇宙新鮮事》有：香港首屆元宇宙藝博會將于5月舉辦；NH-Amundi Asset Management上市其第二支元宇宙ETF；Meta虛擬現實平臺Horizon Worlds月活躍用戶在三個
“我沒搞懂元宇宙，但一天能賺9w塊”

作者：鄭宇軒最近幾個月，“元宇宙”爆火，除了 Facebook 改名為 Meta 高調進軍元宇宙外， BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間，元宇宙成為新風口，除了
這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發揮作用

前米高梅首席執行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個新的好萊塢工作室，提供 NFT，讓持有者在制作中發揮作用Electromagnetic Productions 創始
NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

Block-810多個區塊鏈吸引了希望創建單個NFT或整個集合的用戶的注意。Tezos是其中因其低費用和低碳排放方式而備受贊譽的區塊鏈，就連Snoop Dogg也希望通過公開他

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

大模型高考作文比拼，騰訊墊底百度ChatGPT并列第一，幻覺問題成關鍵

人間誠實周鴻祎：360 All in 大模型的六個解讀

沉寂3年，大模型激活小度天貓精靈？

汽車元宇宙，是概念還是未來？

百度元宇宙希壤是什么？（附下載）

高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

摩根大通：元宇宙市場預計每年收入超1萬億美元

“我沒搞懂元宇宙，但一天能賺9w塊”

這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發揮作用

NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

最新推薦

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

元宇宙風歸何處？

以太坊面臨來自Fantom的巨大挑戰

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

知名藝術家打造去中心化“好萊塢”：一部電影一個DAO

NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

猜你喜歡

熱門推薦

相關資訊