在萬眾矚目的高考日,一場別開生面的“大模型高考作文賽”悄然拉開帷幕。這場由大模型之家主辦的賽事,不僅是對莘莘學子知識檢驗的呼應,更是對當下人工智能領域大模型能力的一次集中考量。
今年的高考作文題并未直接涉及“人工智能”,但大模型之家巧妙地將北京卷的一道考題作為了比賽的試題,以“當數字閃耀時”為題,要求參賽的大模型們創作一篇記敘文。這不僅考驗了大模型的創作能力,更是一次對其“生活感知力”的檢驗。
在緊張激烈的角逐中,國內外7家主流大模型產品悉數登場,包括百度的文心一言、阿里的通義千問、騰訊的元寶、字節的豆包、深度求索的DeepSeek、月之暗面的Kimi,以及OpenAI的ChatGPT。它們各自開啟聯網能力,準備在這場“寫作+幻覺”的比拼中一展身手。
進入第二輪寫作能力比拼,各家大模型紛紛拿出看家本領,從取材到寫作風格各有千秋,但都能緊扣“數字閃耀時”這一主題,展開豐富的敘述。百度文心、阿里通義、ChatGPT通過多個生活片段的串聯,展現了數字在不同場景下的閃耀時刻;而元寶、豆包、Kimi、DeepSeek則更傾向于講述一個完整的故事,以細膩的筆觸描繪數字的魔力。
在閱卷環節,大模型之家采用了智能體閱卷的方式,確保判卷的公平性和準確性。經過智能體的細致評判,騰訊元寶憑借一篇以ICU監護儀數字變化為線索的文章脫穎而出,以49分的高分奪得作文環節的榜首。該文章通過搶救、康復、告別三個場景的串聯,深刻詮釋了數字作為生命體征載體的意義,情感真摯,敘事流暢。
這場大模型高考作文賽不僅是一次技術的較量,更是一次對人工智能未來發展的深刻思考。它提醒我們,大模型在面對開放性任務時,一旦脫離事實檢索或知識邊界的校驗機制,幻覺問題就可能成為其最大的“絆腳石”。因此,在追求技術進步的同時,我們更應關注模型的準確性和可靠性,確保人工智能能夠真正服務于人類社會。
本文鏈接:http://www.www897cc.com/showinfo-45-13564-0.html大模型高考作文比拼,騰訊墊底百度ChatGPT并列第一,幻覺問題成關鍵
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com