日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

初探 OpenAI GPT-4.1 性能:AI 編程能力大增,但谷歌 Gemini 依然稱王

來源: 責編: 時間:2025-04-18 06:48:58 62觀看
導讀 4 月 16 日消息,科技媒體 bleepingcomputer 昨日(4 月 15 日)發布博文,報道稱 OpenAI 最新發布的 GPT-4.1 系列模型,其性能相比 GPT-4o 雖然實現重大飛躍,但多項跑分未能超越谷歌的 Gemini 系列。昨日報道,OpenAI 公

4 月 16 日消息,科技媒體 bleepingcomputer 昨日(4 月 15 日)發布博文,報道稱 OpenAI 最新發布的 GPT-4.1 系列模型,其性能相比 GPT-4o 雖然實現重大飛躍,但多項跑分未能超越谷歌的 Gemini 系列。tkf28資訊網——每日最新資訊28at.com

昨日報道,OpenAI 公司發布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,官方公布的跑分數據來看,這些模型在編程方面的能力,遠超 GPT-4o 及 GPT-4o mini。tkf28資訊網——每日最新資訊28at.com

例如在 SWE-bench Verified 跑分中,GPT-4o 的得分為 21.4%,GPT-4.5 的得分為 26.6%,而 GPT-4.1 的得分為 54.6%。tkf28資訊網——每日最新資訊28at.com

tkf28資訊網——每日最新資訊28at.com

盡管性能有較大提升,不過根據多位專家測試,相比較谷歌的 Gemini 系列,GPT-4.1 對比中卻顯露劣勢。tkf28資訊網——每日最新資訊28at.com

根據 Stagehand(一款生產級瀏覽器自動化框架)發布的基準數據,Gemini 2.0 Flash 的錯誤率僅為 6.67%,精確匹配率高達 90%,且價格低廉、速度更快。相比之下,GPT-4.1 的錯誤率高達 16.67%,成本更是 Gemini 2.0 Flash 的 10 倍以上。tkf28資訊網——每日最新資訊28at.com

tkf28資訊網——每日最新資訊28at.com

此外,哈佛大學 RNA 科學家 Pierre Bongrand 提供的數據也指出,GPT-4.1 的性價比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等競品。tkf28資訊網——每日最新資訊28at.com

tkf28資訊網——每日最新資訊28at.com

在編碼專項測試中,GPT-4.1 同樣未能占據上風。Aider Polyglot 的測試結果顯示,GPT-4.1 的編碼得分僅為 52%,而 Gemini 2.5 則以 73% 的成績遙遙領先。tkf28資訊網——每日最新資訊28at.com

tkf28資訊網——每日最新資訊28at.com

值得注意的是,GPT-4.1 被歸類為非推理模型(non-reasoning model),但其編碼能力仍屬行業頂尖。tkf28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12352-0.html初探 OpenAI GPT-4.1 性能:AI 編程能力大增,但谷歌 Gemini 依然稱王

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 的 GPT - 4.1 無安全報告,AI 安全透明度再遭質疑

下一篇: 消息稱蘋果 watchOS 12 將引入 Apple Intelligence 功能,依賴 iPhone 運行模型

標簽:
  • 熱門焦點
  • 錯過了BRC20還有eths,eth銘文協議

    來源:三頭鳥NFT大家好,我是鳥哥,了解鳥哥的人都知道鳥哥擅擼空投,說實話擼毛雖然回報大但周期還是有點長的,所以除了擼毛我們自己也在研究早期項目,打新,比如BRC20協議ordi當時就有
  • 從科幻走進現實,元宇宙概念逐漸清晰

    2021年,元宇宙概念如同一顆炸彈投進互聯網行業,掀起了一場數字海嘯,眾多企業紛紛入局,在此新領域展開新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻紅,元宇宙走進資本圈2021年3
  • 保時捷推出虛擬超跑,車企元宇宙營銷這么香?

    保時捷又出超跑了,不過這次不是在現實世界,而是在虛擬世界。這款Vision Gran Turismo概念車,由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造,將于202
  • 【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

    虛擬數字人行業未來的主要驅動力包括:用戶代際變化,新一代消費者對內容消費和虛擬世界更為渴求;虛擬數字人相關技術門檻相對降低,成本有所回落;資本熱度上升,受Metav
  • 比特幣的價格越高,使用價值越大

    隔夜比特幣還是在精準地橫盤在42k上方。空頭昨日試圖發起一波小的攻勢,但是晚上就被多頭掰了回來。以太坊的鏈上gas price降到了60 gwei以下,彰顯著市場活躍度的
  • 城市數字孿生標準化白皮書(2022版)

    當前,城市數字孿生已經發展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯,實
  • 虛擬數字人:元宇宙的主角破圈而來

    虛擬數字人市場逐步進入成熟期,商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • Steam 禁止NFT和加密貨幣原因曝光

    近日,Valve(V社)總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日,PC Gamer就報道Steam推出的新規:使用區塊鏈或允許交
  • NFT行業周報:NBA巨星勒布朗·詹姆斯申請NFT相關商標

    1. “無聊猿”BAYC交易總額突破14億美元3月10日,據DappRader最新數據顯示,“無聊猿”Bored Ape Yacht Club(BAYC)交易總額已突破14億美元,創下歷史新高,本文撰寫時為
Top 主站蜘蛛池模板: 黄梅县| 天等县| 顺平县| 札达县| 石泉县| 抚州市| 东台市| 进贤县| 昌图县| 密云县| 丰都县| 宿州市| 威宁| 永仁县| 铁岭县| 金川县| 三江| 安化县| 哈巴河县| 丽江市| 清原| 新郑市| 宜春市| 方城县| 南充市| 平塘县| 尼勒克县| 庆城县| 浪卡子县| 宜宾县| 新巴尔虎右旗| 青龙| 合水县| 荣成市| 上杭县| 永年县| 邻水| 安图县| 修文县| 汶上县| 南部县|