OpenAI近日震撼發布GPT-4.1系列模型,該系列包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三款,被譽為迄今為止最小、最快、最經濟的模型陣容,且在性能上超越了先前的GPT-4o和GPT-4o mini。cTl28資訊網——每日最新資訊28at.com
GPT-4.1系列模型的上下文窗口擴大至100萬個token,輸出token數也增至32768個,知識庫更新至2024年6月。據OpenAI的基準測試顯示,這些新模型在編碼、指令遵循以及長文本理解方面的表現均顯著優于前代產品。cTl28資訊網——每日最新資訊28at.com
GPT-4.1系列目前僅通過API提供給開發者,并已全面開放。同時,OpenAI宣布將逐步淘汰GPT-4.5預覽版,因為GPT-4.1系列在提供相似性能的同時,具備更低的成本和延遲。GPT-4.5預覽版將于7月14日正式關閉。cTl28資訊網——每日最新資訊28at.com
在性能優化方面,GPT-4.1在編碼任務上的提升尤為顯著。在SWE-bench驗證測試中,GPT-4.1得分54.6%,較GPT-4o提升了21.4%,較GPT-4.5提升了26.6%。在指令遵循方面,GPT-4.1在MultiChallenge基準測試中得分38.3%,較GPT-4o提高了10.5%。在長文本理解方面,GPT-4.1在Video-MME基準測試中,無字幕長文本類別得分72.0%,較GPT-4o提升了6.7%。cTl28資訊網——每日最新資訊28at.com
GPT-4.1 nano特別受到關注,因為它被認為是OpenAI最快、最經濟的模型。在基準測試中,GPT-4.1 nano的MMLU得分為80.1%,GPQA得分為50.3%,Aider多語言編碼得分為9.8%,均高于GPT-4o mini。對于需要處理大量查詢且對延遲敏感的應用場景,GPT-4.1 nano無疑是一個理想的選擇。cTl28資訊網——每日最新資訊28at.com
在編碼能力方面,GPT-4.1在多種任務上的表現均優于GPT-4o,包括解決編碼問題、前端編碼、減少不必要的編輯等。特別是在創建Web應用方面,GPT-4.1能夠生成功能更強大、美觀度更高的應用。在OpenAI的對比測試中,人工評分員在80%的情況下更青睞GPT-4.1生成的網站。cTl28資訊網——每日最新資訊28at.com
在指令遵循方面,OpenAI開發了一個內部評估系統,用于跟蹤模型在多個維度和關鍵指令遵循類別中的性能。GPT-4.1在困難提示方面的表現尤為出色,相較于GPT-4o有顯著提升。在MultiChallenge基準測試中,GPT-4.1比GPT-4o提高了10.5%。在IFeval測試中,GPT-4.1的得分也高于GPT-4o。cTl28資訊網——每日最新資訊28at.com
在長文本理解方面,GPT-4.1系列模型能夠處理高達100萬個token的上下文,這使其在處理大型代碼庫或大量長文檔時具有顯著優勢。OpenAI還對GPT-4.1進行了訓練,使其能夠在長和短上下文長度中忽略干擾信息。在實際測試中,GPT-4.1展現出了強大的“大海撈針”能力,能夠在所有位置以及各種上下文長度的情況下準確檢索到關鍵信息。cTl28資訊網——每日最新資訊28at.com
GPT-4.1系列的發布,為開發者構建智能系統和復雜的智能體應用提供了新的可能性。其卓越的性能和經濟性,將推動開發者將其與各類API結合使用,構建出更有用、更可靠的智能體。這些智能體有望在現實世界的軟件工程、文檔分析、客戶服務以及其他復雜任務中發揮巨大潛力。cTl28資訊網——每日最新資訊28at.com
舉報 0收藏 0打賞 0分享 0 更多>同類資訊科研星光照亮寒冬:新能源技術突破,溫暖十四億人04-15

“彩云市集”閃耀新加坡FHA,云企出海聯盟對接會成果斐然04-15

AI導航新紀元:會預判路況、懂你情緒的智能出行伙伴來了!04-15

廣州AI洗頭店走紅:13分鐘智能洗護,19元一次你試過沒?04-15

摩托車“壽命”僅13年?特別展示區見證愛車人的不舍與無奈04-15高德首推AI導航智能體,讓出行更懂你,有“溫度”的導航來了!04-15

vivo X200 Ultra影像新突破,蔡司鏡頭挑戰iPhone 16 Pro Max畫質極限04-15

達夢數據2024年業績亮眼:營收破10億大關,凈利增長超兩成04-15高德AI導航智能體上線,出行從此有了“思考”的伙伴!04-15

藍色起源全女性宇航員陣容震撼啟航,“水果姐”凱蒂?佩里領銜太空游04-15

HBO劇版《哈利·波特》主演陣容初揭曉,今夏開拍引期待!04-15美團外賣豪擲千億助力餐飲行業,未來三年共謀健康發展大計在2025中國餐飲連鎖峰會上,美團外賣總經理薛冰宣布,未來三年,美團外賣將向餐飲行業整體投入1000億元,幫助餐飲伙伴健康增長。 薛冰表示,1000億元將聚焦四大方向:幫助商家補貼消費者激活需求、發放助力金幫…04-14

隱私計算產業鏈深度解析:企業分布與投資動向全覽04-14

網紅“何同學”拒好評惹爭議,公眾人物該如何表達自我?04-14

西江24-7無人智能平臺組塊封頂,模塊化建造技術助力海洋工程新飛躍04-14點擊查看更多 +
全站最新
2025年汽車新紀元:這十款新車如何引領行業變革?

阿爾法羅密歐Kamal概念車:未來已來,獨特魅力何在?

中安能源榮耀上榜!2025中國充換電行業十大品牌評選實力見證

比亞迪漢L唐L長春震撼上市,20.98萬元起引領新能源科技新潮流!

電動新紀元,MINI JCW雙車上市,全球品質遇上中國調校!

歐盟碳排新規來襲,車企不達標將遭千億罰款,中國車企如何破局?
熱門內容- 劉強東自豪宣布:京東快遞小哥退休金超五千,公積金數十萬!
- 東鵬飲料董秘年薪超五百萬,跳槽漲薪近16倍引熱議!
- 王寶強新劇《棋士》豆瓣7.5分,成2025懸疑犯罪題材最高分劇集!
- 漢川童車火遍全球!外媒聚焦:中國制造,處處有驚喜
- 蓮花味精“破產”謠言不攻自破,公司火爆回應:我們挺好的!
- 央視打碼網紅李美越,翻譯“甲亢哥”內容為何引發爭議?
- 胖東來于東來打斷永輝高管:月賺200萬門店為何不先漲工資?
- 網紅滕順強夫婦遭質疑后宣布退網,商場回應:消殺為常規流程
- 小米SU7事故后,遇難者家屬刪博引猜測,與小米會面后真相何在?
- 某車企裁員風波再起,比例高達三成?真相尚待揭曉
- SpaceX創歷史:載人航天器首飛極地軌道,太空種植蘑菇實驗引期待
- 文和友創始人翁某某遭抵制后,名下多家公司悄然注銷,背后有何隱情?
- 預包裝食品禁用“零添加”等宣傳語,如何科學選食成新課題!
- 深圳半導體新貴,新凱來即將震撼亮相!
- 字節跳動創始人張一鳴成中國新首富,馬化騰、鐘睒睒緊隨
本欄最新
“彩云市集”閃耀新加坡FHA,云企出海聯盟對接會成果斐然

AI導航新紀元:會預判路況、懂你情緒的智能出行伙伴來了!

廣州AI洗頭店走紅:13分鐘智能洗護,19元一次你試過沒?

摩托車“壽命”僅13年?特別展示區見證愛車人的不舍與無奈

vivo X200 Ultra影像新突破,蔡司鏡頭挑戰iPhone 16 Pro Max畫質極限

達夢數據2024年業績亮眼:營收破10億大關,凈利增長超兩成
本文鏈接:http://www.www897cc.com/showinfo-16-144204-0.htmlGPT-4.1系列震撼發布!OpenAI史上最小最快最廉模型,百萬token上下文處理
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 硬派越野新選擇,捷途旅行者加長版:大空間更有大內涵
下一篇: 科研星光照亮寒冬:新能源技術突破,溫暖十四億人