人工智能領(lǐng)域編程能力競爭再度升級,Anthropic公司正式推出新一代編程模型Claude Sonnet 4.5,在多項技術(shù)指標上實現(xiàn)突破性進展。這款被稱作"全球最強編程模型"的新品,在真實編程場景測試中力壓群雄,同時將AI持續(xù)工作時長提升至30小時以上,引發(fā)行業(yè)高度關(guān)注。
在權(quán)威編程測試平臺SWE-bench Verified的最新評估中,Claude Sonnet 4.5以顯著優(yōu)勢登頂榜首。該測試專門考察模型解決實際編程問題的能力,涵蓋代碼修復(fù)、功能擴展等復(fù)雜任務(wù)。更令人矚目的是,在模擬真實計算機操作的OSWorld基準測試中,新模型取得61.4%的準確率,較四個月前的前代產(chǎn)品提升近20個百分點,創(chuàng)下該測試歷史新高。
這款模型展現(xiàn)出驚人的持續(xù)工作能力,可連續(xù)30小時保持高效編程狀態(tài)。對比此前Claude Opus 4和Codex等模型最多7小時的獨立工作時間,新模型在耐力方面實現(xiàn)質(zhì)的飛躍。實測顯示,其能一次性完成約1.1萬行代碼的編寫任務(wù),相當于開發(fā)一個完整聊天應(yīng)用的代碼量。
技術(shù)升級帶來顯著效率提升。開發(fā)者反饋顯示,新模型在代碼重構(gòu)任務(wù)中表現(xiàn)突出,某次調(diào)用中同時完成25次工具調(diào)用、新增3000余行代碼并生成12個全新文件。雖然生成的模塊化代碼首次運行存在缺陷,但其架構(gòu)設(shè)計的優(yōu)雅性獲得專業(yè)人士認可。Cursor等開發(fā)工具平臺證實,該模型在處理長周期編程任務(wù)時,錯誤率較前代降低37%。
伴隨模型發(fā)布,Anthropic同步推出多項開發(fā)工具創(chuàng)新。Claude Code新增"檢查點"功能,支持開發(fā)進度實時保存與回溯;原生VS Code插件實現(xiàn)終端界面全面升級;API服務(wù)整合代碼執(zhí)行與文件創(chuàng)建功能,開發(fā)者可在對話中直接完成全流程開發(fā)。最受關(guān)注的是Claude Agent SDK的開放,這套構(gòu)建智能體的底層框架,解決了記憶管理、權(quán)限控制等關(guān)鍵技術(shù)難題。
定價策略延續(xù)親民路線,新模型API調(diào)用費用與前代持平,每百萬tokens收費3至15美元。安全性能方面,通過強化對齊訓(xùn)練,模型在防范欺騙行為、抵制權(quán)力誘惑等維度取得突破性進展。測試數(shù)據(jù)顯示,提示注入攻擊的防御成功率提升至92%,內(nèi)容誤判率下降至0.7%以下。
市場反應(yīng)呈現(xiàn)兩極分化。部分開發(fā)者驚嘆于其代碼生成效率,稱"這是首個能真正參與企業(yè)級開發(fā)的AI模型";也有用戶指出生成的代碼需要較多人工調(diào)試。技術(shù)社區(qū)出現(xiàn)有趣現(xiàn)象:盡管兩個月前遭遇"降智"風波導(dǎo)致部分用戶流失,但新模型發(fā)布后,原Codex用戶中出現(xiàn)回流趨勢,GitHub相關(guān)討論量周增45%。
競爭格局因新模型發(fā)布再度生變。當前Anthropic估值達1830億美元,年化營收突破50億美元,其中編程工具貢獻超四成收入。面對OpenAI和谷歌Gemini的激烈競爭,公司選擇在對手年度開發(fā)者大會前夕發(fā)布新品,戰(zhàn)略意圖明顯。聯(lián)合創(chuàng)始人Jared Kaplan透露,更強大的Opus系列模型將于年內(nèi)推出,暗示大小模型協(xié)同發(fā)展的技術(shù)路線。
創(chuàng)新功能"Imagine with Claude"引發(fā)技術(shù)圈熱議。該臨時研究預(yù)覽僅向高級訂閱用戶開放五天,其核心突破在于實現(xiàn)軟件功能的實時生成與調(diào)整。所有界面元素和底層代碼均在用戶交互過程中動態(tài)創(chuàng)建,這種"所見即所建"的開發(fā)模式,為AI輔助編程開辟全新路徑。技術(shù)分析師指出,該功能若能穩(wěn)定運行,將重新定義人機協(xié)作的邊界。
更多>同類資訊Claude Sonnet 4.5發(fā)布:登頂編程測試榜首,工作續(xù)航超30小時,多項功能升級09-30谷歌十年來首換Logo:漸變色“G”形新標亮相,將全面應(yīng)用于各平臺09-302025云棲大會:高德以空間智能破局文博痛點,AI技術(shù)助力文化體驗“活”起來09-30Anthropic推Claude Sonnet 4.5模型,30小時持續(xù)編碼或成軟件開發(fā)者新利器09-30OpenAI攜手Etsy與Shopify推即時結(jié)賬,AI賦能電商,開啟購物新體驗09-30Claude Sonnet 4.5發(fā)布:編程能力登頂,連續(xù)30小時工作,AI編程賽道再掀熱潮09-30對話高通高管:第五代驍龍8至尊版,AI引領(lǐng)下為何淡化GPU跑分?09-30科技賦能秋收:河北板栗“智”長、黑龍江蔓越莓“速”收、新疆棉花“巧”脫葉在河北秦皇島市撫寧區(qū)的板栗科技示范基地里,一顆顆果實飽滿的板栗掛滿了枝頭。 據(jù)了解,棉花在成熟采收之前,需要提前一個月向棉株噴灑脫葉劑,加快葉片脫落,避免葉片過于稠密影響棉桃采光生長,也能防止棉花采收過程中…09-30Anthropic發(fā)布Claude Sonnet 4.5:代碼與智能體構(gòu)建能力飆升,構(gòu)建工具同步開放09-30“悟空”類腦計算機:模擬獼猴大腦 開啟神經(jīng)擬態(tài)計算新篇章09-30Anthropic發(fā)布Claude Sonnet 4.5:編碼性能躍升,安全與自主性全面升級09-30張宏院士深圳講堂:以AI賦能機器人 開啟開放世界“生活”新篇近日,第五十四期院士講堂在深圳開講,加拿大工程院院士、南方科技大學(xué)電子與電氣工程系講席教授張宏院士帶來了《人工智能與機器人——導(dǎo)航與操作任務(wù)中的應(yīng)用》的精彩演講,吸引了來自人工智能、機器人等領(lǐng)域的專家學(xué)者、高…09-30青春筑夢智慧城:以專業(yè)之力繪就高效便捷現(xiàn)代生活新畫卷智慧城市運用大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等前沿技術(shù),讓交通、醫(yī)療、教育、政務(wù)、能源等系統(tǒng)更加智能、高效和人性化。智能紅綠燈能緩解擁堵,手機APP可一鍵辦理政務(wù),智慧社區(qū)提升居住安全與便利。著力建設(shè)便捷高效的智慧城…09-30國產(chǎn)AI服務(wù)器新突破:8.9毫秒響應(yīng)+百萬token僅1元,智能體產(chǎn)業(yè)化加速你問一句話、它生成一段代碼,背后都是成千上萬個token在燃燒,都是真金白銀。 浪潮這次的雙重突破,給咱們提了個醒:AI競爭的焦點,正在從過去一味地“卷參數(shù)”、“拼大模型”,轉(zhuǎn)向更務(wù)實、更硬核的“速度”和“成…09-30華為亮相2025青島國際城軌展,攜全棧方案共繪城軌智能化新藍圖作為全球領(lǐng)先的ICT(信息與通信技術(shù))解決方案供應(yīng)商,華為以“躍升城軌行業(yè)智能化”為主題,攜城軌智能化、數(shù)智平臺、運營通信、自主創(chuàng)新、服務(wù)、伙伴聯(lián)合創(chuàng)新等領(lǐng)域的方案及行業(yè)實踐成果重磅亮相,全面展示了在城軌領(lǐng)域…09-30點擊查看更多 +全站最新
科技賦能出行 智趣滿溢中原:深藍汽車攜手華為乾崑試駕體驗營圓滿落幕
嵐圖“時代風尚之夜”啟幕,泰山全球首秀,追光L開啟預(yù)訂共耀東方美學(xué)
迪拜男子求試乘“未來之車”:蘿卜快跑無人車引土豪以勞力士相換
上汽大眾Pro家族2026款煥新登場 燃油車智能化體驗邁入全新2.0時代
破局稀土依賴:電動汽車無稀土電機研發(fā)的探索與希望
吉利瑞研賦能極氪9X:北歐嚴苛工程哲學(xué)邂逅AI智能科技鑄混動新章熱門內(nèi)容
第22屆東博會AI元素亮眼:數(shù)字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節(jié)點、企業(yè)Agent等破局,誰能領(lǐng)跑產(chǎn)業(yè)?
2025網(wǎng)安周:每日互動劉宇談AI時代,知識安全成關(guān)鍵,共筑數(shù)字新未來
中國大模型DeepSeek首登Nature封面,R1訓(xùn)練成本僅約208萬引關(guān)注
華為全聯(lián)接大會2025啟幕,發(fā)布全球最強算力超節(jié)點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.www897cc.com/showinfo-45-28574-0.htmlClaude Sonnet 4.5重磅登場:30小時超長續(xù)航,編程實力與功能創(chuàng)新雙突破
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: ?OpenAI擬推AI驅(qū)動社交應(yīng)用:形似TikTok,內(nèi)容全由AI生成且設(shè)肖像驗證與版權(quán)新規(guī)?