亞馬遜云科技近期宣布了一項(xiàng)重大更新,在其Amazon Bedrock平臺(tái)上引入了Anthropic公司最新研發(fā)的Claude Opus 4和Claude Sonnet 4兩款混合推理模型。這一創(chuàng)新舉措標(biāo)志著AI技術(shù)在編程、復(fù)雜推理任務(wù)以及多步驟工作流程方面的又一里程碑。
據(jù)悉,Claude Opus 4和Claude Sonnet 4這兩款模型均具備在快速響應(yīng)與深度思考模式間靈活切換的能力。它們特別擅長(zhǎng)處理編程任務(wù)、長(zhǎng)時(shí)間推理任務(wù)以及復(fù)雜的工作流,能夠顯著縮短AI代理完成耗時(shí)任務(wù)的時(shí)間,同時(shí)保持卓越的性能表現(xiàn)。例如,這些模型能夠在幾分鐘內(nèi)完成通常需要數(shù)小時(shí)的任務(wù)。
兩款模型均支持高達(dá)200K tokens的上下文窗口,使得它們能夠高質(zhì)量地處理或生成長(zhǎng)篇內(nèi)容。它們還具備“擴(kuò)展思考”功能,允許Claude在深度推理與行動(dòng)執(zhí)行模式之間自由切換。這種靈活性使得Claude能夠根據(jù)需要運(yùn)行數(shù)據(jù)分析,并在工作過(guò)程中不斷優(yōu)化準(zhǔn)確性,從而更好地預(yù)測(cè)和執(zhí)行后續(xù)步驟。
Anthropic公司透露,Claude Opus 4在解決復(fù)雜軟件工程問(wèn)題的能力上超越了前代AI模型。它能夠在輔助Agentic任務(wù)時(shí)提供更準(zhǔn)確的響應(yīng),同時(shí)顯著提升指令遵循與信息可靠性。這些模型能夠在快速直接回答與分步思考之間靈活切換,從而在關(guān)鍵行業(yè)基準(zhǔn)測(cè)試中大幅提升多步驟工作流程的表現(xiàn)。
亞馬遜云科技一直以來(lái)都致力于提供全面多樣的前沿模型,這也是其與其他云服務(wù)巨頭相區(qū)別的一大特色。除了自研大模型外,亞馬遜云科技還積極在其大模型貨架上提供來(lái)自不同企業(yè)、具備不同功能的領(lǐng)先大模型,以滿足客戶的多樣化需求。此次Claude 4模型的推出,再次展現(xiàn)了亞馬遜云科技在模型上架速度上的優(yōu)勢(shì)。
Claude系列模型在亞馬遜云科技客戶中一直備受歡迎。例如,上一代模型Claude Sonnet 3.7在發(fā)布后的五周內(nèi),Amazon Bedrock客戶使用率比同期的上一代Claude模型高出300%。此次Claude 4的問(wèn)世,預(yù)計(jì)將在編程基準(zhǔn)測(cè)試中脫穎而出,再次掀起一波換新潮。
Anthropic增長(zhǎng)與營(yíng)收負(fù)責(zé)人Kate Jensen表示,Claude Opus 4和Claude Sonnet 4將AI從工具轉(zhuǎn)變?yōu)檎嬲膮f(xié)作伙伴,能夠大幅縮短項(xiàng)目周期,將原本需要數(shù)周完成的項(xiàng)目壓縮至數(shù)小時(shí)內(nèi)完成。這兩款全新Claude 4模型在企業(yè)中可以承擔(dān)更專業(yè)的角色,如處理常規(guī)分析、跨部門(mén)協(xié)調(diào),甚至在極少監(jiān)督的情況下管理完整的工作流程。
其中,Claude Opus 4被譽(yù)為全球最強(qiáng)的AI編程模型之一,它擅長(zhǎng)以極高準(zhǔn)確率處理復(fù)雜多步驟任務(wù),能夠勝任編程、研究、內(nèi)容創(chuàng)作等長(zhǎng)期任務(wù)。該模型適用于協(xié)調(diào)跨職能工作流或跨多個(gè)數(shù)據(jù)源進(jìn)行深度研究,以及獨(dú)立完成從規(guī)劃到執(zhí)行的復(fù)雜編碼項(xiàng)目和Agent工作流。例如,金融行業(yè)客戶可以利用Claude Opus 4進(jìn)行Agent搜索與研究,連接海量市場(chǎng)報(bào)告以獲取行業(yè)洞察;而營(yíng)銷(xiāo)類客戶則可以利用該模型自主管理多渠道的營(yíng)銷(xiāo)活動(dòng)。
Claude Opus 4的內(nèi)存能力也遠(yuǎn)超以往的模型。當(dāng)開(kāi)發(fā)人員構(gòu)建提供Claude本地文件訪問(wèn)的應(yīng)用程序時(shí),Opus 4能夠熟練地創(chuàng)建和維護(hù)“內(nèi)存文件”來(lái)存儲(chǔ)關(guān)鍵信息。這有助于提升長(zhǎng)期任務(wù)的意識(shí)、連貫性以及Agent任務(wù)的性能,如在玩Pokémon時(shí)創(chuàng)建“導(dǎo)航指南”。
另一方面,Claude Sonnet 4同樣展現(xiàn)出了卓越的編程和推理能力,超越了前代Claude Sonnet 3.7。它兼顧高性能、出色的速度和較低的成本,尤其適合高吞吐量的業(yè)務(wù)場(chǎng)景。該模型可以應(yīng)用于代碼審查、漏洞修復(fù)等日常開(kāi)發(fā)工作,也可以作為任務(wù)專用的子Agents同時(shí)處理搜索、數(shù)據(jù)分析或內(nèi)容合成等多類任務(wù),并能在多個(gè)任務(wù)間自如切換。例如,旅游與酒店行業(yè)客戶可以使用Claude Sonnet 4近乎實(shí)時(shí)地處理客戶請(qǐng)求,并提供個(gè)性化響應(yīng)。
Snorkel AI聯(lián)合創(chuàng)始人Henry Ehrenberg對(duì)Claude Opus 4給予了高度評(píng)價(jià),認(rèn)為該模型在Agentic系統(tǒng)與企業(yè)數(shù)據(jù)集的準(zhǔn)確性上正推動(dòng)技術(shù)前沿。其研究團(tuán)隊(duì)使用Snorkel的精細(xì)化評(píng)估平臺(tái)對(duì)Claude Opus 4進(jìn)行了基準(zhǔn)測(cè)試,結(jié)果顯示,在特定業(yè)務(wù)線等關(guān)鍵數(shù)據(jù)子集的處理上,Claude Opus 4的表現(xiàn)顯著優(yōu)于其他推理模型。Block首席數(shù)據(jù)和機(jī)器學(xué)習(xí)工程師Bradley Axen也強(qiáng)調(diào),Claude Opus 4是首個(gè)能在其代號(hào)為’goose’的Agent中提升代碼編輯和調(diào)試質(zhì)量的模型,同時(shí)保持了出色的性能和可靠性。
本文鏈接:http://www.www897cc.com/showinfo-45-13134-0.htmlClaude 4強(qiáng)勢(shì)入駐Amazon Bedrock,重塑企業(yè)Agent開(kāi)發(fā)新速度
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com