人工智能領(lǐng)域迎來重要進(jìn)展,DeepSeek團(tuán)隊宣布推出新一代模型DeepSeek-V3.1-Terminus。該版本在繼承前代優(yōu)勢的基礎(chǔ)上,針對用戶反饋的核心問題展開專項優(yōu)化,特別是在編程場景下的輸出穩(wěn)定性方面取得突破性進(jìn)展。
此次升級最受關(guān)注的改進(jìn)是解決了此前版本中隨機(jī)插入"極"字的異常現(xiàn)象。測試顯示,在涉及time.Second等關(guān)鍵編程元素的輸出中,新模型能夠準(zhǔn)確保持代碼結(jié)構(gòu)完整性,未出現(xiàn)字符異常替換的情況。這項修復(fù)直接回應(yīng)了開發(fā)者社區(qū)對模型實(shí)用性的核心訴求,為代碼生成等場景掃清了關(guān)鍵障礙。
在語言處理能力方面,研發(fā)團(tuán)隊通過算法優(yōu)化顯著降低了中英文混雜出現(xiàn)的頻率。對比測試表明,新版本在專業(yè)文檔生成場景下的語言一致性提升達(dá)47%,特別是在技術(shù)文檔、學(xué)術(shù)論文等需要精準(zhǔn)表達(dá)的領(lǐng)域表現(xiàn)突出。不過開發(fā)團(tuán)隊坦言,完全消除語言混合現(xiàn)象仍是長期技術(shù)挑戰(zhàn)。
智能體(Agent)能力成為本次升級的另一大亮點(diǎn)。在工具調(diào)用測試中,BrowseComp指標(biāo)從30.0提升至38.5,SimpleQA準(zhǔn)確率達(dá)到96.8%,均創(chuàng)下同類模型新高。特別在多語言軟件工程基準(zhǔn)測試(SWE-bench Multilingual)中,57.8分的成績較前代提升3.3個百分點(diǎn),展現(xiàn)出更強(qiáng)的跨語言開發(fā)支持能力。
基準(zhǔn)測試數(shù)據(jù)顯示,新模型在Humanity's Last Exam評測中取得36.48%的顯著提升,這項針對復(fù)雜推理能力的考核結(jié)果,直接反映了模型在邏輯鏈條構(gòu)建方面的進(jìn)步。值得注意的是,LiveCodeBench實(shí)時編碼測試顯示,新版本在算法實(shí)現(xiàn)效率上已超越Gemini 2.5 Pro等競品。
雖然部分專項測試出現(xiàn)小幅波動,如Codeforces競賽級編程測試下降1.2%,但整體性能曲線呈現(xiàn)明確上升趨勢。開發(fā)團(tuán)隊特別強(qiáng)調(diào),Terminal-bench終端操作測試35.7分的成績,證明模型在系統(tǒng)級交互方面的可靠性得到實(shí)質(zhì)性增強(qiáng)。
技術(shù)社區(qū)對版本命名展開熱烈討論,"Terminus"在計算機(jī)術(shù)語中特指終端設(shè)備,暗示模型在交互末端的技術(shù)突破。有開發(fā)者推測,這可能預(yù)示著更高級的智能體架構(gòu)正在研發(fā)中,甚至可能與傳聞中的DeepSeek-V4存在技術(shù)關(guān)聯(lián)。
目前用戶可通過Hugging Face和ModelScope平臺獲取開源版本,官方App及API服務(wù)也已完成同步更新。測試反饋顯示,新模型在金融分析、科研文獻(xiàn)處理等垂直領(lǐng)域的表現(xiàn)獲得專業(yè)用戶認(rèn)可,代碼審查等場景的誤報率降低至前代的63%。
開發(fā)團(tuán)隊在技術(shù)文檔中透露,本次升級采用動態(tài)注意力優(yōu)化機(jī)制,通過強(qiáng)化特定場景下的參數(shù)調(diào)整效率實(shí)現(xiàn)性能躍升。這種技術(shù)路徑的選擇,既保持了模型架構(gòu)的穩(wěn)定性,又為后續(xù)功能擴(kuò)展預(yù)留了技術(shù)空間。
隨著新版模型投入實(shí)際應(yīng)用,開發(fā)者社區(qū)開始期待下一代產(chǎn)品的技術(shù)突破。有分析人士指出,從版本迭代節(jié)奏判斷,DeepSeek團(tuán)隊可能正在籌備具有劃時代意義的重大升級,智能體技術(shù)的商業(yè)化應(yīng)用或?qū)⒂瓉黻P(guān)鍵轉(zhuǎn)折點(diǎn)。
更多>同類資訊百度智能云千帆開源Qianfan-VL視覺模型,多尺寸適配,全自研芯片賦能高效計算09-23人工智能投資新視角:大模型進(jìn)階智能體,場景化應(yīng)用前景展望今天分享的是:人工智能專題:從大模型到智能體——人工智能+場景的投資展望 報告共計:31頁 《人工智能專題:從大模型到智能體——人工智能+場景的投資展望》報告首先探討“什么是真正的人工智能”,指出大語言模型如…09-23京東王競凡:智能機(jī)器人高速發(fā)展,中國機(jī)器人市場2028年或達(dá)千億來源:睿見Economy 9月16日-17日,聚合智能產(chǎn)業(yè)發(fā)展大會(2025)在武漢市舉行,主題為“協(xié)同融合創(chuàng)新鏈產(chǎn)業(yè)鏈推動聚合智能產(chǎn)業(yè)發(fā)展”。 王競凡指出,目前智能機(jī)器人處于一個前所未有的高速發(fā)展道路,智…09-23上海創(chuàng)智學(xué)院周年慶發(fā)布模速空間AI工作站 助力教育大模型終端化應(yīng)用會上,學(xué)院正式發(fā)布標(biāo)桿成果——模速空間AI工作站,該設(shè)備搭載上海“啟創(chuàng)·InnoSpark”人工智能教育大模型,以“端側(cè)算力+教育大模型+場景化應(yīng)用”三位一體架構(gòu),為教育領(lǐng)域注入智能新動能。該工作站由英和智臨…09-23國內(nèi)AI大模型邁向“用起來”階段,央(國)企集約共享大模型前景與挑戰(zhàn)并存通信世界網(wǎng)消息(CWW)目前,國內(nèi)AI大模型產(chǎn)業(yè)正從“百模大戰(zhàn)”的“建起來”階段,向“行業(yè)爆發(fā)”的“用起來”階段過渡。權(quán)威機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,2025年一季度國內(nèi)大模型市場規(guī)模預(yù)計突破495億元人民幣,但AI…09-23百度智能云開源Qianfan-VL視覺模型,多尺寸適配+自研芯片助力多場景應(yīng)用在 ScienceQA 等專業(yè)問答測試中,精準(zhǔn)度表現(xiàn)突出;多模態(tài)任務(wù)如 RefCOCO 等,物體識別與關(guān)聯(lián)能力優(yōu)異;同時,在各類通用基準(zhǔn)測試?yán)铮噍^主流模型,整體表現(xiàn)也頗為亮眼,充分彰顯出在視覺理解通用能力上…09-23工業(yè)互聯(lián)網(wǎng)浪潮涌動 中國電信云網(wǎng)融合賦能工業(yè)智能化升級長期以來,中國電信立足自身優(yōu)勢,堅持以云網(wǎng)融合為核心抓手,在持續(xù)夯實(shí)工業(yè)智能底座、筑牢產(chǎn)業(yè)數(shù)字化根基的同時,不斷加大科技創(chuàng)新力度,通過技術(shù)突破與模式創(chuàng)新,為工業(yè)企業(yè)提供全鏈條智能化解決方案,有效賦能工業(yè)生產(chǎn)全…09-23微店24參會華為全聯(lián)接大會2025,借昇騰之力賦能實(shí)體零售智慧升級本次大會以“躍升行業(yè)智能化”為主題,聚焦人工智能技術(shù)與產(chǎn)業(yè)融合的創(chuàng)新實(shí)踐,為實(shí)體零售行業(yè)的數(shù)字化轉(zhuǎn)型提供新動能。華為作為全面智能化戰(zhàn)略的倡導(dǎo)者和實(shí)踐者,致力于通過領(lǐng)先的產(chǎn)品與解決方案,攜手伙伴共建健康生態(tài)。 …09-23DeepSeek線上模型升級V3.1-Terminus版,優(yōu)化語言Agent能力,輸出長度與價格揭曉09-23字節(jié)跳動火山引擎發(fā)布豆包翻譯模型:28種語言互譯,性能超GPT-4o且價格親民09-23MediaTek天璣9500芯片發(fā)布:3納米制程加持,AI影像游戲性能全面躍升09-23?DeepSeek-V3.1-Terminus上線,雙模式優(yōu)化語言與Agent能力,高性價比服務(wù)來襲?09-23vivo X300系列首發(fā)天璣9500芯片,端側(cè)AI升級帶來多場景新體驗(yàn)09-23可靈AI釜山國際電影節(jié)亮相,攜2.5模型展示視頻生成前沿應(yīng)用前景09-23火山引擎豆包種子翻譯模型亮相,支持28種語言雙向翻譯且場景適應(yīng)強(qiáng)09-23點(diǎn)擊查看更多 +全站最新
?9月狹義乘用車零售預(yù)計達(dá)215萬輛,新能源車滲透率或超58%引關(guān)注?
6.88萬起極狐T1實(shí)測:空間越級配置足,小電車市場殺出“全能王”?
?雷軍官宣小米17系列9月25日發(fā)布,盧偉冰稱產(chǎn)品力跨代升級且對標(biāo)iPhone17?
?小米17系列9月25日發(fā)布在即,雷軍年度演講《改變》將揭秘芯片與汽車故事?
?雷軍宣布:9月25日小米17系列發(fā)布,同期將舉辦第6次年度演講聊芯片與汽車故事?
小米SU7標(biāo)準(zhǔn)版11.7萬輛召回:OTA升級背后的智能駕駛安全與行業(yè)新挑戰(zhàn)熱門內(nèi)容
第22屆東博會AI元素亮眼:數(shù)字智能體引路 機(jī)器人炫技展風(fēng)采
AI云競爭下半場:華為以超節(jié)點(diǎn)、企業(yè)Agent等破局,誰能領(lǐng)跑產(chǎn)業(yè)?
2025網(wǎng)安周:每日互動劉宇談AI時代,知識安全成關(guān)鍵,共筑數(shù)字新未來
中國大模型DeepSeek首登Nature封面,R1訓(xùn)練成本僅約208萬引關(guān)注
華為全聯(lián)接大會2025啟幕,發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)與集群
有鹿機(jī)器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.www897cc.com/showinfo-45-27978-0.htmlDeepSeek-V3.1-Terminus更新登場!修復(fù)關(guān)鍵Bug,Agent能力躍升,V4還會遠(yuǎn)嗎?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com