近日,國內(nèi)知名的第三方評測權(quán)威機構(gòu)SuperCLUE揭曉了中文原生工業(yè)大模型評測新標(biāo)桿——SC-Industry(SuperCLUE-Industry)的最新排名。北電數(shù)智旗下的驕陽·工業(yè)大模型在此次評測中以總分83.44的佳績,榮登榜首。

SuperCLUE作為業(yè)界公認(rèn)的中文大模型綜合評測基準(zhǔn),此次發(fā)布的SC-Industry評測框架,專為中文語義環(huán)境與國內(nèi)工業(yè)應(yīng)用場景設(shè)計,旨在全面評估工業(yè)大模型在解決實際工業(yè)問題上的能力,同時考量模型的通用性和可擴展性。評測涵蓋了基礎(chǔ)能力和應(yīng)用能力兩大維度,具體包括工業(yè)常規(guī)問答、工業(yè)數(shù)據(jù)分析、工業(yè)文檔問答、工業(yè)智能體Agent、工業(yè)理解計算、工業(yè)代碼生成等六大核心能力。
在SC-Industry的評測中,驕陽·工業(yè)大模型不僅在總分上獨占鰲頭,其應(yīng)用能力更是以90.07分的優(yōu)異成績位列第一。特別是在工業(yè)數(shù)據(jù)分析方面,驕陽·工業(yè)大模型以90.38分的最高分展現(xiàn)了其在表格類數(shù)據(jù)分析上的卓越能力,提供了深入的行業(yè)洞察。在工業(yè)智能體Agent的評測中,該模型同樣表現(xiàn)出色,以89.97分的高分領(lǐng)跑,展現(xiàn)了其在復(fù)雜工業(yè)環(huán)境中自主或半自主執(zhí)行任務(wù)、做出有效決策以及與其他系統(tǒng)交互優(yōu)化工業(yè)流程的能力。

SuperCLUE在評測報告中強調(diào),產(chǎn)業(yè)級應(yīng)用能力已成為當(dāng)前工業(yè)大模型發(fā)展的新分水嶺。驕陽·工業(yè)大模型在工業(yè)數(shù)據(jù)分析上的強勢表現(xiàn),不僅彰顯了國產(chǎn)模型在工業(yè)任務(wù)能力上的突破,也表明在基礎(chǔ)能力日益趨同的背景下,工業(yè)數(shù)據(jù)分析與智能體表現(xiàn)將成為拉開模型差距的關(guān)鍵因素。北電數(shù)智通過推動工業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和開放協(xié)議體系的建立,運用可信數(shù)據(jù)空間技術(shù)實現(xiàn)數(shù)據(jù)安全共享,同時研發(fā)場景化微調(diào)數(shù)據(jù)生成和復(fù)雜任務(wù)強化學(xué)習(xí)等核心技術(shù),有效提升了模型的行業(yè)認(rèn)知能力。
據(jù)悉,北電數(shù)智即將在2025世界人工智能大會(WAIC)上正式發(fā)布驕陽·工業(yè)大模型。屆時,北電數(shù)智將聚焦工業(yè)企業(yè)最為關(guān)注的“AI+生產(chǎn)、AI+產(chǎn)品、AI+運營、AI+基礎(chǔ)設(shè)施”等核心業(yè)務(wù)場景,分享其創(chuàng)新能力和標(biāo)桿實踐,期待為行業(yè)帶來更多驚喜。
本文鏈接:http://www.www897cc.com/showinfo-21-174371-0.html北電數(shù)智驕陽·工業(yè)大模型登頂SuperCLUE最新測評,展現(xiàn)國產(chǎn)模型實力
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com