在自然語言處理領(lǐng)域的頂級(jí)盛會(huì)——第63屆國際計(jì)算語言學(xué)年會(huì)(ACL)上,九章云極DataCanvas公司憑借其在人工智能領(lǐng)域的深厚積累與創(chuàng)新探索,成功收獲了兩項(xiàng)重要學(xué)術(shù)認(rèn)可。ACL 2025的論文收錄結(jié)果揭曉,九章云極的兩篇研究論文脫穎而出,分別被ACL主會(huì)場(chǎng)及Findings板塊接納。
其中,九章云極科研團(tuán)隊(duì)獨(dú)立完成的論文《語言模型能否成為類比標(biāo)注專家?》深入探討了語言模型在類比推理任務(wù)中的潛力與局限,為突破機(jī)器在類比認(rèn)知上的難題提供了新視角。該論文被ACL的Findings板塊收錄,彰顯了九章云極在理論探索與技術(shù)實(shí)踐上的雙重實(shí)力。
與此同時(shí),九章云極與中國人民大學(xué)AI Box研究團(tuán)隊(duì)攜手打造的論文《YuLan-Mini:探索開源數(shù)據(jù)高效語言模型的極限》同樣備受矚目,被ACL 2025主會(huì)場(chǎng)接納。該論文聚焦于大型語言模型預(yù)訓(xùn)練中的瓶頸問題,成功預(yù)訓(xùn)練出高性能的開源基座模型YuLan-Mini,為資源受限場(chǎng)景下的模型應(yīng)用開辟了新路徑。
ACL作為自然語言處理領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議,其論文收錄標(biāo)準(zhǔn)極為嚴(yán)苛,需經(jīng)過多輪“雙盲評(píng)審”與領(lǐng)域?qū)<业木暮Y選,接收率常年維持在低水平。今年,ACL共收到超過8000篇投稿,競(jìng)爭異常激烈。九章云極的兩篇論文能在如此高水準(zhǔn)的學(xué)術(shù)競(jìng)爭中脫穎而出,無疑是對(duì)其科研實(shí)力與創(chuàng)新能力的有力證明。
值得注意的是,九章云極DataCanvas在產(chǎn)學(xué)研用方面的深度融合也是其成功的關(guān)鍵。被ACL Findings收錄的論文整合了九章云極在工業(yè)級(jí)大模型訓(xùn)練中的實(shí)戰(zhàn)經(jīng)驗(yàn),而與高校聯(lián)合創(chuàng)新的YuLan-Mini模型則體現(xiàn)了產(chǎn)學(xué)研用的緊密合作。這種協(xié)同創(chuàng)新的模式不僅推動(dòng)了AI技術(shù)的快速發(fā)展,也為產(chǎn)業(yè)融合注入了新的活力。
在《語言模型能否成為類比標(biāo)注專家?》一文中,九章云極團(tuán)隊(duì)通過實(shí)證研究揭示了當(dāng)前語言模型在類比推理任務(wù)中的局限性,并創(chuàng)新性地將認(rèn)知心理學(xué)中的結(jié)構(gòu)映射理論(SMT)引入其中,提出了多階段漸進(jìn)式類比推理框架A3E。實(shí)驗(yàn)結(jié)果顯示,該框架使大語言模型的類比標(biāo)注準(zhǔn)確率達(dá)到了人類專家水平,為突破類比推理的機(jī)器認(rèn)知瓶頸提供了切實(shí)可行的技術(shù)路徑。
而在《YuLan-Mini:探索開源數(shù)據(jù)高效語言模型的極限》一文中,九章云極團(tuán)隊(duì)針對(duì)大型語言模型預(yù)訓(xùn)練中的關(guān)鍵瓶頸進(jìn)行了深入探索,成功預(yù)訓(xùn)練出高性能的開源基座模型YuLan-Mini。該模型在訓(xùn)練穩(wěn)定性、數(shù)據(jù)流程優(yōu)化以及全棧開源實(shí)踐等方面均實(shí)現(xiàn)了創(chuàng)新突破,為開源社區(qū)進(jìn)行大模型研究提供了寶貴的經(jīng)驗(yàn)與技術(shù)路徑。
YuLan-Mini模型不僅在訓(xùn)練效率上表現(xiàn)出色,還在性能上達(dá)到了商用小模型的水平。這一成果為資源受限場(chǎng)景下的模型部署提供了新的解決方案,同時(shí)也為開源大語言模型的發(fā)展注入了新的動(dòng)力。
九章云極DataCanvas在Transformer架構(gòu)的訓(xùn)練穩(wěn)定性問題上也取得了重要進(jìn)展。團(tuán)隊(duì)深入研究了隱藏狀態(tài)爆炸和RMSNorm表示坍塌等關(guān)鍵因素,并提出了創(chuàng)新性的解決方案,有效緩解了訓(xùn)練不穩(wěn)定性問題。在數(shù)據(jù)優(yōu)化方面,團(tuán)隊(duì)構(gòu)建了一套精細(xì)的數(shù)據(jù)處理流程,創(chuàng)新性融合了數(shù)據(jù)合成、數(shù)據(jù)課程與數(shù)據(jù)篩選等機(jī)制,進(jìn)一步提升了模型的性能。
此次ACL 2025的兩項(xiàng)學(xué)術(shù)認(rèn)可不僅是對(duì)九章云極DataCanvas在AI研究領(lǐng)域前沿實(shí)力的肯定,更是對(duì)公司產(chǎn)學(xué)研用協(xié)同模式有效性的驗(yàn)證。九章云極將繼續(xù)聚焦人工智能領(lǐng)域的核心技術(shù)問題,持續(xù)進(jìn)行攻關(guān)與創(chuàng)新突破,為全球自然語言處理領(lǐng)域的發(fā)展貢獻(xiàn)更多中國智慧與中國方案。
本文鏈接:http://www.www897cc.com/showinfo-45-13350-0.html九章云極DataCanvas兩篇論文閃耀ACL 2025,AI創(chuàng)新實(shí)力獲國際認(rèn)可
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com