隨著技術(shù)的飛速發(fā)展,特別是通用大模型性能的顯著提升以及推理算力成本的急劇下降,垂直領(lǐng)域的大模型正迎來(lái)前所未有的發(fā)展機(jī)遇。在這波浪潮中,代碼大模型尤為引人注目,不僅吸引了市場(chǎng)的廣泛關(guān)注,更成為資本競(jìng)相追逐的焦點(diǎn)。
根據(jù)Gartner發(fā)布的《2024年全球IT支出預(yù)測(cè)》報(bào)告,全球軟件開(kāi)發(fā)人力成本正以年均7-9%的速度增長(zhǎng),預(yù)計(jì)到2024年,全球軟件相關(guān)支出將達(dá)到1.2萬(wàn)億美元,其中人力成本占比高達(dá)50%,即6000億美元。而在中國(guó),互聯(lián)網(wǎng)巨頭們?cè)谲浖_(kāi)發(fā)方面的人力成本壓力更為顯著,部分公司的薪酬及相關(guān)支出年增幅已接近15%。
然而,與日益增長(zhǎng)的軟件開(kāi)發(fā)需求相比,全球軟件工程師的缺口卻在持續(xù)擴(kuò)大。有數(shù)據(jù)顯示,未來(lái)十年內(nèi),這一缺口可能達(dá)到數(shù)千萬(wàn)之巨,成為制約各行各業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵因素。在此背景下,代碼大模型憑借其獨(dú)特的優(yōu)勢(shì),成為了少數(shù)具備明確商業(yè)化條件和付費(fèi)意愿的垂直行業(yè)大模型之一。
Cursor作為海外知名的AI編程產(chǎn)品,僅用21個(gè)月便實(shí)現(xiàn)了1億美元的ARR,成為歷史上增長(zhǎng)最快的SaaS產(chǎn)品之一,估值更是高達(dá)100億美元。Gartner還預(yù)測(cè),到2026年,AI將自動(dòng)化全球30%的編碼任務(wù),這意味著代碼大模型市場(chǎng)將是一個(gè)“看得見(jiàn)”的千億美元級(jí)大蛋糕。
不僅海外市場(chǎng)如火如荼,國(guó)內(nèi)通用大模型廠商也紛紛涉足代碼大模型領(lǐng)域。阿里的通義靈碼、騰訊的騰訊云AI代碼助手、華為的Code Arts、字節(jié)跳動(dòng)的豆包Mars Code以及百度的文心快碼等,都在這場(chǎng)激烈的競(jìng)爭(zhēng)中嶄露頭角。京東、訊飛、昆侖萬(wàn)維、DeepSeek、智譜等多家通用大模型廠商也都在積極布局這一領(lǐng)域。
在眾多參與者中,aiXcoder以其深厚的積淀和卓越的模型性能脫穎而出。依托北大軟件工程研究所60余年的積累,aiXcoder團(tuán)隊(duì)從多篇全球頂級(jí)會(huì)議論文的奠基,到全球首個(gè)十億級(jí)和百億級(jí)參數(shù)的國(guó)產(chǎn)代碼大模型aiXcoder的發(fā)布,再到國(guó)內(nèi)諸多大廠頭部客戶(hù)的實(shí)踐落地,實(shí)現(xiàn)了從實(shí)驗(yàn)室理論到產(chǎn)業(yè)價(jià)值的閉環(huán)突破。
aiXcoder-7B模型更是其最新力作。該模型在多個(gè)評(píng)測(cè)集的評(píng)測(cè)結(jié)果中超越了同級(jí)別參數(shù)規(guī)模的眾多開(kāi)源模型,如Qwen2.5-Coder-7B、DeepSeekCoder-7B、CodeLlama-7B等。在代碼生成與補(bǔ)全效果上,aiXcoder-7B均達(dá)到了SOTA評(píng)價(jià)(即當(dāng)前最佳)。
今年年初,aiXcoder(北京硅心科技有限公司)成功完成了A++輪融資,由中關(guān)村發(fā)展集團(tuán)旗下中關(guān)村資本和中關(guān)村協(xié)同創(chuàng)新基金共同參投。至此,該公司已累計(jì)獲得4輪融資,吸引了伽利略資本、高瓴創(chuàng)投、彬復(fù)資本、清流資本、三七互娛等多家頂級(jí)風(fēng)險(xiǎn)投資機(jī)構(gòu)的青睞。
近日,aiXcoder的商業(yè)合伙人兼總裁劉德欣在接受訪談時(shí),深入探討了當(dāng)前代碼大模型行業(yè)面臨的技術(shù)瓶頸和未來(lái)趨勢(shì)。他表示,通用大模型雖然強(qiáng)大,但由于其構(gòu)建和訓(xùn)練方式基于自然語(yǔ)言而非編程語(yǔ)言,因此在處理代碼時(shí)存在一定的局限性。代碼相比自然語(yǔ)言具有更強(qiáng)的上下文依賴(lài)性和結(jié)構(gòu)性,這要求模型必須能夠精準(zhǔn)地理解程序語(yǔ)言的結(jié)構(gòu)和語(yǔ)義。
針對(duì)這一問(wèn)題,aiXcoder-7B采用了結(jié)構(gòu)化Span的形式構(gòu)建模型,并創(chuàng)新性地提出了“結(jié)構(gòu)化填充中間目標(biāo)(SFIM)”的訓(xùn)練方法。通過(guò)解析代碼語(yǔ)法樹(shù)節(jié)點(diǎn),選取完整的代碼邏輯單元作為訓(xùn)練跨度,有效避免了隨機(jī)選段造成的不完整情況,從而大幅提升了模型訓(xùn)練效果。實(shí)驗(yàn)表明,SFIM顯著提升了生成代碼的簡(jiǎn)潔性和結(jié)構(gòu)合理性。
除了模型性能外,企業(yè)在私域大模型落地過(guò)程中還關(guān)注多個(gè)要素。劉德欣總結(jié)了企業(yè)領(lǐng)域大模型落地的四大原則:掌握模型自治權(quán)、實(shí)現(xiàn)模型層的高解耦、建立可復(fù)用的數(shù)據(jù)框架以及始終關(guān)注業(yè)務(wù)。這些原則不僅為企業(yè)提供了落地大模型的指導(dǎo)思路,也為aiXcoder等服務(wù)商提供了與客戶(hù)合作的基礎(chǔ)框架。
面對(duì)大廠在代碼大模型領(lǐng)域的激烈競(jìng)爭(zhēng),aiXcoder憑借其垂直領(lǐng)域的深耕、與客戶(hù)的合作伙伴關(guān)系以及積極開(kāi)展與大廠的合作等策略,保持了強(qiáng)勁的市場(chǎng)競(jìng)爭(zhēng)力。劉德欣表示,aiXcoder將繼續(xù)在軟件工程和智能化這兩個(gè)垂直領(lǐng)域做更深的技術(shù)融合,并保持技術(shù)層面的持續(xù)領(lǐng)跑。
aiXcoder還創(chuàng)新推出了內(nèi)置MCP功能的軟件開(kāi)發(fā)Agent,正在內(nèi)測(cè)中。該Agent不僅支持企業(yè)私有化部署和針對(duì)性適配企業(yè)已有的開(kāi)源大模型,還具備強(qiáng)大的環(huán)境適配能力,支持企業(yè)在不影響現(xiàn)有代碼架構(gòu)的前提下快速接入企業(yè)私有化工具鏈。同時(shí),aiXcoder Agent功能計(jì)劃在插件端免費(fèi)開(kāi)放,使用門(mén)檻低,將有力推動(dòng)AI Coding行業(yè)的發(fā)展。
本文鏈接:http://www.www897cc.com/showinfo-45-12466-0.html代碼大模型爆發(fā):aiXcoder等如何引領(lǐng)軟件開(kāi)發(fā)新紀(jì)元?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com