隨著技術(shù)的飛速發(fā)展,特別是通用大模型性能的顯著提升以及推理算力成本的急劇下降,垂直領(lǐng)域的大模型正迎來前所未有的發(fā)展機遇。在這波浪潮中,代碼大模型尤為引人注目,不僅吸引了市場的廣泛關(guān)注,更成為資本競相追逐的焦點。
根據(jù)Gartner發(fā)布的《2024年全球IT支出預(yù)測》報告,全球軟件開發(fā)人力成本正以年均7-9%的速度增長,預(yù)計到2024年,全球軟件相關(guān)支出將達(dá)到1.2萬億美元,其中人力成本占比高達(dá)50%,即6000億美元。而在中國,互聯(lián)網(wǎng)巨頭們在軟件開發(fā)方面的人力成本壓力更為顯著,部分公司的薪酬及相關(guān)支出年增幅已接近15%。
然而,與日益增長的軟件開發(fā)需求相比,全球軟件工程師的缺口卻在持續(xù)擴大。有數(shù)據(jù)顯示,未來十年內(nèi),這一缺口可能達(dá)到數(shù)千萬之巨,成為制約各行各業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵因素。在此背景下,代碼大模型憑借其獨特的優(yōu)勢,成為了少數(shù)具備明確商業(yè)化條件和付費意愿的垂直行業(yè)大模型之一。
Cursor作為海外知名的AI編程產(chǎn)品,僅用21個月便實現(xiàn)了1億美元的ARR,成為歷史上增長最快的SaaS產(chǎn)品之一,估值更是高達(dá)100億美元。Gartner還預(yù)測,到2026年,AI將自動化全球30%的編碼任務(wù),這意味著代碼大模型市場將是一個“看得見”的千億美元級大蛋糕。
不僅海外市場如火如荼,國內(nèi)通用大模型廠商也紛紛涉足代碼大模型領(lǐng)域。阿里的通義靈碼、騰訊的騰訊云AI代碼助手、華為的Code Arts、字節(jié)跳動的豆包Mars Code以及百度的文心快碼等,都在這場激烈的競爭中嶄露頭角。京東、訊飛、昆侖萬維、DeepSeek、智譜等多家通用大模型廠商也都在積極布局這一領(lǐng)域。
在眾多參與者中,aiXcoder以其深厚的積淀和卓越的模型性能脫穎而出。依托北大軟件工程研究所60余年的積累,aiXcoder團(tuán)隊從多篇全球頂級會議論文的奠基,到全球首個十億級和百億級參數(shù)的國產(chǎn)代碼大模型aiXcoder的發(fā)布,再到國內(nèi)諸多大廠頭部客戶的實踐落地,實現(xiàn)了從實驗室理論到產(chǎn)業(yè)價值的閉環(huán)突破。
aiXcoder-7B模型更是其最新力作。該模型在多個評測集的評測結(jié)果中超越了同級別參數(shù)規(guī)模的眾多開源模型,如Qwen2.5-Coder-7B、DeepSeekCoder-7B、CodeLlama-7B等。在代碼生成與補全效果上,aiXcoder-7B均達(dá)到了SOTA評價(即當(dāng)前最佳)。
今年年初,aiXcoder(北京硅心科技有限公司)成功完成了A++輪融資,由中關(guān)村發(fā)展集團(tuán)旗下中關(guān)村資本和中關(guān)村協(xié)同創(chuàng)新基金共同參投。至此,該公司已累計獲得4輪融資,吸引了伽利略資本、高瓴創(chuàng)投、彬復(fù)資本、清流資本、三七互娛等多家頂級風(fēng)險投資機構(gòu)的青睞。
近日,aiXcoder的商業(yè)合伙人兼總裁劉德欣在接受訪談時,深入探討了當(dāng)前代碼大模型行業(yè)面臨的技術(shù)瓶頸和未來趨勢。他表示,通用大模型雖然強大,但由于其構(gòu)建和訓(xùn)練方式基于自然語言而非編程語言,因此在處理代碼時存在一定的局限性。代碼相比自然語言具有更強的上下文依賴性和結(jié)構(gòu)性,這要求模型必須能夠精準(zhǔn)地理解程序語言的結(jié)構(gòu)和語義。
針對這一問題,aiXcoder-7B采用了結(jié)構(gòu)化Span的形式構(gòu)建模型,并創(chuàng)新性地提出了“結(jié)構(gòu)化填充中間目標(biāo)(SFIM)”的訓(xùn)練方法。通過解析代碼語法樹節(jié)點,選取完整的代碼邏輯單元作為訓(xùn)練跨度,有效避免了隨機選段造成的不完整情況,從而大幅提升了模型訓(xùn)練效果。實驗表明,SFIM顯著提升了生成代碼的簡潔性和結(jié)構(gòu)合理性。
除了模型性能外,企業(yè)在私域大模型落地過程中還關(guān)注多個要素。劉德欣總結(jié)了企業(yè)領(lǐng)域大模型落地的四大原則:掌握模型自治權(quán)、實現(xiàn)模型層的高解耦、建立可復(fù)用的數(shù)據(jù)框架以及始終關(guān)注業(yè)務(wù)。這些原則不僅為企業(yè)提供了落地大模型的指導(dǎo)思路,也為aiXcoder等服務(wù)商提供了與客戶合作的基礎(chǔ)框架。
面對大廠在代碼大模型領(lǐng)域的激烈競爭,aiXcoder憑借其垂直領(lǐng)域的深耕、與客戶的合作伙伴關(guān)系以及積極開展與大廠的合作等策略,保持了強勁的市場競爭力。劉德欣表示,aiXcoder將繼續(xù)在軟件工程和智能化這兩個垂直領(lǐng)域做更深的技術(shù)融合,并保持技術(shù)層面的持續(xù)領(lǐng)跑。
aiXcoder還創(chuàng)新推出了內(nèi)置MCP功能的軟件開發(fā)Agent,正在內(nèi)測中。該Agent不僅支持企業(yè)私有化部署和針對性適配企業(yè)已有的開源大模型,還具備強大的環(huán)境適配能力,支持企業(yè)在不影響現(xiàn)有代碼架構(gòu)的前提下快速接入企業(yè)私有化工具鏈。同時,aiXcoder Agent功能計劃在插件端免費開放,使用門檻低,將有力推動AI Coding行業(yè)的發(fā)展。
本文鏈接:http://www.www897cc.com/showinfo-45-12466-0.html代碼大模型爆發(fā):aiXcoder等如何引領(lǐng)軟件開發(fā)新紀(jì)元?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com