日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

上下文1.6萬token的編程大模型來了!與Stable Diffusion出自同門,一次吃5個Python文件不費勁

來源: 責(zé)編: 時間:2023-08-09 23:01:48 342觀看
導(dǎo)讀一個Stable Diffusion還不夠!Stability AI再放殺手锏,進擊代碼生成領(lǐng)域:推出了一款自稱具有革命性的編碼工具StableCode。敲重點的是,StableCode不僅支持Python、Go、Java、JavaScript、C、Markdown、C++等多種編程語言。

一個Stable Diffusion還不夠!Stability AI再放殺手锏,進擊代碼生成領(lǐng)域:s7C28資訊網(wǎng)——每日最新資訊28at.com

推出了一款自稱具有革命性的編碼工具StableCode。s7C28資訊網(wǎng)——每日最新資訊28at.com

敲重點的是,StableCode不僅支持Python、Go、Java、JavaScript、C、Markdown、C++等多種編程語言。s7C28資訊網(wǎng)——每日最新資訊28at.com

還直接把上下文長度拉到16000個token。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

好家伙,網(wǎng)友直呼瘋批:s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

這波還直接戳中網(wǎng)友痛點:s7C28資訊網(wǎng)——每日最新資訊28at.com

我們真的很需要一個能夠?qū)⒄麄€代碼庫塞進上下文的工具。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

上下文窗口16000token

官網(wǎng)顯示,StableCode模型具有30億參數(shù),將提供基礎(chǔ)模型、指令模型、長上下文窗口模型三種不同的模型,幫助開發(fā)人員編碼。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

StableCode在HPC(高性能計算)集群上,使用5600億代碼token的編程語言數(shù)據(jù)集starcoder-data對基礎(chǔ)模型進行了訓(xùn)練。s7C28資訊網(wǎng)——每日最新資訊28at.com

StarCoder是HuggingFace和ServiceNow合作成立的開放科學(xué)合作組織BigCode于五月份開源的針對代碼的大模型。s7C28資訊網(wǎng)——每日最新資訊28at.com

Stability AI首席研究科學(xué)家Nathan Cooper對VentureBeat表示:s7C28資訊網(wǎng)——每日最新資訊28at.com

我們非常喜歡BigCode,因為他們在數(shù)據(jù)治理、模型治理和模型訓(xùn)練方面做了驚人的工作,我們用了他們的數(shù)據(jù)集,并對其進行了額外的過濾和清理,同時也用在了構(gòu)建長上下文窗口的模型,在我們的集群上進行了訓(xùn)練。s7C28資訊網(wǎng)——每日最新資訊28at.com

對于復(fù)雜的編程任務(wù),StableCode則針對特定用例進行了指令調(diào)優(yōu)。s7C28資訊網(wǎng)——每日最新資訊28at.com

在基礎(chǔ)模型的基礎(chǔ)上,用約120000個Alpaca格式的“代碼指令-回答”對訓(xùn)練了指令模型。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

△StableCode指令生成對給定指令響應(yīng)的代碼。

此外,為了滿足用戶對上下文窗口長度的需求,StableCode的長上下文窗口模型直接將上下文窗口拉長至16000個token,是此前開源模型的2-4倍。s7C28資訊網(wǎng)——每日最新資訊28at.com

△與類似大小的模型(3B)進行的 HumanEval 基準比較。△與類似大小的模型(3B)進行的 HumanEval 基準比較。s7C28資訊網(wǎng)——每日最新資訊28at.com

不僅為用戶提供了可單行、多行自動完成建議的工具,還允許用戶同時查看編輯相當于五個中等大小的Python文件,允許更專業(yè)復(fù)雜的代碼生成prompt。s7C28資訊網(wǎng)——每日最新資訊28at.com

下面是一個StableCode利用Pytorch深度學(xué)習(xí)庫完成一個相對復(fù)雜的Python文件展示(灰色文本顯示了StableCode的預(yù)測)。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

使用了RoPE的方法

此外,StableCode也是用到了Transformer架構(gòu),不同于StarCoder用ALiBi(線性偏差的注意力)的方法定位模型輸出,StableCode則是使用了RoPE(旋轉(zhuǎn)位置嵌入)的方法。s7C28資訊網(wǎng)——每日最新資訊28at.com

Cooper表示:s7C28資訊網(wǎng)——每日最新資訊28at.com

在Transformer模型中,ALiBi方法傾向于更加重視當前的token,而不是過去的token。這對于代碼生成來說不是一個理想的方法,因為代碼沒有固定的敘述結(jié)構(gòu),沒有明確的開始、中間和結(jié)束。代碼的功能可以在應(yīng)用流程的任何點被定義。所以我們使用RoPE,它沒有這種偏見。s7C28資訊網(wǎng)——每日最新資訊28at.com

StableCode目前還處于早期階段,初始發(fā)布的目標是觀察開發(fā)者如何接受和使用這個模型。s7C28資訊網(wǎng)——每日最新資訊28at.com

我們將與社區(qū)進行互動合作,看看他們會提出哪些有趣的方向,并針對開發(fā)者領(lǐng)域進行生成式探索 。s7C28資訊網(wǎng)——每日最新資訊28at.com

研究主管Christian Laforte也淺聊了StableCode的目標:s7C28資訊網(wǎng)——每日最新資訊28at.com

與Stable Diffusion幫助世界上任何人成為藝術(shù)家類似,我們希望StableCode模型能讓任何有好點子但卻遇到問題的人,能夠編寫一個解決問題的程序。s7C28資訊網(wǎng)——每日最新資訊28at.com

看到Stability AI再放大招的這波操作,有網(wǎng)友在去測試Github Copilot的路上來了個掉頭:s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

還有網(wǎng)友希望“預(yù)定”下一次動作:s7C28資訊網(wǎng)——每日最新資訊28at.com

真的很想看Stability AI在文本轉(zhuǎn)語音方面,做些類似谷歌SoundStorm(聲音風(fēng)暴)的事啊。s7C28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片s7C28資訊網(wǎng)——每日最新資訊28at.com

此外,StableCode目前已經(jīng)開源啦!s7C28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:
[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
[2]https://twitter.com/StabilityAI/status/1688931312122675200s7C28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-5096-0.html上下文1.6萬token的編程大模型來了!與Stable Diffusion出自同門,一次吃5個Python文件不費勁

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 八個 Visual Studio Code 擴展,提升軟件開發(fā)生產(chǎn)力

下一篇: 透過源碼,捋清楚循環(huán)依賴到底是如何解決的!

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 九龙坡区| 大兴区| 南岸区| 大方县| 响水县| 绥德县| 苗栗市| 象山县| 兰考县| 五台县| 托里县| 马山县| 乐平市| 内黄县| 荔浦县| 青州市| 青田县| 古交市| 灌阳县| 天镇县| 米林县| 泊头市| 洛扎县| 胶州市| 长治市| 菏泽市| 怀柔区| 屏东县| 扶余县| 克拉玛依市| 鄂尔多斯市| 会同县| 永安市| 莱州市| 建宁县| 环江| 璧山县| 清水县| 深州市| 克什克腾旗| 苍溪县|