當(dāng)前位置：首頁 > 元宇宙 > AI

DeepSeek-V3 & R1 合體：快手開源 "Auto Think " 大模型，可根據(jù)問題自動(dòng)調(diào)節(jié)思考深度

來源：責(zé)編：時(shí)間：2025-06-06 09:38:24 73觀看

導(dǎo)讀 6 月 4 日消息，快手 Kwaipilot 團(tuán)隊(duì)近日開源了 KwaiCoder-AutoThink-preview 自動(dòng)思考大模型，針對(duì)近期深度思考大模型存在的“過度思考”問題進(jìn)行了深入研究。團(tuán)隊(duì)提出了一種全新的自動(dòng)思考模型訓(xùn)練范式，同時(shí)基

6 月 4 日消息，快手 Kwaipilot 團(tuán)隊(duì)近日開源了 KwaiCoder-AutoThink-preview 自動(dòng)思考大模型，針對(duì)近期深度思考大模型存在的“過度思考”問題進(jìn)行了深入研究。團(tuán)隊(duì)提出了一種全新的自動(dòng)思考模型訓(xùn)練范式，同時(shí)基于傳統(tǒng)強(qiáng)化學(xué)習(xí)算法（GRPO），提出了帶有過程監(jiān)督的強(qiáng)化學(xué)習(xí)方法 Step-SRPO，以進(jìn)一步提升模型在復(fù)雜任務(wù)中的表現(xiàn)。

據(jù)介紹，該模型融合了“思考”和“非思考”能力，號(hào)稱“DeepSeek-V3 & R1 合體”，具備根據(jù)問題難度自動(dòng)切換思考形態(tài)的能力。通過進(jìn)行這種思考形態(tài)訓(xùn)練，模型在多個(gè)“思考”和“非思考”評(píng)測(cè)榜單上均實(shí)現(xiàn)了性能提升，其中在部分代碼和數(shù)學(xué)類的任務(wù)上，開啟自動(dòng)思考模式下的模型得分提升高達(dá) 20 分左右。官方表示，在部分榜單中，即使模型沒有開啟思考模式，受益于更優(yōu)的推理形態(tài)，性能也有小幅上漲。

快手技術(shù)表示，Kwaipilot 未來將基于 preview 版本模型，進(jìn)一步增強(qiáng)推理能力，支持更完善的思考中工具使用能力，也會(huì)將全部技術(shù)細(xì)節(jié)、訓(xùn)練方法開源。附模型開源地址：

https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-preview

本文鏈接：http://www.www897cc.com/showinfo-45-13494-0.htmlDeepSeek-V3 & R1 合體：快手開源 "Auto Think " 大模型，可根據(jù)問題自動(dòng)調(diào)節(jié)思考深度

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： Mac 版 ChatGPT 變身生產(chǎn)力神器：AI 錄音 + 云文件洞察，打造團(tuán)隊(duì)協(xié)作最佳助手

下一篇：韓國(guó)總統(tǒng)李在明承諾 100 萬億韓元 AI 投資計(jì)劃，大力擴(kuò)展基礎(chǔ)設(shè)施建設(shè)

標(biāo)簽：

熱門焦點(diǎn)

錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

來源：三頭鳥NFT大家好，我是鳥哥，了解鳥哥的人都知道鳥哥擅擼空投，說實(shí)話擼毛雖然回報(bào)大但周期還是有點(diǎn)長(zhǎng)的，所以除了擼毛我們自己也在研究早期項(xiàng)目，打新，比如BRC20協(xié)議ordi當(dāng)時(shí)就有
元宇宙是投資中國(guó)的第五次重大機(jī)遇

作者為凱思博投資董事長(zhǎng)導(dǎo)語：投資邏輯要來自于人性在社會(huì)發(fā)展過程中的普遍規(guī)律，由第一性原理出發(fā)找出重大的投資機(jī)會(huì)來。1978年的改革開放到今天，中國(guó)總共經(jīng)歷了
中文在線的“元宇宙”故事，資本聽膩了？

被譽(yù)為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國(guó)移動(dòng)通信聯(lián)合會(huì)元宇宙產(chǎn)業(yè)委員會(huì)揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
“元宇宙第一股”Roblox首份年報(bào)未達(dá)預(yù)期，摩根大通成為首家進(jìn)入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報(bào)未達(dá)預(yù)期致盤后股價(jià)暴跌15.28%；YouTube宣布進(jìn)軍區(qū)塊鏈和元宇宙；摩根大通成為首家進(jìn)入元宇宙的銀行。【中
從NFT頂級(jí)公鏈到Web3.0基礎(chǔ)設(shè)施：帶你了解不一樣的Flow

對(duì)于大部分年輕人來說，剛剛過去的春節(jié)有一個(gè)詞語突然成為了品牌宣傳的流行語，作為從NFT中衍生出來的“數(shù)字藏品”一時(shí)間獲得了不少品牌青睞，他們紛紛推出自己的數(shù)
頂流IP“冰墩墩”帶著中國(guó)元素NFT進(jìn)入全球視野

一場(chǎng)被國(guó)際奧委會(huì)主席評(píng)價(jià)堪稱獨(dú)具匠心、非凡卓越的2022年北京冬季奧運(yùn)會(huì)，在這個(gè)“雙奧之城”經(jīng)歷了16個(gè)令人難忘的精彩日夜，最終圓滿閉幕。讓我們印象深刻的不
以用戶為中心，Web3和區(qū)塊鏈如何將用戶放在首位

競(jìng)爭(zhēng)優(yōu)勢(shì)正在改變競(jìng)爭(zhēng)優(yōu)勢(shì)是每個(gè)企業(yè)都在努力爭(zhēng)取的，由谷歌、Facebook和Netflix等大型科技公司主導(dǎo)的市場(chǎng)中，兩大重要類別的競(jìng)爭(zhēng)優(yōu)勢(shì)十分突出。第一個(gè)競(jìng)爭(zhēng)優(yōu)勢(shì)來
元宇宙需要的5個(gè)重要安全功能

元宇宙的可能用途使其成為一個(gè)令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細(xì)考慮和開發(fā)，以保護(hù)用戶
以太坊面臨來自Fantom的巨大挑戰(zhàn)

眾所周知，區(qū)塊鏈和加密貨幣項(xiàng)目經(jīng)常因其對(duì)環(huán)境的影響而受到批評(píng)。但是有一個(gè)非營(yíng)利性的加密貨幣和區(qū)塊鏈項(xiàng)目說它比其他的更環(huán)保。今天老雅痞就給大家聊一聊加

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek-V3 & R1 合體：快手開源 "Auto Think " 大模型，可根據(jù)問題自動(dòng)調(diào)節(jié)思考深度

錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

元宇宙是投資中國(guó)的第五次重大機(jī)遇

中文在線的“元宇宙”故事，資本聽膩了？

“元宇宙第一股”Roblox首份年報(bào)未達(dá)預(yù)期，摩根大通成為首家進(jìn)入元宇宙的銀行

從NFT頂級(jí)公鏈到Web3.0基礎(chǔ)設(shè)施：帶你了解不一樣的Flow

頂流IP“冰墩墩”帶著中國(guó)元素NFT進(jìn)入全球視野

以用戶為中心，Web3和區(qū)塊鏈如何將用戶放在首位

元宇宙需要的5個(gè)重要安全功能

以太坊面臨來自Fantom的巨大挑戰(zhàn)

最新推薦

沉寂3年，大模型激活小度天貓精靈？

韓國(guó)主權(quán)基金增加對(duì)硅谷初創(chuàng)公司投資押注元宇宙和人工智能

2021年中國(guó)智慧城市行業(yè)概覽：AI慧眼獨(dú)具，賦能“雙碳”目標(biāo)

從英式拍到荷蘭拍，看傳統(tǒng)金融拍賣玩法如何玩轉(zhuǎn)NFT市場(chǎng)交易

數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素與數(shù)字治理

為什么元宇宙將永遠(yuǎn)改變體育和你的生活？

猜你喜歡

熱門推薦

相關(guān)資訊