當(dāng)前位置：首頁 > 元宇宙 > AI

字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)公開，4 月 17 日開放接口

來源：責(zé)編：時(shí)間：2025-04-16 07:19:36 84觀看

導(dǎo)讀 4 月 14 日消息，從豆包大模型團(tuán)隊(duì)獲悉，字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)今日公開，該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗(yàn)。該模型在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作

4 月 14 日消息，從豆包大模型團(tuán)隊(duì)獲悉，字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)今日公開，該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗(yàn)。

該模型在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作等通用任務(wù)中表現(xiàn)突出，同時(shí)，模型采用 MoE 架構(gòu)，總參數(shù) 200B，激活參數(shù)為 20B，具備顯著的推理成本優(yōu)勢，單位推理成本相比 DeepSeek R1 降低 50%。

技術(shù)報(bào)告鏈接：https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

模型各方面具體表現(xiàn)：

專業(yè)領(lǐng)域：數(shù)學(xué)推理（AIME 2024 得分 86.7，追平 OpenAI o3-mini-high）、編程競賽（Codeforces pass@8 達(dá) 55.0%，接近 Gemini 2.5 Pro）、科學(xué)推理（GPQA 得分 77.3%，接近 o3-mini-high），均達(dá)到或接近業(yè)界第一梯隊(duì)水平。

通用任務(wù)：人類評估表現(xiàn)超 DeepSeek R1 8%，覆蓋多場景需求。

成本優(yōu)勢：單位推理成本相比 DeepSeek R1 降低 50%，實(shí)現(xiàn)性能與效率的平衡。

數(shù)據(jù)體系：融合可驗(yàn)證與創(chuàng)意性數(shù)據(jù)

針對推理與生成任務(wù)的不同需求，團(tuán)隊(duì)優(yōu)化了數(shù)據(jù)處理策略：

可驗(yàn)證數(shù)據(jù)（如數(shù)學(xué)、代碼題）：通過百萬級數(shù)據(jù)三重清洗（人工篩選 → 模型過濾 → 多模型驗(yàn)證），保留 10 萬道高難度題目；設(shè)計(jì)答案整數(shù)化改造、離線沙箱驗(yàn)證等機(jī)制，確保模型輸出真實(shí)推理過程；

非可驗(yàn)證數(shù)據(jù)（如創(chuàng)意寫作）：基于豆包 1.5 Pro 訓(xùn)練集，剔除低價(jià)值樣本，采用兩兩對比獎(jiǎng)勵(lì)法，優(yōu)化生成質(zhì)量；

全新評測基準(zhǔn)：構(gòu)建了超難數(shù)學(xué)數(shù)據(jù)集 BeyondAIME（100 道無答案題干題目），解決現(xiàn)有測試區(qū)分度不足問題。

獎(jiǎng)勵(lì)模型：雙軌體系校準(zhǔn)訓(xùn)練方向

團(tuán)隊(duì)提出雙軌獎(jiǎng)勵(lì)機(jī)制，兼顧“對錯(cuò)分明”與“見仁見智”任務(wù)：

可驗(yàn)證任務(wù)：開發(fā)了兩代驗(yàn)證器（Seed-Verifier → Seed-Thinking-Verifier），從字符匹配升級為推理步驟逐行對比（訓(xùn)練 / 測試集準(zhǔn)確率超 99%），杜絕模型“獎(jiǎng)勵(lì)欺騙”；

非可驗(yàn)證任務(wù)：引入 pairwise 對比訓(xùn)練，通過千萬次“AB 測試”，捕捉人類對創(chuàng)意、情感等的隱性偏好，避免“眾口難調(diào)”；

雙軌融合：針對混合場景設(shè)計(jì)協(xié)調(diào)機(jī)制，硬指標(biāo)（對錯(cuò)）與軟偏好（優(yōu)劣）互補(bǔ)，支撐全場景訓(xùn)練。

訓(xùn)練方法：“監(jiān)督精調(diào) + 強(qiáng)化學(xué)習(xí)”雙階段優(yōu)化

Seed-Thinking-v1.5 采用“打基礎(chǔ) + 磨能力”的全鏈路訓(xùn)練：

監(jiān)督精調(diào)（SFT）：基于 40 萬高質(zhì)量實(shí)例（30 萬可驗(yàn)證 +10 萬非可驗(yàn)證數(shù)據(jù)），結(jié)合人工與模型協(xié)同篩選，構(gòu)建長思考鏈數(shù)據(jù)集，確保模型“像人類一樣思考”；

強(qiáng)化學(xué)習(xí)（RL）：通過三重?cái)?shù)據(jù)引擎（可驗(yàn)證 / 通用 / 混合數(shù)據(jù)）、算法創(chuàng)新（價(jià)值預(yù)訓(xùn)練、解耦 GAE 等）以及在線數(shù)據(jù)適配技術(shù)，解決訓(xùn)練不穩(wěn)定、長鏈推理斷層等問題，動態(tài)調(diào)整數(shù)據(jù)分布以保持最佳訓(xùn)練狀態(tài)。

訓(xùn)練框架：支撐 20B MoE 的底層架構(gòu)

為應(yīng)對20BMoE（總參數(shù) 200B）的復(fù)雜訓(xùn)練需求，團(tuán)隊(duì)優(yōu)化了底層架構(gòu)：

HybridFlow 編程模型：支持算法快速探索與分布式并行運(yùn)行；

流式推理系統(tǒng)（SRS）：通過“流式推理”技術(shù)解耦模型演進(jìn)與異步推理，將訓(xùn)練速度提升 3 倍，萬億參數(shù)下穩(wěn)定性達(dá) 95%；

三層并行架構(gòu)：結(jié)合張量 / 專家 / 序列并行，動態(tài)均衡負(fù)載，基于 KARP 算法優(yōu)化 GPU 算力利用率。

本文鏈接：http://www.www897cc.com/showinfo-45-12277-0.html字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)公開，4 月 17 日開放接口

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI CEO 奧爾特曼：DeepSeek 并未影響 GPT 的增長，將推更好的開源模型

下一篇：我國團(tuán)隊(duì)研發(fā)，全球首個(gè)基因挖掘大模型 SYMPLEX 問世

標(biāo)簽：

熱門焦點(diǎn)

清華、北大等86所高校布局元宇宙，是風(fēng)口還是噱頭？

作者：徐賜豪來源：區(qū)塊鏈日報(bào)據(jù)全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟元宇宙專委會不完全統(tǒng)計(jì)，截至2023年7月，全國共有86所高校戰(zhàn)略布局元宇宙領(lǐng)域，其中本科院校73所，高職專科院校13所
ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

來源：首席商業(yè)評論2023年，最火的莫過于ChatGPT，席卷全球的同時(shí)也引發(fā)了生成式AI（人工智能）的投資熱潮。在美股，ChatGPT相關(guān)概念股飆漲，以AI算力龍頭英偉達(dá)為例，其股價(jià)年內(nèi)一度累計(jì)上
VR/AR迷失元宇宙“硝煙”

不溫不火的VR/AR可穿戴設(shè)備因元宇宙崛起火了一陣，又隨著元宇宙回歸平靜。1月份，微軟在 Surface 設(shè)備、HoloLens 混合現(xiàn)實(shí)硬件和 Xbox 等部門裁員，其中負(fù)責(zé)混合現(xiàn)實(shí)硬件（MR）的Holo
藍(lán)標(biāo)虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

日前，天下秀數(shù)字科技集團(tuán)正式公布了2022年報(bào)及2023年一季報(bào)。報(bào)告顯示，2022年天下秀實(shí)現(xiàn)營收41.29億元，同比下滑8.48%；歸母凈利潤1.8億元，同比下滑49.2%，幾乎出現(xiàn)了盈利腰斬的態(tài)勢
智能人機(jī)交互技術(shù)的春晚大考

1月初的一個(gè)早晨，京東智能客戶服務(wù)產(chǎn)品部緊急開會，進(jìn)行關(guān)于尚未對外公布的“X項(xiàng)目”的初討論。1月5日，這個(gè)神秘的X項(xiàng)目對外公布，京東成為央視2022年春晚獨(dú)家互動合
“元宇宙第一股”Roblox緣何被資本市場看“低”？

近期，冬奧會的召開受到廣泛關(guān)注，而吉祥物冰墩墩也成為新晉“頂流”，“一墩難求”成為普遍心聲，為了滿足大眾需求，nWayPlay平臺曾在2月12日發(fā)售了一款由國際奧委會官
紐約街頭出現(xiàn)NFT自動販賣機(jī)

一家初創(chuàng)公司宣布在紐約市開放一臺NFT自動售貨機(jī)，允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺名為Neon，上個(gè)月完成了一輪300萬美元的種子募捐
藝術(shù)創(chuàng)作者能否永久收取版稅？

NFTs正在改變我們理解互聯(lián)網(wǎng)所有權(quán)的方式，社區(qū)管理的所有權(quán)有很多好處，但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益（版稅），會發(fā)生什么？這不是一個(gè)容易解決的問題，版稅
你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

前有騰訊、阿里申請商標(biāo)注冊，后有Facebook宣布改名，若論當(dāng)前互聯(lián)網(wǎng)最火最熱的概念，當(dāng)屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)公開，4 月 17 日開放接口

清華、北大等86所高校布局元宇宙，是風(fēng)口還是噱頭？

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

VR/AR迷失元宇宙“硝煙”

藍(lán)標(biāo)虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

智能人機(jī)交互技術(shù)的春晚大考

“元宇宙第一股”Roblox緣何被資本市場看“低”？

紐約街頭出現(xiàn)NFT自動販賣機(jī)

藝術(shù)創(chuàng)作者能否永久收取版稅？

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

最新推薦

元宇宙將會如何塑造未來的工作方式？

網(wǎng)易音樂、理想申請?jiān)钪嫔虡?biāo)被駁回，“啫喱”暫停新用戶進(jìn)入

元宇宙時(shí)代NFT的價(jià)值衡量

字節(jié)覓《原神》，騰訊元宇宙，游戲新王戰(zhàn)舊神？

數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素與數(shù)字治理

王老吉啟動元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

猜你喜歡

熱門推薦

相關(guān)資訊