日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 元宇宙 > AI

字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)公開,4 月 17 日開放接口

來源: 責(zé)編: 時(shí)間:2025-04-16 07:19:36 84觀看
導(dǎo)讀 4 月 14 日消息,從豆包大模型團(tuán)隊(duì)獲悉,字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)今日公開,該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗(yàn)。該模型在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作

4 月 14 日消息,從豆包大模型團(tuán)隊(duì)獲悉,字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)今日公開,該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗(yàn)。ZLa28資訊網(wǎng)——每日最新資訊28at.com

該模型在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作等通用任務(wù)中表現(xiàn)突出,同時(shí),模型采用 MoE 架構(gòu),總參數(shù) 200B,激活參數(shù)為 20B,具備顯著的推理成本優(yōu)勢,單位推理成本相比 DeepSeek R1 降低 50%。ZLa28資訊網(wǎng)——每日最新資訊28at.com

技術(shù)報(bào)告鏈接:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5ZLa28資訊網(wǎng)——每日最新資訊28at.com

模型各方面具體表現(xiàn):

專業(yè)領(lǐng)域:數(shù)學(xué)推理(AIME 2024 得分 86.7,追平 OpenAI o3-mini-high)、編程競賽(Codeforces pass@8 達(dá) 55.0%,接近 Gemini 2.5 Pro)、科學(xué)推理(GPQA 得分 77.3%,接近 o3-mini-high),均達(dá)到或接近業(yè)界第一梯隊(duì)水平。ZLa28資訊網(wǎng)——每日最新資訊28at.com

通用任務(wù):人類評估表現(xiàn)超 DeepSeek R1 8%,覆蓋多場景需求。ZLa28資訊網(wǎng)——每日最新資訊28at.com

成本優(yōu)勢:單位推理成本相比 DeepSeek R1 降低 50%,實(shí)現(xiàn)性能與效率的平衡。ZLa28資訊網(wǎng)——每日最新資訊28at.com

ZLa28資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)體系:融合可驗(yàn)證與創(chuàng)意性數(shù)據(jù)

針對推理與生成任務(wù)的不同需求,團(tuán)隊(duì)優(yōu)化了數(shù)據(jù)處理策略:ZLa28資訊網(wǎng)——每日最新資訊28at.com

可驗(yàn)證數(shù)據(jù)(如數(shù)學(xué)、代碼題):通過百萬級數(shù)據(jù)三重清洗(人工篩選 → 模型過濾 → 多模型驗(yàn)證),保留 10 萬道高難度題目;設(shè)計(jì)答案整數(shù)化改造、離線沙箱驗(yàn)證等機(jī)制,確保模型輸出真實(shí)推理過程;ZLa28資訊網(wǎng)——每日最新資訊28at.com

非可驗(yàn)證數(shù)據(jù)(如創(chuàng)意寫作):基于豆包 1.5 Pro 訓(xùn)練集,剔除低價(jià)值樣本,采用兩兩對比獎(jiǎng)勵(lì)法,優(yōu)化生成質(zhì)量;ZLa28資訊網(wǎng)——每日最新資訊28at.com

全新評測基準(zhǔn):構(gòu)建了超難數(shù)學(xué)數(shù)據(jù)集 BeyondAIME(100 道無答案題干題目),解決現(xiàn)有測試區(qū)分度不足問題。ZLa28資訊網(wǎng)——每日最新資訊28at.com

獎(jiǎng)勵(lì)模型:雙軌體系校準(zhǔn)訓(xùn)練方向

團(tuán)隊(duì)提出雙軌獎(jiǎng)勵(lì)機(jī)制,兼顧“對錯(cuò)分明”與“見仁見智”任務(wù):ZLa28資訊網(wǎng)——每日最新資訊28at.com

可驗(yàn)證任務(wù):開發(fā)了兩代驗(yàn)證器(Seed-Verifier → Seed-Thinking-Verifier),從字符匹配升級為推理步驟逐行對比(訓(xùn)練 / 測試集準(zhǔn)確率超 99%),杜絕模型“獎(jiǎng)勵(lì)欺騙”;ZLa28資訊網(wǎng)——每日最新資訊28at.com

非可驗(yàn)證任務(wù):引入 pairwise 對比訓(xùn)練,通過千萬次“AB 測試”,捕捉人類對創(chuàng)意、情感等的隱性偏好,避免“眾口難調(diào)”;ZLa28資訊網(wǎng)——每日最新資訊28at.com

雙軌融合:針對混合場景設(shè)計(jì)協(xié)調(diào)機(jī)制,硬指標(biāo)(對錯(cuò))與軟偏好(優(yōu)劣)互補(bǔ),支撐全場景訓(xùn)練。ZLa28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)練方法:“監(jiān)督精調(diào) + 強(qiáng)化學(xué)習(xí)”雙階段優(yōu)化

Seed-Thinking-v1.5 采用“打基礎(chǔ) + 磨能力”的全鏈路訓(xùn)練:ZLa28資訊網(wǎng)——每日最新資訊28at.com

監(jiān)督精調(diào)(SFT):基于 40 萬高質(zhì)量實(shí)例(30 萬可驗(yàn)證 +10 萬非可驗(yàn)證數(shù)據(jù)),結(jié)合人工與模型協(xié)同篩選,構(gòu)建長思考鏈數(shù)據(jù)集,確保模型“像人類一樣思考”;ZLa28資訊網(wǎng)——每日最新資訊28at.com

強(qiáng)化學(xué)習(xí)(RL):通過三重?cái)?shù)據(jù)引擎(可驗(yàn)證 / 通用 / 混合數(shù)據(jù))、算法創(chuàng)新(價(jià)值預(yù)訓(xùn)練、解耦 GAE 等)以及在線數(shù)據(jù)適配技術(shù),解決訓(xùn)練不穩(wěn)定、長鏈推理斷層等問題,動態(tài)調(diào)整數(shù)據(jù)分布以保持最佳訓(xùn)練狀態(tài)。ZLa28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)練框架:支撐 20B MoE 的底層架構(gòu)

為應(yīng)對20BMoE(總參數(shù) 200B)的復(fù)雜訓(xùn)練需求,團(tuán)隊(duì)優(yōu)化了底層架構(gòu):ZLa28資訊網(wǎng)——每日最新資訊28at.com

HybridFlow 編程模型:支持算法快速探索與分布式并行運(yùn)行;ZLa28資訊網(wǎng)——每日最新資訊28at.com

流式推理系統(tǒng)(SRS):通過“流式推理”技術(shù)解耦模型演進(jìn)與異步推理,將訓(xùn)練速度提升 3 倍,萬億參數(shù)下穩(wěn)定性達(dá) 95%;ZLa28資訊網(wǎng)——每日最新資訊28at.com

三層并行架構(gòu):結(jié)合張量 / 專家 / 序列并行,動態(tài)均衡負(fù)載,基于 KARP 算法優(yōu)化 GPU 算力利用率。ZLa28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12277-0.html字節(jié)跳動最新思考模型 Seed-Thinking-v1.5 技術(shù)細(xì)節(jié)公開,4 月 17 日開放接口

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI CEO 奧爾特曼:DeepSeek 并未影響 GPT 的增長,將推更好的開源模型

下一篇: 我國團(tuán)隊(duì)研發(fā),全球首個(gè)基因挖掘大模型 SYMPLEX 問世

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 清華、北大等86所高校布局元宇宙,是風(fēng)口還是噱頭?

    作者:徐賜豪來源:區(qū)塊鏈日報(bào)據(jù)全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟元宇宙專委會不完全統(tǒng)計(jì),截至2023年7月,全國共有86所高校戰(zhàn)略布局元宇宙領(lǐng)域,其中本科院校73所,高職專科院校13所
  • ChatGPT訪問量增速下滑,AI真的是一場泡沫嗎?

    來源:首席商業(yè)評論2023年,最火的莫過于ChatGPT,席卷全球的同時(shí)也引發(fā)了生成式AI(人工智能)的投資熱潮。在美股,ChatGPT相關(guān)概念股飆漲,以AI算力龍頭英偉達(dá)為例,其股價(jià)年內(nèi)一度累計(jì)上
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設(shè)備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設(shè)備、HoloLens 混合現(xiàn)實(shí)硬件和 Xbox 等部門裁員,其中負(fù)責(zé)混合現(xiàn)實(shí)硬件(MR)的Holo
  • 藍(lán)標(biāo)虧錢、Meta裁員:天下秀還值得砸錢元宇宙嗎?

    日前,天下秀數(shù)字科技集團(tuán)正式公布了2022年報(bào)及2023年一季報(bào)。報(bào)告顯示,2022年天下秀實(shí)現(xiàn)營收41.29億元,同比下滑8.48%;歸母凈利潤1.8億元,同比下滑49.2%,幾乎出現(xiàn)了盈利腰斬的態(tài)勢
  • 智能人機(jī)交互技術(shù)的春晚大考

    1月初的一個(gè)早晨,京東智能客戶服務(wù)產(chǎn)品部緊急開會,進(jìn)行關(guān)于尚未對外公布的“X項(xiàng)目”的初討論。1月5日,這個(gè)神秘的X項(xiàng)目對外公布,京東成為央視2022年春晚獨(dú)家互動合
  • “元宇宙第一股”Roblox緣何被資本市場看“低”?

    近期,冬奧會的召開受到廣泛關(guān)注,而吉祥物冰墩墩也成為新晉“頂流”,“一墩難求”成為普遍心聲,為了滿足大眾需求,nWayPlay平臺曾在2月12日發(fā)售了一款由國際奧委會官
  • 紐約街頭出現(xiàn)NFT自動販賣機(jī)

    一家初創(chuàng)公司宣布在紐約市開放一臺NFT自動售貨機(jī),允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺名為Neon,上個(gè)月完成了一輪300萬美元的種子募捐
  • 藝術(shù)創(chuàng)作者能否永久收取版稅?

    NFTs正在改變我們理解互聯(lián)網(wǎng)所有權(quán)的方式,社區(qū)管理的所有權(quán)有很多好處,但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益(版稅),會發(fā)生什么?這不是一個(gè)容易解決的問題,版稅
  • 你連元宇宙都不知道嗎?快來看看這四本元宇宙書籍吧

    前有騰訊、阿里申請商標(biāo)注冊,后有Facebook宣布改名,若論當(dāng)前互聯(lián)網(wǎng)最火最熱的概念,當(dāng)屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“
Top 主站蜘蛛池模板: 云和县| 乐亭县| 棋牌| 上高县| 朝阳市| 庐江县| 阳山县| 文登市| 黄大仙区| 中超| 班戈县| 浦东新区| 青川县| 嘉黎县| 达州市| 大同县| 进贤县| 林芝县| 墨江| 上饶县| 河西区| 左权县| 香河县| 深泽县| 新余市| 邳州市| 方山县| 宁南县| 沐川县| 治县。| 新化县| 梨树县| 宝坻区| 宣恩县| 新安县| 民和| 西华县| 巴林左旗| 武汉市| 泽库县| 汪清县|