日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

微軟推出 XOT 方法,提升語言模型推理能力

來源: 責編: 時間:2023-11-18 17:05:07 345觀看
導讀 11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經網絡,來增強 AI 模型推理能力。微軟和佐治亞理工學院、華東師范大學合作開發了該算

11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經網絡,來增強 AI 模型推理能力。3E728資訊網——每日最新資訊28at.com

3E728資訊網——每日最新資訊28at.com

3E728資訊網——每日最新資訊28at.com

3E728資訊網——每日最新資訊28at.com

微軟和佐治亞理工學院、華東師范大學合作開發了該算法,整合了強化學習(reinforcement learning)和蒙特卡洛樹搜索 (MCTS) 能力,在復雜決策環境中,進一步提高解決問題的有效性。3E728資訊網——每日最新資訊28at.com

注:微軟研究團隊表示 XOT 方法可以讓語言模型擴展到不熟悉的問題上,在 Game of 24、8-Puzzle 和 Pocket Cube 嚴苛測試中提升明顯。結果表明,XOT 明顯優于其他方法,甚至解決了其他方法失敗的問題。但是,XOT 并沒有達到 100% 的可靠性。3E728資訊網——每日最新資訊28at.com

3E728資訊網——每日最新資訊28at.com

XOT 框架包括以下關鍵步驟:3E728資訊網——每日最新資訊28at.com

預訓練階段:MCTS 模塊在特定任務上進行預訓練,以學習有關有效思維搜索的領域知識。輕量級策略和價值網絡指導搜索。思想搜索: 在推理過程中,預訓練的 MCTS 模塊使用策略 / 價值網絡來有效地探索和生成 LLM 的思想軌跡。3E728資訊網——每日最新資訊28at.com

思想修正:LLM 審查 MCTS 的思想并識別任何錯誤。修正的想法是通過額外的 MCTS 模擬產生的。3E728資訊網——每日最新資訊28at.com

LLM 推理: 將修改后的想法提供給 LLM 解決問題的最終提示。3E728資訊網——每日最新資訊28at.com

在此附上論文 [PDF] 地址,感興趣的用戶可以深入閱讀。3E728資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-2566-0.html微軟推出 XOT 方法,提升語言模型推理能力

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: DeepMind 大模型登 Science:1 分鐘預測 10 天天氣數據,90% 指標超越人類最強模型

下一篇: 消息稱滴滴組建大模型團隊,將落地部分個人出行和企業差旅場景

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 井研县| 西宁市| 噶尔县| 九龙城区| 社旗县| 海城市| 伊金霍洛旗| 惠东县| 屯昌县| 田林县| 福安市| 白玉县| 玉环县| 凉山| 彭州市| 阳谷县| 武川县| 昭平县| 镇康县| 沂水县| 灵石县| 潞西市| 铜川市| 南汇区| 邵阳县| 山丹县| 苏尼特左旗| 九寨沟县| 洪洞县| 公安县| 南澳县| 孙吴县| 青田县| 阿巴嘎旗| 大埔区| 申扎县| 泰顺县| 东海县| 都江堰市| 青阳县| 黔江区|