日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

微軟推出 XOT 方法,提升語言模型推理能力

來源: 責編: 時間:2023-11-18 17:05:07 392觀看
導讀 11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經網絡,來增強 AI 模型推理能力。微軟和佐治亞理工學院、華東師范大學合作開發了該算

11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經網絡,來增強 AI 模型推理能力。0E728資訊網——每日最新資訊28at.com

0E728資訊網——每日最新資訊28at.com

0E728資訊網——每日最新資訊28at.com

0E728資訊網——每日最新資訊28at.com

微軟和佐治亞理工學院、華東師范大學合作開發了該算法,整合了強化學習(reinforcement learning)和蒙特卡洛樹搜索 (MCTS) 能力,在復雜決策環境中,進一步提高解決問題的有效性。0E728資訊網——每日最新資訊28at.com

注:微軟研究團隊表示 XOT 方法可以讓語言模型擴展到不熟悉的問題上,在 Game of 24、8-Puzzle 和 Pocket Cube 嚴苛測試中提升明顯。結果表明,XOT 明顯優于其他方法,甚至解決了其他方法失敗的問題。但是,XOT 并沒有達到 100% 的可靠性。0E728資訊網——每日最新資訊28at.com

0E728資訊網——每日最新資訊28at.com

XOT 框架包括以下關鍵步驟:0E728資訊網——每日最新資訊28at.com

預訓練階段:MCTS 模塊在特定任務上進行預訓練,以學習有關有效思維搜索的領域知識。輕量級策略和價值網絡指導搜索。思想搜索: 在推理過程中,預訓練的 MCTS 模塊使用策略 / 價值網絡來有效地探索和生成 LLM 的思想軌跡。0E728資訊網——每日最新資訊28at.com

思想修正:LLM 審查 MCTS 的思想并識別任何錯誤。修正的想法是通過額外的 MCTS 模擬產生的。0E728資訊網——每日最新資訊28at.com

LLM 推理: 將修改后的想法提供給 LLM 解決問題的最終提示。0E728資訊網——每日最新資訊28at.com

在此附上論文 [PDF] 地址,感興趣的用戶可以深入閱讀。0E728資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-2566-0.html微軟推出 XOT 方法,提升語言模型推理能力

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: DeepMind 大模型登 Science:1 分鐘預測 10 天天氣數據,90% 指標超越人類最強模型

下一篇: 消息稱滴滴組建大模型團隊,將落地部分個人出行和企業差旅場景

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 甘孜县| 东至县| 武夷山市| 利津县| 洪湖市| 富平县| 永新县| 蒙城县| 同德县| 利津县| 葫芦岛市| 郧西县| 西和县| 友谊县| 资兴市| 香港| 盐池县| 安平县| 宁德市| 江西省| 泰顺县| 宁化县| 永顺县| 江都市| 福安市| 桃园县| 新闻| 敦煌市| 彭州市| 龙州县| 靖江市| 中宁县| 天台县| 南投县| 滁州市| 长顺县| 洛宁县| 贵南县| 宁河县| 大余县| 汝州市|