5 月 9 日消息,阿里巴巴昨日在 Github 等平臺開源了 ZeroSearch 大模型搜索引擎。這是一種無需與真實搜索引擎交互即可激勵大模型搜索能力的強化學習框架。
ZeroSearch主要利用了大模型在大規模預訓練過程中積累的豐富知識,將其轉化為一個檢索模塊,能夠根據搜索查詢生成相關內容。同時,還可以動態控制生成內容的質量,這是傳統搜索引擎所不具備的特殊功能。
研究人員在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大問答數據集上進行了綜合評測。結果顯示,一個 70 億參數的監督微調模型使用 ZeroSearch 后,其搜索能力達到了 33.06;140 億參數的模型則達到了 33.97,超過了谷歌搜索的 32.47。
研究人員通過 SerpAPI 使用谷歌搜索進行約 64,000 次搜索查詢的訓練,成本約為 586.70 美元(注:現匯率約合 4238 元人民幣);而在四個 A100GPU 上使用 140 億參數的大模型進行模擬時,成本僅為70.80 美元(現匯率約合 511 元人民幣),意味著成本降低了 87.93% 以上。
參考鏈接:
論文地址:https://arxiv.org/abs/2505.04588
開源地址:https://github.com/Alibaba-nlp/ZeroSearch
抱抱臉:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0
本文鏈接:http://www.www897cc.com/showinfo-45-12770-0.html超谷歌搜索:阿里開源創新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更強
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com