阿里巴巴昨日在 Github 等平臺開源了 ZeroSearch 大模型搜索引擎。這是一種無需與真實搜索引擎交互即可激勵大模型搜索能力的強化學習框架。
ZeroSearch 主要利用了大模型在大規模預訓練過程中積累的豐富知識,將其轉化為一個檢索模塊,能夠根據搜索查詢生成相關內容。同時,還可以動態控制生成內容的質量,這是傳統搜索引擎所不具備的特殊功能。
研究人員在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大問答數據集上進行了綜合評測。結果顯示,一個 70 億參數的監督微調模型使用 ZeroSearch 后,其搜索能力達到了 33.06;140 億參數的模型則達到了 33.97,超過了谷歌搜索的 32.47。
研究人員通過 SerpAPI 使用谷歌搜索進行約 64,000 次搜索查詢的訓練,成本約為 586.70 美元(IT之家注:現匯率約合 4238 元人民幣);而在四個 A100GPU 上使用 140 億參數的大模型進行模擬時,成本僅為70.80 美元(現匯率約合 511 元人民幣),意味著成本降低了 87.93% 以上。