ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。
研究人员在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行了综合评测。结果显示,一个 70 亿参数的监督微调模型使用 ZeroSearch 后,其搜索能力达到了 33.06;140 亿参数的模型则达到了 33.97,超过了谷歌搜索的 32.47。
研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练,成本约为 586.70 美元(IT之家注:现汇率约合 4238 元人民币);而在四个 A100GPU 上使用 140 亿参数的大模型进行模拟时,成本仅为70.80 美元(现汇率约合 511 元人民币),意味着成本降低了 87.93% 以上。
参考链接:
- 论文地址:https://arxiv.org/abs/2505.04588
- 开源地址:https://github.com/Alibaba-nlp/ZeroSearch
- 抱抱脸:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0