Survey: 有哪些好用的用于网络搜索的 MCP Servers?
网络搜索的 MCP servers 由两个部分组成:一个是网页搜索服务,另一个是包装成符合 MCP 规范的 MCP server(供 Agent 使用)。
考虑到现在 MCP servers 相当繁多,而且大多生命短暂(无人维护),因此想让 AI 用上网络搜索的 MCP 工具,首先考虑的是有公司维护的、性价比高的产品,一般搜索质量会好一点,然后再考虑开发者个人搭建的那些 MCP servers(一般它们就是将一个或多个网页搜索服务包装起来,当然也有很多是“巧用”传统搜索引擎的)。
TL; DR
下面的表格先对目前 survey 到的进行总结:
表 I: 公司维护的网页搜索产品及配套 MCP Server
名称 | 主要功能 | 免费额度/限制 | 搜索服务 私有部署支持 | MCP Server | 使用体验 |
---|---|---|---|---|---|
Brave Search | 网页搜索、新闻聚合、视频/图像聚合 | 1 请求/秒,2000 请求/月,free plan 也需要绑定银行卡 | 不支持 | @modelcontextprotocol/server-brave-search | 信用卡问题没能尝试到 |
Exa.ai | 网页搜索、网页爬虫、AI 生成问答、Agent Research、Websets 表格整理 | 仅 1000 credits(价值 $10),后续需购买,信用卡订阅制 | 不支持 | Exa MCP Server | 牛的,只能说质量确实超过了其他几种方案,但是免费额度太少了 |
Firecrawl | 网页抓取和爬取(转 Markdown 等)、映射、网页搜索、AI提取 | 500 credits(每页面 1 credit),2并发请求,低速率限制,后续需购买,信用卡订阅制 | 支持(开源) | Firecrawl MCP Server | 只要是自己使用,它的scrape 功能足够了(不会被封 IP 的话),但playwright 实例太耗费计算资源了 |
Tavily | 语义 Web 搜索、Web 访问、Research、Extract | 每月 1000 次搜索(学生认证免费),信用卡订阅制 | 不支持 | Tavily MCP Server | 中规中矩,免费版限速肯定没法商用部署,自己用马马虎虎,搜索结果有些杂 |
Jina | Reader(爬取 URL)、Web/学术搜索、SERP、Embedding、Reranker 等 | 无 API Key 时仅 Reader 功能(20 RPM);免费计划 1000 万 tokens,后续需购买,信用卡订阅制 | 不支持 | Jina MCP Server | 仅次于 exa |
SearXNG | 元搜索引擎(整合多个传统搜索引擎) | 无账户/API Key,依赖实例承受能力 | 支持(开源) | 社区维护 | 这个看似是 meta search engine,实际上能用的比较少,可能是各大搜索引擎反爬措施越来越好了 |
Bright Data | 网页搜索、网页爬虫、突破网页机器人检查、Websets | 5000 次请求,后续需购买,免费版限制仅 web search,国内不需要信用卡,可用支付宝 | 不支持 | Bright Data MCP Server | 这个免费版不能用?返回结果全是空值(可能是测试时账户审核没下来),没敢尝试付费版 |
表 II: 开发者维护的 MCP Servers
名称 | 支持的搜索引擎 | API Key需求 | 使用体验 |
---|---|---|---|
web-search-mcp | Bing(浏览器模拟)、Brave Search(浏览器模拟)、DuckDuckGo | 不需要 | 嗯,比较一般,可用性不佳 |
Open-WebSearch MCP Server | Bing、Baidu、CSDN、DuckDuckGo、Exa、Brave、Juejin、GitHub READMEs | 不需要 | bing 几乎用不了,duckduckgo 调用次数一多就返回空值了 |
one-search-mcp | Web search: SearXNG、Firecrawl、Tavily、DuckDuckGo、Bing; Local Browser: Bing, Google, Baidu, Sogou | SearXNG/Tavily/Firecrawl 需可选 API Key,其他不需要 | SearXNG 配置有些问题,部署脚本对着 firecrawl 改的,总体一般,和 firecrawl + open-websearch 很像 |
总而言之,单从 “想要给 Agent 加入 web search 能力” 这个需求来说,如果是个人使用(优先 free plan),不考虑部署难度的话,建议:
one-search-mcp (多个 API Key) > tavily 官方 MCP servers > 自部署 SearXNG/Firecrawl 搜索服务 + 社区 MCP server > 不需要 API Key 的社区 MCP servers > Jina/Exa/Firecrawl 官方 MCP + 对应的官方搜索服务 (个人使用性价比不高);
如果考虑商用和可靠性,建议 Bright Data (国内充值方便) > Exa.ai (有点贵) > Tavily (搜索引擎内容有点杂);
下面是详细介绍。
公司维护的网页搜索产品 & 配套的 MCP server
1. Brave Search
可以进行的功能:
基本的网页搜索 Web search
新闻聚合 News cluster
视频/图像聚合 Videos/Images
建议注册 API 获得更稳定的体验。到目前为止(2025/08/26),free plan 的限额:
- 1 request per second(限速每秒 1 个请求);
- 2,000 requests per month(限量每个月 2000 请求);
不支持私有部署网络搜索服务,MCP server 只能使用 API Key + proxy(@modelcontextprotocol/server-brave-search
)连接官网的服务使用:brave search - guide: use with claude desktop with MCP;
2. Exa.ai: Web search for LLMs
它自称为为 AI 构建的搜索引擎,而不是为人类构建的,类似于 AI 版的Google。创始人 Jeff Wang 和 Will Bryk 认为,Google 为人类提供的服务,他们希望通过 Exa 为 AI 提供类似的功能。
因此,与 Perplexity 相比,Exa 更像是面向 B 端企业和开发者的 AI 研究工具,而非传统搜索引擎。
可以进行的功能:
- 网页搜索
- 网页爬虫
- AI 生成问答、Agent Research;
- Websets 表格整理总结
必须注册才能使用功能。比较尴尬的是 Exa 免费限额非常少:
- 仅 1000 credits(价值 10 美刀),后面不会免费补充,需要手动购买;
- 每 1000 次请求消耗 5 ~ 25 美刀不等;
- 限制 Websets 结果 25 条;
果然是面向 B 端的,价格土豪随意~
不支持私有部署搜索服务,MCP server 使用类似 brave search:Exa MCP server;
3. Firecrawl
开源的 web data API,可以将爬取的网页转为 markdown 方便 AI 使用。
除了开源版,该公司提供了 cloud 版,具有比开源版更多的服务支持:
可以进行的功能:
- 网页抓取和爬取 Scrape & Crawl:抓取一个 URL 并以 LLM 可读格式获取其内容(Markdown、通过 LLM Extract 提取的结构化数据、截图、HTML);
- 映射 Map:输入网站地址即可获取该网站的所有 URL,速度极快;
- 网页搜索 Web Search:搜索网络并从结果中获取完整内容;
- AI 提取 LLM Extract:使用 AI 从单个页面、多个页面或整个网站中获取结构化数据。
free plan 也比较少:
- 500 credits,每次爬取/处理 1 个页面消耗一个 credit,后面不会免费补充;
- 支持 2 个并发请求;
- 较低的 rate limit;
不过好在是开源的,因此允许私有部署搜索服务:self-hosting,你可能需要自己准备 redis、supabase 数据库。
和上面的几个方案一样,有配套的 MCP Server;
4. Travily
定位和上述几款都很像,号称 “Connect Your Agent to the Web”。
主要功能就是有语义的 web search、一般的 web access、research、extract;
学生认证免费(不过麻烦),free plan 的限额:每月 1000 次搜索机会;
不支持私有部署搜索服务,有配套的 MCP Server;
5. Jina
定位是 Agent Search Foundation,支持功能:
- Reader 爬取和处理 URL 指向页面的内容、Web Search 网络搜索、SERP;
- Embedding 嵌入向量计算;
- Reranker 网页/数据相关性排序;
- DeepSearch、Classifier…
允许不使用 API Key,一个 IP 限额:
- 仅能使用 Reader 爬取指定 URL 页面信息,转成 LLM 易读的数据;
- 限速 20 RPM;
free plan 限额:
- 一千万 tokens,后面不会免费补充;
- 全功能开放,限速个人够用;
不支持私有部署搜索服务,有配套的 MCP Server,亮点是支持学术搜索,例如爬取 Arxiv 上的文献。
6. SearXNG
开源,定位是一个 Metasearch engine,综合各个搜索引擎信息的搜索引擎。
主要功能就只是对传统搜索引擎(bing/duckduckgo/google 等)做整合搜索。团队提供了很多个实例可以免费使用,只要被请求方能够承受就行。
不提供账户/ API Key;
开源因此允许私有部署 self-hosting 搜索服务,MCP server 是社区维护的。
7. Bright Data
这家公司专门做反反爬措施的,号称能破除互联网上任何检测 AI 机器人的选项卡。主要业务是爬虫、网页数据收集,包括了 web search 和 scrape。
免费额度:
- 5000 次请求(价值 $7.5),后面不会补充;
- 仅限 Web unlocker, browser API;
注册时需要写不少于 50 词的小作文,以及各种信息。尝试了免费版的发现搜索结果都返回空值?之后再试试。
有配套 MCP server;
开发者维护的 MCP servers
- mrkrsl - web-search-mcp:提供 3 个工具:browser-based bing、browser-based brave search、duckduckgo;
- 前两个是用浏览器自动化工具
playwright
模拟用户访问 bing / 使用 brave search(需要已经安装 firefox/chromium 内核),因此不需要 API Key; - duckduckgo API 本身不需要 API Key,但搜索结果有限;
- 前两个是用浏览器自动化工具
- Aas-ee - Open-WebSearch MCP Server:偏向国内用户搜索喜好,支持 bing、baidu、CSDN、duckduckgo、exa、brave、juejin、github READMEs,不需要 API Key;
- 实际测试下来感受一般,搜索结果很少,并且大多是 duckduckgo 贡献的,其他的经常请求错误/返回空数据;
- yokingma - one-search-mcp:
- 支持 SearXNG, Firecrawl, Tavily, DuckDuckGo, Bing:可以选择给 SearchXNG / Tavily / Firecrawl 访问时使用 API Key。其他引擎不需要 API Key;
- 支持本地浏览器模拟访问:Bing, Google, Baidu, Sogou,需要已安装 chromium 内核;
其他测试的 MCP servers 质量一般,就不放上来了。有新的/好用的欢迎补充。