背景

日常做急诊医学研究,需要频繁检索文献。之前一直靠浏览器打开 PubMed、Google Scholar 手动搜索,再把摘要粘贴给 AI 分析。这个流程重复且低效——如果 AI Agent 能直接调用学术数据库的 API,搜索 + 阅读 + 整理一步到位,体验会好很多。

Sciverse 是 OpenDataLab 推出的学术检索平台,号称覆盖 5.16 亿条知识记录814 种语言130 万+ 期刊和会议。它提供了一个标准的 MCP Server,理论上任何支持 MCP 的 AI Agent 都能直接接入。

本文记录将 Sciverse MCP Server 接入 Hermes Agent 的完整过程,以及踩过的坑。

Sciverse 是什么

Sciverse 不只是学术搜索引擎,它是一个面向 AI Agent 的学术数据基础设施,包含三条产品线:

产品 定位 数据规模
Sciverse 科学文献检索与元数据搜索 5.16 亿条知识记录,130 万+ 期刊
DianShi(点石) 化学检索与逆合成 RAG 数千万化合物,数亿反应,数百万专利
SeqStudio 蛋白质功能注释 AI 推理平台 集成 BLAST、InterProScan、Foldseek 等

一个 API Key 通用三条产品线,具体可用能力取决于账号权限。

Sciverse 提供的 5 个 MCP 工具

接入后,AI Agent 获得以下能力:

工具 功能 典型场景
list_catalog 查看可用字段、过滤器、枚举值 了解有哪些字段可以筛选
search_papers 结构化元数据搜索 按作者、年份、期刊、学科精确检索
semantic_search 自然语言语义搜索(RAG) 用一句话描述需求,返回相关论文片段
read_content 获取论文原文片段 扩展 RAG 上下文,读取更多原文
get_resource 获取论文中的图表 下载论文中的 Figure/Table 图片

核心工作流是 semantic_searchread_content → 引用回答,形成完整的 RAG 闭环。

安装过程

1. 获取 API Token

Sciverse 控制台 注册并创建 Token,格式为 sv-xxxsci_xxx

2. 存储 Token

将 Token 写入 Hermes 的环境变量文件:

1
echo 'SCIVERSE_API_TOKEN=你的token' >> ~/.hermes/.env

不要直接写在 config.yaml 里,.env 文件权限更严格,且 Hermes 启动时自动加载。

3. 配置 MCP Server

~/.hermes/config.yaml 末尾添加:

1
2
3
4
5
6
mcp_servers:
sciverse:
command: npx
args: ["-y", "sciverse-mcp-server"]
env:
SCIVERSE_API_TOKEN: "${SCIVERSE_API_TOKEN}"

${SCIVERSE_API_TOKEN} 会被 Hermes 自动替换为 .env 中的值。

4. 重启 Hermes

MCP Server 配置在 Hermes 启动时加载,修改后必须重启:

1
hermes restart

或者关闭后重新打开 Hermes 桌面应用。

5. 验证

1
hermes mcp test sciverse

正常输出:

1
2
3
4
5
Testing 'sciverse'...
Transport: stdio → npx
Auth: none
✓ Connected (1485ms)
✓ Tools discovered: 5

5 个工具全部发现,连接成功。

实际使用效果

接入后直接用自然语言问就行:

1
帮我找 3 篇关于创伤性心脏骤停的论文,附原文片段引用

Agent 会自动调用 semantic_search 检索相关论文片段,再调用 read_content 获取更多上下文,最后整合成带引用的回答。

也可以先让 Agent 了解数据结构再精确查询:

1
2
先列出 Sciverse 有哪些字段、access_oa_status 有哪些可能值,
然后帮我找 2024 年以来 gold OA 状态的 Nature 期刊论文。

Agent 会先调 list_catalog(include_sample_values=true) 获取字段表和枚举值,再用 search_papers 构造精确过滤条件。

踩坑记录

Token 存放位置

一开始想直接写在 config.yamlenv 字段里,虽然能用但不推荐——配置文件可能被 git 追踪或意外泄露。正确做法是存到 ~/.hermes/.env,config 里用 ${VAR} 引用。

npx 首次拉包慢

npx -y sciverse-mcp-server 首次运行会下载 npm 包,可能需要几十秒。后续启动走缓存就快了。如果网络环境不好,可以先全局安装:

1
npm install -g sciverse-mcp-server

然后把 config 里的 command 改为 sciverse-mcpargs 留空。

MCP Server 与 ClawHub 不兼容

如果你之前用过 OpenClaw 生态的 ClawHub 技能市场,注意 Sciverse 的 MCP Server 是标准 MCP 协议,不是 ClawHub 的 Skill 格式。两者生态不互通,但 MCP 是通用协议,Hermes、Cursor、Claude Code 等主流 Agent 都支持。

修改 config.yaml 后需要重启

Hermes 不会热加载 MCP 配置,改完必须重启才能生效。可以用 hermes mcp test sciverse 快速确认。

与其他学术 MCP 对比

Sciverse 并不是唯一的学术搜索 MCP。社区里还有不少选择:

MCP Server 数据源 特点
Sciverse 自建索引(5.16 亿条) 覆盖面广,支持语义搜索 + 结构化过滤
Paper Search MCP arXiv、PubMed、Google Scholar 等 14 个 数据源多,但依赖各平台 API
Scholar Search MCP Semantic Scholar + arXiv 免费优先,并行搜索,去重
Scientific Papers MCP arXiv、OpenAlex、PMC 等 6 个 支持全文提取

Sciverse 的优势在于数据规模和统一的 API 体验——一个 Token 解决所有问题,不需要为每个数据源单独申请 API Key。

总结

整个接入过程不到 5 分钟:注册 Token → 写入 .env → 添加 MCP 配置 → 重启验证。Sciverse 的 MCP Server 遵循标准协议,没有额外的依赖或复杂的认证流程。

对于需要频繁检索学术文献的研究人员,这是一个性价比很高的配置。AI Agent 直接调用 API 搜索 + 阅读 + 整理,比手动复制粘贴高效得多。

参考资料