给 Hermes Agent 接入 Sciverse:5 分钟搞定学术搜索 MCP
背景
日常做急诊医学研究,需要频繁检索文献。之前一直靠浏览器打开 PubMed、Google Scholar 手动搜索,再把摘要粘贴给 AI 分析。这个流程重复且低效——如果 AI Agent 能直接调用学术数据库的 API,搜索 + 阅读 + 整理一步到位,体验会好很多。
Sciverse 是 OpenDataLab 推出的学术检索平台,号称覆盖 5.16 亿条知识记录、814 种语言、130 万+ 期刊和会议。它提供了一个标准的 MCP Server,理论上任何支持 MCP 的 AI Agent 都能直接接入。
本文记录将 Sciverse MCP Server 接入 Hermes Agent 的完整过程,以及踩过的坑。
Sciverse 是什么
Sciverse 不只是学术搜索引擎,它是一个面向 AI Agent 的学术数据基础设施,包含三条产品线:
| 产品 | 定位 | 数据规模 |
|---|---|---|
| Sciverse | 科学文献检索与元数据搜索 | 5.16 亿条知识记录,130 万+ 期刊 |
| DianShi(点石) | 化学检索与逆合成 RAG | 数千万化合物,数亿反应,数百万专利 |
| SeqStudio | 蛋白质功能注释 AI 推理平台 | 集成 BLAST、InterProScan、Foldseek 等 |
一个 API Key 通用三条产品线,具体可用能力取决于账号权限。
Sciverse 提供的 5 个 MCP 工具
接入后,AI Agent 获得以下能力:
| 工具 | 功能 | 典型场景 |
|---|---|---|
list_catalog |
查看可用字段、过滤器、枚举值 | 了解有哪些字段可以筛选 |
search_papers |
结构化元数据搜索 | 按作者、年份、期刊、学科精确检索 |
semantic_search |
自然语言语义搜索(RAG) | 用一句话描述需求,返回相关论文片段 |
read_content |
获取论文原文片段 | 扩展 RAG 上下文,读取更多原文 |
get_resource |
获取论文中的图表 | 下载论文中的 Figure/Table 图片 |
核心工作流是 semantic_search → read_content → 引用回答,形成完整的 RAG 闭环。
安装过程
1. 获取 API Token
去 Sciverse 控制台 注册并创建 Token,格式为 sv-xxx 或 sci_xxx。
2. 存储 Token
将 Token 写入 Hermes 的环境变量文件:
1 | echo 'SCIVERSE_API_TOKEN=你的token' >> ~/.hermes/.env |
不要直接写在
config.yaml里,.env文件权限更严格,且 Hermes 启动时自动加载。
3. 配置 MCP Server
在 ~/.hermes/config.yaml 末尾添加:
1 | mcp_servers: |
${SCIVERSE_API_TOKEN} 会被 Hermes 自动替换为 .env 中的值。
4. 重启 Hermes
MCP Server 配置在 Hermes 启动时加载,修改后必须重启:
1 | hermes restart |
或者关闭后重新打开 Hermes 桌面应用。
5. 验证
1 | hermes mcp test sciverse |
正常输出:
1 | Testing 'sciverse'... |
5 个工具全部发现,连接成功。
实际使用效果
接入后直接用自然语言问就行:
1 | 帮我找 3 篇关于创伤性心脏骤停的论文,附原文片段引用 |
Agent 会自动调用 semantic_search 检索相关论文片段,再调用 read_content 获取更多上下文,最后整合成带引用的回答。
也可以先让 Agent 了解数据结构再精确查询:
1 | 先列出 Sciverse 有哪些字段、access_oa_status 有哪些可能值, |
Agent 会先调 list_catalog(include_sample_values=true) 获取字段表和枚举值,再用 search_papers 构造精确过滤条件。
踩坑记录
Token 存放位置
一开始想直接写在 config.yaml 的 env 字段里,虽然能用但不推荐——配置文件可能被 git 追踪或意外泄露。正确做法是存到 ~/.hermes/.env,config 里用 ${VAR} 引用。
npx 首次拉包慢
npx -y sciverse-mcp-server 首次运行会下载 npm 包,可能需要几十秒。后续启动走缓存就快了。如果网络环境不好,可以先全局安装:
1 | npm install -g sciverse-mcp-server |
然后把 config 里的 command 改为 sciverse-mcp,args 留空。
MCP Server 与 ClawHub 不兼容
如果你之前用过 OpenClaw 生态的 ClawHub 技能市场,注意 Sciverse 的 MCP Server 是标准 MCP 协议,不是 ClawHub 的 Skill 格式。两者生态不互通,但 MCP 是通用协议,Hermes、Cursor、Claude Code 等主流 Agent 都支持。
修改 config.yaml 后需要重启
Hermes 不会热加载 MCP 配置,改完必须重启才能生效。可以用 hermes mcp test sciverse 快速确认。
与其他学术 MCP 对比
Sciverse 并不是唯一的学术搜索 MCP。社区里还有不少选择:
| MCP Server | 数据源 | 特点 |
|---|---|---|
| Sciverse | 自建索引(5.16 亿条) | 覆盖面广,支持语义搜索 + 结构化过滤 |
| Paper Search MCP | arXiv、PubMed、Google Scholar 等 14 个 | 数据源多,但依赖各平台 API |
| Scholar Search MCP | Semantic Scholar + arXiv | 免费优先,并行搜索,去重 |
| Scientific Papers MCP | arXiv、OpenAlex、PMC 等 6 个 | 支持全文提取 |
Sciverse 的优势在于数据规模和统一的 API 体验——一个 Token 解决所有问题,不需要为每个数据源单独申请 API Key。
总结
整个接入过程不到 5 分钟:注册 Token → 写入 .env → 添加 MCP 配置 → 重启验证。Sciverse 的 MCP Server 遵循标准协议,没有额外的依赖或复杂的认证流程。
对于需要频繁检索学术文献的研究人员,这是一个性价比很高的配置。AI Agent 直接调用 API 搜索 + 阅读 + 整理,比手动复制粘贴高效得多。



