跳转到内容

多模型路由

Hermes 支持同时配置多个 AI 模型,根据任务类型自动选择最合适的模型。这样既能省钱(简单任务用便宜模型),又能保证质量(复杂任务用好模型)。


不同 AI 模型各有专长:

模型特点适合做什么
DeepSeek V4 Flash响应快、价格低日常对话、简单查询、常规任务
GPT-5.x编程能力强写代码、重构、调试
Claude Opus分析深度好架构设计、复杂分析、长文本
Gemini Pro上下文窗口大处理超长文档、多模态输入

~/.hermes/config.yaml 中配置多个 provider:

providers:
# 主力模型——处理 80% 的日常任务
deepseek:
api_key: ${DEEPSEEK_API_KEY}
models:
- name: deepseek-chat
type: chat
# 代码专家——只有写代码时才调用
openai:
api_key: ${OPENAI_API_KEY}
models:
- name: gpt-4o
type: chat
# 深度推理——复杂问题使用
anthropic:
api_key: ${ANTHROPIC_API_KEY}
models:
- name: claude-sonnet-4
type: chat

配置好后,Hermes 会自动按策略选择模型:

你发来一个请求
├── 日常聊天/简单问题 → DeepSeek(成本最低)
├── 编写代码/调试 → GPT(编程最强)
├── 深度分析/架构设计 → Claude(分析最深)
├── 处理长文档 → Gemini(上下文最大)
└── 实验性任务 → 其他模型(按配置)

你也可以在对话中临时指定用哪个模型:

Terminal window
# 在 CLI 中
hermes --model claude-opus "帮我分析这个架构的缺陷"
# 在对话中
使用 GPT 帮我写一段 Python 代码

如果直接连接海外 API 不稳定,可以使用中转服务:

providers:
openai:
api_key: ${OPENAI_API_KEY}
base_url: "https://你的中转地址/v1" # 替换为你的中转 URL
models:
- name: gpt-4o
# 临时禁用有问题的模型
providers:
openai:
enabled: false # 先关掉

检查网络代理是否正常。尝试直接 ping API 地址:

Terminal window
curl -I https://api.openai.com

如果不通,检查代理配置

修改 config.yaml 中的 default_model

agent:
default_model: gpt-4o # 把主力模型改成 GPT