多模型路由
Hermes 支持同时配置多个 AI 模型,根据任务类型自动选择最合适的模型。这样既能省钱(简单任务用便宜模型),又能保证质量(复杂任务用好模型)。
为什么需要多个模型
Section titled “为什么需要多个模型”不同 AI 模型各有专长:
| 模型 | 特点 | 适合做什么 |
|---|---|---|
| DeepSeek V4 Flash | 响应快、价格低 | 日常对话、简单查询、常规任务 |
| GPT-5.x | 编程能力强 | 写代码、重构、调试 |
| Claude Opus | 分析深度好 | 架构设计、复杂分析、长文本 |
| Gemini Pro | 上下文窗口大 | 处理超长文档、多模态输入 |
在 ~/.hermes/config.yaml 中配置多个 provider:
providers: # 主力模型——处理 80% 的日常任务 deepseek: api_key: ${DEEPSEEK_API_KEY} models: - name: deepseek-chat type: chat
# 代码专家——只有写代码时才调用 openai: api_key: ${OPENAI_API_KEY} models: - name: gpt-4o type: chat
# 深度推理——复杂问题使用 anthropic: api_key: ${ANTHROPIC_API_KEY} models: - name: claude-sonnet-4 type: chat配置好后,Hermes 会自动按策略选择模型:
你发来一个请求 │ ├── 日常聊天/简单问题 → DeepSeek(成本最低) ├── 编写代码/调试 → GPT(编程最强) ├── 深度分析/架构设计 → Claude(分析最深) ├── 处理长文档 → Gemini(上下文最大) └── 实验性任务 → 其他模型(按配置)手动指定模型
Section titled “手动指定模型”你也可以在对话中临时指定用哪个模型:
# 在 CLI 中hermes --model claude-opus "帮我分析这个架构的缺陷"
# 在对话中使用 GPT 帮我写一段 Python 代码配置 API 中转
Section titled “配置 API 中转”如果直接连接海外 API 不稳定,可以使用中转服务:
providers: openai: api_key: ${OPENAI_API_KEY} base_url: "https://你的中转地址/v1" # 替换为你的中转 URL models: - name: gpt-4o某个模型报错
Section titled “某个模型报错”# 临时禁用有问题的模型providers: openai: enabled: false # 先关掉所有模型都超时
Section titled “所有模型都超时”检查网络代理是否正常。尝试直接 ping API 地址:
curl -I https://api.openai.com如果不通,检查代理配置。
想切换主力模型
Section titled “想切换主力模型”修改 config.yaml 中的 default_model:
agent: default_model: gpt-4o # 把主力模型改成 GPT