备用提供商

Hermes Agent 有三层弹性机制，确保提供商出现问题时你的会话持续运行：

凭证池 — 在同一提供商的多个 API 密钥间轮换（优先尝试）
主模型备用 — 当主模型失败时自动切换到不同的 provider:model
辅助任务备用 — 视觉、压缩和网页提取等辅助任务的独立提供商解析

凭证池处理同提供商轮换（例如多个 OpenRouter 密钥）。本页介绍跨提供商备用。两者都是可选的，独立工作。

主模型备用

当你的主 LLM 提供商遇到错误——速率限制、服务器过载、认证失败、连接中断——Hermes 可以在会话中自动切换到备用 provider:model 对，而不会丢失对话。

配置

在 ~/.hermes/config.yaml 中添加 fallback_model 部分：

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

provider 和 model 都是必填的。如果缺少任一项，备用功能将被禁用。

支持的提供商

提供商	值	要求
AI Gateway	`ai-gateway`	`AI_GATEWAY_API_KEY`
OpenRouter	`openrouter`	`OPENROUTER_API_KEY`
Nous Portal	`nous`	`hermes auth`（OAuth）
OpenAI Codex	`openai-codex`	`hermes model`（ChatGPT OAuth）
GitHub Copilot	`copilot`	`COPILOT_GITHUB_TOKEN`、`GH_TOKEN` 或 `GITHUB_TOKEN`
GitHub Copilot ACP	`copilot-acp`	外部进程（编辑器集成）
Anthropic	`anthropic`	`ANTHROPIC_API_KEY` 或 Claude Code 凭证
z.ai / GLM	`zai`	`GLM_API_KEY`
Kimi / Moonshot	`kimi-coding`	`KIMI_API_KEY`
MiniMax	`minimax`	`MINIMAX_API_KEY`
MiniMax（中国）	`minimax-cn`	`MINIMAX_CN_API_KEY`
DeepSeek	`deepseek`	`DEEPSEEK_API_KEY`
NVIDIA NIM	`nvidia`	`NVIDIA_API_KEY`（可选：`NVIDIA_BASE_URL`）
Ollama Cloud	`ollama-cloud`	`OLLAMA_API_KEY`
Google Gemini（OAuth）	`google-gemini-cli`	`hermes model`（Google OAuth；可选：`HERMES_GEMINI_PROJECT_ID`）
Google AI Studio	`gemini`	`GOOGLE_API_KEY`（别名：`GEMINI_API_KEY`）
xAI（Grok）	`xai`（别名 `grok`）	`XAI_API_KEY`（可选：`XAI_BASE_URL`）
AWS Bedrock	`bedrock`	标准 boto3 认证（`AWS_REGION` + `AWS_PROFILE` 或 `AWS_ACCESS_KEY_ID`）
Qwen Portal（OAuth）	`qwen-oauth`	`hermes model`（Qwen Portal OAuth；可选：`HERMES_QWEN_BASE_URL`）
OpenCode Zen	`opencode-zen`	`OPENCODE_ZEN_API_KEY`
OpenCode Go	`opencode-go`	`OPENCODE_GO_API_KEY`
Kilo Code	`kilocode`	`KILOCODE_API_KEY`
小米 MiMo	`xiaomi`	`XIAOMI_API_KEY`
Arcee AI	`arcee`	`ARCEEAI_API_KEY`
阿里巴巴 / DashScope	`alibaba`	`DASHSCOPE_API_KEY`
Hugging Face	`huggingface`	`HF_TOKEN`
自定义端点	`custom`	`base_url` + `key_env`（见下文）

自定义端点备用

对于自定义的 OpenAI 兼容端点，添加 base_url 和可选的 key_env：

fallback_model:
  provider: custom
  model: my-local-model
  base_url: http://localhost:8000/v1
  key_env: MY_LOCAL_KEY              # 包含 API 密钥的环境变量名

备用何时触发

当主模型出现以下错误时，备用自动激活：

速率限制（HTTP 429）— 重试耗尽后
服务器错误（HTTP 500、502、503）— 重试耗尽后
认证失败（HTTP 401、403）— 立即（无需重试）
未找到（HTTP 404）— 立即
无效响应 — 当 API 反复返回格式错误或空响应时

触发后，Hermes 会：

解析备用提供商的凭证
构建新的 API 客户端
就地替换模型、提供商和客户端
重置重试计数器并继续对话

切换是无缝的——你的对话历史、工具调用和上下文都会保留。Agent 从它停下的地方继续，只是使用不同的模型。

单次触发

备用在每个会话中最多激活一次。如果备用提供商也失败了，正常的错误处理将接管（重试，然后错误消息）。这防止了级联故障转移循环。

示例

OpenRouter 作为 Anthropic 原生的备用：

model:
  provider: anthropic
  default: claude-sonnet-4-6

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

Nous Portal 作为 OpenRouter 的备用：

model:
  provider: openrouter
  default: anthropic/claude-opus-4

fallback_model:
  provider: nous
  model: nous-hermes-3

本地模型作为云服务的备用：

fallback_model:
  provider: custom
  model: llama-3.1-70b
  base_url: http://localhost:8000/v1
  key_env: LOCAL_API_KEY

Codex OAuth 作为备用：

fallback_model:
  provider: openai-codex
  model: gpt-5.3-codex

备用支持的场景

场景	是否支持备用
CLI 会话	✔
消息网关（Telegram、Discord 等）	✔
子代理委托	✘（子代理不继承备用配置）
Cron 定时任务	✘（使用固定提供商运行）
辅助任务（视觉、压缩）	✘（使用自己的提供商链——见下文）

提示

没有用于 fallback_model 的环境变量——它仅通过 config.yaml 配置。这是有意为之：备用配置是一个深思熟虑的选择，不应该被过期的 shell 导出变量覆盖。

辅助任务备用

Hermes 使用独立的轻量模型处理辅助任务。每个任务都有自己的提供商解析链，作为内置的备用系统。

具有独立提供商解析的任务

任务	功能	配置键
视觉	图像分析、浏览器截图	`auxiliary.vision`
网页提取	网页摘要	`auxiliary.web_extract`
压缩	上下文压缩摘要	`auxiliary.compression`
会话搜索	历史会话摘要	`auxiliary.session_search`
技能中心	技能搜索和发现	`auxiliary.skills_hub`
MCP	MCP 辅助操作	`auxiliary.mcp`
记忆刷新	记忆整合	`auxiliary.flush_memories`
审批	智能命令审批分类	`auxiliary.approval`
标题生成	会话标题摘要	`auxiliary.title_generation`

自动检测链

当任务的提供商设为 "auto"（默认值）时，Hermes 按顺序尝试提供商直到成功：

文本任务（压缩、网页提取等）：

OpenRouter → Nous Portal → 自定义端点 → Codex OAuth →
API 密钥提供商（z.ai、Kimi、MiniMax、小米 MiMo、Hugging Face、Anthropic） → 放弃

视觉任务：

主提供商（如果支持视觉）→ OpenRouter → Nous Portal →
Codex OAuth → Anthropic → 自定义端点 → 放弃

如果解析到的提供商在调用时失败，Hermes 还有内部重试：如果提供商不是 OpenRouter 且没有设置显式 base_url，它会尝试 OpenRouter 作为最后的备用。

配置辅助提供商

每个任务都可以在 config.yaml 中独立配置：

auxiliary:
  vision:
    provider: "auto"              # auto | openrouter | nous | codex | main | anthropic
    model: ""                     # 例如 "openai/gpt-4o"
    base_url: ""                  # 直接端点（优先于 provider）
    api_key: ""                   # base_url 的 API 密钥

  web_extract:
    provider: "auto"
    model: ""

  compression:
    provider: "auto"
    model: ""

  session_search:
    provider: "auto"
    model: ""

  skills_hub:
    provider: "auto"
    model: ""

  mcp:
    provider: "auto"
    model: ""

  flush_memories:
    provider: "auto"
    model: ""

以上每个任务都遵循相同的 provider / model / base_url 模式。上下文压缩在 auxiliary.compression 下配置：

auxiliary:
  compression:
    provider: main                                    # 与其他辅助任务相同的提供商选项
    model: google/gemini-3-flash-preview
    base_url: null                                    # 自定义 OpenAI 兼容端点

备用模型使用：

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4
  # base_url: http://localhost:8000/v1               # 可选自定义端点

三者——辅助任务、压缩、备用——工作方式相同：设置 provider 选择谁处理请求，model 选择哪个模型，base_url 指向自定义端点（覆盖 provider）。

辅助任务的提供商选项

这些选项仅适用于 auxiliary:、compression: 和 fallback_model: 配置——"main" 不是顶级 model.provider 的有效值。对于自定义端点，在 model: 部分使用 provider: custom（参见 AI 提供商）。

提供商	说明	要求
`"auto"`	按顺序尝试提供商直到成功（默认）	至少配置一个提供商
`"openrouter"`	强制使用 OpenRouter	`OPENROUTER_API_KEY`
`"nous"`	强制使用 Nous Portal	`hermes auth`
`"codex"`	强制使用 Codex OAuth	`hermes model` → Codex
`"main"`	使用主 Agent 当前使用的提供商（仅辅助任务）	已配置活动主提供商
`"anthropic"`	强制使用 Anthropic 原生	`ANTHROPIC_API_KEY` 或 Claude Code 凭证

直接端点覆盖

对于任何辅助任务，设置 base_url 会完全跳过提供商解析，直接向该端点发送请求：

auxiliary:
  vision:
    base_url: "http://localhost:1234/v1"
    api_key: "local-key"
    model: "qwen2.5-vl"

base_url 优先于 provider。Hermes 使用配置的 api_key 进行认证，如果未设置则回退到 OPENAI_API_KEY。它不会将 OPENROUTER_API_KEY 用于自定义端点。

上下文压缩备用

上下文压缩使用 auxiliary.compression 配置块来控制哪个模型和提供商处理摘要：

auxiliary:
  compression:
    provider: "auto"                              # auto | openrouter | nous | main
    model: "google/gemini-3-flash-preview"

旧配置迁移

使用 compression.summary_model / compression.summary_provider / compression.summary_base_url 的旧配置会在首次加载时自动迁移到 auxiliary.compression.*（配置版本 17）。

如果没有可用的压缩提供商，Hermes 会直接丢弃中间对话轮次而不生成摘要，以避免会话失败。

委托提供商覆盖

通过 delegate_task 生成的子代理不使用主备用模型。但是，它们可以被路由到不同的 provider:model 对以优化成本：

delegation:
  provider: "openrouter"                      # 覆盖所有子代理的提供商
  model: "google/gemini-3-flash-preview"      # 覆盖模型
  # base_url: "http://localhost:1234/v1"      # 或使用直接端点
  # api_key: "local-key"

完整配置详情请参阅子代理委托。

Cron 定时任务提供商

Cron 定时任务使用执行时配置的提供商运行。它们不支持备用模型。要为 Cron 定时任务使用不同的提供商，请在定时任务本身上配置 provider 和 model 覆盖：

cronjob(
    action="create",
    schedule="every 2h",
    prompt="检查服务器状态",
    provider="openrouter",
    model="google/gemini-3-flash-preview"
)

完整配置详情请参阅定时任务（Cron）。

总结

功能	备用机制	配置位置
主 Agent 模型	config.yaml 中的 `fallback_model` — 错误时单次故障转移	`fallback_model:`（顶级）
视觉	自动检测链 + 内部 OpenRouter 重试	`auxiliary.vision`
网页提取	自动检测链 + 内部 OpenRouter 重试	`auxiliary.web_extract`
上下文压缩	自动检测链，不可用时降级为无摘要	`auxiliary.compression`
会话搜索	自动检测链	`auxiliary.session_search`
技能中心	自动检测链	`auxiliary.skills_hub`
MCP 辅助	自动检测链	`auxiliary.mcp`
记忆刷新	自动检测链	`auxiliary.flush_memories`
审批分类	自动检测链	`auxiliary.approval`
标题生成	自动检测链	`auxiliary.title_generation`
委托	仅提供商覆盖（无自动备用）	`delegation.provider` / `delegation.model`
Cron 定时任务	仅按任务提供商覆盖（无自动备用）	按任务的 `provider` / `model`

📝 本文由 AI 翻译，如有疑问请参考英文原版

主模型备用​

配置​

支持的提供商​

自定义端点备用​

备用何时触发​

示例​

备用支持的场景​

辅助任务备用​

具有独立提供商解析的任务​

自动检测链​

配置辅助提供商​

辅助任务的提供商选项​

直接端点覆盖​

上下文压缩备用​

委托提供商覆盖​

Cron 定时任务提供商​

总结​