AWS Bedrock
Hermes Agent 使用 Converse API 原生支持 Amazon Bedrock — 而非 OpenAI 兼容端点。这使你可以完全访问 Bedrock 生态系统:IAM 认证、Guardrails(防护栏)、跨区域推理 Profile 和所有基础模型。
前提条件
- AWS 凭据 — boto3 凭据链支持的任何来源:
- IAM 实例角色(EC2、ECS、Lambda — 零配置)
AWS_ACCESS_KEY_ID+AWS_SECRET_ACCESS_KEY环境变量AWS_PROFILE用于 SSO 或命名 Profileaws configure用于本地开发
- boto3 — 使用
pip install hermes-agent[bedrock]安装 - IAM 权限 — 至少:
bedrock:InvokeModel和bedrock:InvokeModelWithResponseStream(用于推理)bedrock:ListFoundationModels和bedrock:ListInferenceProfiles(用于模型发现)
在 AWS 计算实例上,附加一个带 AmazonBedrockFullAccess 的 IAM 角色即可。无需 API Key、无需 .env 配置 — Hermes 自动检测实例角色。
快速开始
# 安装 Bedrock 支持
pip install hermes-agent[bedrock]
# 选择 Bedrock 作为你的 Provider
hermes model
# → 选择 "More providers..." → "AWS Bedrock"
# → 选择你的区域和模型
# 开始聊天
hermes chat
配置
运行 hermes model 后,你的 ~/.hermes/config.yaml 将包含:
model:
default: us.anthropic.claude-sonnet-4-6
provider: bedrock
base_url: https://bedrock-runtime.us-east-2.amazonaws.com
bedrock:
region: us-east-2
区域
通过以下方式设置 AWS 区域(优先级从高到低):
config.yaml中的bedrock.regionAWS_REGION环境变量AWS_DEFAULT_REGION环境变量- 默认:
us-east-1
Guardrails
要将 Amazon Bedrock Guardrails 应用于所有模型调用:
bedrock:
region: us-east-2
guardrail:
guardrail_identifier: "abc123def456" # 来自 Bedrock 控制台
guardrail_version: "1" # 版本号或 "DRAFT"
stream_processing_mode: "async" # "sync" 或 "async"
trace: "disabled" # "enabled"、"disabled" 或 "enabled_full"
模型发现
Hermes 通过 Bedrock 控制平面自动发现可用模型。你可以自定义发现:
bedrock:
discovery:
enabled: true
provider_filter: ["anthropic", "amazon"] # 仅显示这些 Provider
refresh_interval: 3600 # 缓存 1 小时
可用模型
Bedrock 模型使用推理 Profile ID 进行按需调用。hermes model 选择器自动显示这些模型,推荐模型在顶部:
| 模型 | ID | 说明 |
|---|---|---|
| Claude Sonnet 4.6 | us.anthropic.claude-sonnet-4-6 | 推荐 — 速度与能力的最佳平衡 |
| Claude Opus 4.6 | us.anthropic.claude-opus-4-6-v1 | 最强能力 |
| Claude Haiku 4.5 | us.anthropic.claude-haiku-4-5-20251001-v1:0 | 最快的 Claude |
| Amazon Nova Pro | us.amazon.nova-pro-v1:0 | Amazon 旗舰模型 |
| Amazon Nova Micro | us.amazon.nova-micro-v1:0 | 最快、最便宜 |
| DeepSeek V3.2 | deepseek.v3.2 | 强大的开源模型 |
| Llama 4 Scout 17B | us.meta.llama4-scout-17b-instruct-v1:0 | Meta 最新模型 |
前缀为 us. 的模型使用跨区域推理 Profile,提供更好的容量和跨 AWS 区域的自动故障转移。前缀为 global. 的模型在全球所有可用区域间路由。
会话中切换模型
在对话中使用 /model 命令:
/model us.amazon.nova-pro-v1:0
/model deepseek.v3.2
/model us.anthropic.claude-opus-4-6-v1
诊断
hermes doctor
Doctor 检查:
- AWS 凭据是否可用(环境变量、IAM 角色、SSO)
boto3是否已安装- Bedrock API 是否可达(ListFoundationModels)
- 你所在区域的可用模型数量
网关(消息平台)
Bedrock 适用于所有 Hermes 网关平台(Telegram、Discord、Slack、飞书等)。将 Bedrock 配置为你的 Provider,然后正常启动网关:
hermes gateway setup
hermes gateway start
网关读取 config.yaml 并使用相同的 Bedrock Provider 配置。
故障排除
"No API key found" / "No AWS credentials"
Hermes 按此顺序检查凭据:
AWS_BEARER_TOKEN_BEDROCKAWS_ACCESS_KEY_ID+AWS_SECRET_ACCESS_KEYAWS_PROFILE- EC2 实例元数据(IMDS)
- ECS 容器凭据
- Lambda 执行角色
如果都未找到,运行 aws configure 或为你的计算实例附加 IAM 角色。
"Invocation of model ID ... with on-demand throughput isn't supported"
使用推理 Profile ID(带 us. 或 global. 前缀)而非裸基础模型 ID。例如:
- ❌
anthropic.claude-sonnet-4-6 - ✅
us.anthropic.claude-sonnet-4-6
"ThrottlingException"
你已达到 Bedrock 每模型速率限制。Hermes 自动带退避重试。要提高限制,在 AWS Service Quotas 控制台 请求配额增加。
📝 本文由 AI 翻译,如有疑问请参考英文原版