跳到主要内容

AWS Bedrock

Hermes Agent 使用 Converse API 原生支持 Amazon Bedrock — 而非 OpenAI 兼容端点。这使你可以完全访问 Bedrock 生态系统:IAM 认证、Guardrails(防护栏)、跨区域推理 Profile 和所有基础模型。

前提条件

  • AWS 凭据boto3 凭据链支持的任何来源:
    • IAM 实例角色(EC2、ECS、Lambda — 零配置)
    • AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY 环境变量
    • AWS_PROFILE 用于 SSO 或命名 Profile
    • aws configure 用于本地开发
  • boto3 — 使用 pip install hermes-agent[bedrock] 安装
  • IAM 权限 — 至少:
    • bedrock:InvokeModelbedrock:InvokeModelWithResponseStream(用于推理)
    • bedrock:ListFoundationModelsbedrock:ListInferenceProfiles(用于模型发现)
EC2 / ECS / Lambda

在 AWS 计算实例上,附加一个带 AmazonBedrockFullAccess 的 IAM 角色即可。无需 API Key、无需 .env 配置 — Hermes 自动检测实例角色。

快速开始

# 安装 Bedrock 支持
pip install hermes-agent[bedrock]

# 选择 Bedrock 作为你的 Provider
hermes model
# → 选择 "More providers..." → "AWS Bedrock"
# → 选择你的区域和模型

# 开始聊天
hermes chat

配置

运行 hermes model 后,你的 ~/.hermes/config.yaml 将包含:

model:
default: us.anthropic.claude-sonnet-4-6
provider: bedrock
base_url: https://bedrock-runtime.us-east-2.amazonaws.com

bedrock:
region: us-east-2

区域

通过以下方式设置 AWS 区域(优先级从高到低):

  1. config.yaml 中的 bedrock.region
  2. AWS_REGION 环境变量
  3. AWS_DEFAULT_REGION 环境变量
  4. 默认:us-east-1

Guardrails

要将 Amazon Bedrock Guardrails 应用于所有模型调用:

bedrock:
region: us-east-2
guardrail:
guardrail_identifier: "abc123def456" # 来自 Bedrock 控制台
guardrail_version: "1" # 版本号或 "DRAFT"
stream_processing_mode: "async" # "sync" 或 "async"
trace: "disabled" # "enabled"、"disabled" 或 "enabled_full"

模型发现

Hermes 通过 Bedrock 控制平面自动发现可用模型。你可以自定义发现:

bedrock:
discovery:
enabled: true
provider_filter: ["anthropic", "amazon"] # 仅显示这些 Provider
refresh_interval: 3600 # 缓存 1 小时

可用模型

Bedrock 模型使用推理 Profile ID 进行按需调用。hermes model 选择器自动显示这些模型,推荐模型在顶部:

模型ID说明
Claude Sonnet 4.6us.anthropic.claude-sonnet-4-6推荐 — 速度与能力的最佳平衡
Claude Opus 4.6us.anthropic.claude-opus-4-6-v1最强能力
Claude Haiku 4.5us.anthropic.claude-haiku-4-5-20251001-v1:0最快的 Claude
Amazon Nova Prous.amazon.nova-pro-v1:0Amazon 旗舰模型
Amazon Nova Microus.amazon.nova-micro-v1:0最快、最便宜
DeepSeek V3.2deepseek.v3.2强大的开源模型
Llama 4 Scout 17Bus.meta.llama4-scout-17b-instruct-v1:0Meta 最新模型
跨区域推理

前缀为 us. 的模型使用跨区域推理 Profile,提供更好的容量和跨 AWS 区域的自动故障转移。前缀为 global. 的模型在全球所有可用区域间路由。

会话中切换模型

在对话中使用 /model 命令:

/model us.amazon.nova-pro-v1:0
/model deepseek.v3.2
/model us.anthropic.claude-opus-4-6-v1

诊断

hermes doctor

Doctor 检查:

  • AWS 凭据是否可用(环境变量、IAM 角色、SSO)
  • boto3 是否已安装
  • Bedrock API 是否可达(ListFoundationModels)
  • 你所在区域的可用模型数量

网关(消息平台)

Bedrock 适用于所有 Hermes 网关平台(Telegram、Discord、Slack、飞书等)。将 Bedrock 配置为你的 Provider,然后正常启动网关:

hermes gateway setup
hermes gateway start

网关读取 config.yaml 并使用相同的 Bedrock Provider 配置。

故障排除

"No API key found" / "No AWS credentials"

Hermes 按此顺序检查凭据:

  1. AWS_BEARER_TOKEN_BEDROCK
  2. AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY
  3. AWS_PROFILE
  4. EC2 实例元数据(IMDS)
  5. ECS 容器凭据
  6. Lambda 执行角色

如果都未找到,运行 aws configure 或为你的计算实例附加 IAM 角色。

"Invocation of model ID ... with on-demand throughput isn't supported"

使用推理 Profile ID(带 us.global. 前缀)而非裸基础模型 ID。例如:

  • anthropic.claude-sonnet-4-6
  • us.anthropic.claude-sonnet-4-6

"ThrottlingException"

你已达到 Bedrock 每模型速率限制。Hermes 自动带退避重试。要提高限制,在 AWS Service Quotas 控制台 请求配额增加。


📝 本文由 AI 翻译,如有疑问请参考英文原版