跳到主要内容

1 篇博文 含有标签「bedrock」

查看所有标签

v0.11.0 — Interface 版本

· 阅读需 7 分钟

发布日期: 2026 年 4 月 23 日 自 v0.9.0 以来: 1,556 commits · 761 合并 PR · 1,314 文件变更 · 224,174 行新增 · 29 位社区贡献者(含联作者共 290 位)

Interface 版本 — 交互式 CLI 全面重写为 React/Ink,全新可插拔传输层架构,原生 AWS Bedrock 支持,5 条新推理路径,第 17 个消息平台(QQBot),大幅扩展的插件系统,以及通过 Codex OAuth 支持 GPT-5.5。

本版本同时整合了 v0.10.0 暂缓的所有亮点功能(v0.10.0 仅发布了 Nous Tool Gateway)—— 因此涵盖了约两周的全栈工作。


✨ 亮点功能

🖥️ 全新 Ink 基 TUI

hermes --tui 现已全面重写为 React/Ink CLI,配备 Python JSON-RPC 后端(tui_gateway)。特性包括:粘性编辑器、OSC-52 剪贴板支持的实时流式输出、稳定的选择键、显示每轮耗时和 Git 分支的状态栏、/clear 确认提示、轻量主题预设,以及子 Agent spawn 可观测性覆盖层。约 310 commits 投向 ui-tui/tui_gateway/

🏗️ 传输层抽象 + 原生 AWS Bedrock

格式转换和 HTTP 传输从 run_agent.py 提取为可插拔的 agent/transports/ 层。AnthropicTransportChatCompletionsTransportResponsesApiTransportBedrockTransport 各自负责自己的格式转换和 API 形态。原生的 AWS Bedrock Converse API 支持在此抽象之上构建。

🔮 5 条新推理路径

  • NVIDIA NIM 原生提供商
  • Arcee AI 直连提供商
  • Step Plan 提供商
  • Google Gemini CLI OAuth 推理提供商
  • Vercel ai-gateway 支持(含定价和动态发现)
  • Gemini 经由原生 AI Studio API 路由,性能更佳

🤖 GPT-5.5 via Codex OAuth

OpenAI 全新的 GPT-5.5 推理模型现已通过 ChatGPT Codex OAuth 提供,模型选择器支持实时模型发现,新版 OpenAI 发布后无需更新目录即可使用。

💬 QQBot — 第 17 个支持平台

通过 QQ 官方 API v2 实现原生 QQBot 适配器,支持扫码配置向导、流式光标、emoji 反应和 DM/群组策略隔离,与企业微信/微信功能对等。

🧩 插件系统大幅扩展

插件现在可以:

  • 注册斜杠命令(register_command
  • 直接调度工具(dispatch_tool
  • 阻止工具执行(pre_tool_call 可否决)
  • 重写工具结果(transform_tool_result
  • 转换终端输出(transform_terminal_output
  • 提供图片生成后端
  • 添加自定义仪表盘标签页

内置的磁盘清理插件默认为可选,作为参考实现。

🎯 /steer — 运行中 Agent 引导

/steer <prompt> 在运行中的 Agent 下一次工具调用后注入提示,不中断回合也不破坏提示缓存。适用于需要即时修正 Agent 行为但又不中断工作的场景。

🐚 Shell Hooks

无需编写 Python 插件,即可将任意 Shell 脚本接入 Hermes 生命周期钩子(pre_tool_call、post_tool_call、on_session_start 等)。

📡 Webhook 直传模式

Webhook 订阅现在可以直接将载荷转发到平台聊天,无需经过 Agent —— 实现零 LLM 推送通知,适用于告警、存活检查和事件流。

🧠 更智能的委托

子 Agent 现在拥有明确的 orchestrator 角色,可以自行生成工作器,支持配置 max_spawn_depth(默认扁平)。并发兄弟子 Agent 通过文件协调层共享文件系统状态,避免相互覆盖编辑。

⚙️ 辅助模型 — 可配置 UI + 主模型优先

hermes model 提供专属的"配置辅助模型"界面,支持按任务覆盖(压缩、视觉、session_search、title_generation)。auto 路由现在默认将主模型用于所有用户的辅助任务(此前聚合用户会被静默路由到提供商端的廉价默认值)。

🎨 仪表盘插件系统 + 实时主题切换

Web 仪表盘现已可扩展。第三方插件可以添加自定义标签页、微组件和视图而无需 fork。同时配备实时切换主题系统 —— 主题现在控制颜色、字体、布局和密度,用户可以热切换仪表盘外观而无需重载。

🖥️ 仪表盘完善

i18n(英文+中文)、react-router 侧边栏布局、移动端响应式设计、Vercel 部署、真实的按会话 API 调用追踪,以及一键更新+重启网关按钮。


📊 关键数字

指标数值
自 v0.9.0 以来 Commits1,556
合并 PR761
变更文件1,314
代码新增行224,174
社区贡献者29(含联作者共 290 位)

🏗️ 核心架构

传输层(新增)

  • Transport ABC — 从 run_agent.py 提取格式转换和 HTTP 传输到 agent/transports/
  • AnthropicTransport — Anthropic Messages API 路径
  • ChatCompletionsTransport — OpenAI 兼容提供商的默认路径
  • ResponsesApiTransport — OpenAI Responses API + Codex build_kwargs 接入
  • BedrockTransport — AWS Bedrock Converse API 传输

提供商 & 模型支持

  • 原生 AWS Bedrock 提供商(via Converse API)
  • NVIDIA NIM 原生提供商
  • Arcee AI 直连提供商
  • Step Plan 提供商
  • Google Gemini CLI OAuth 推理提供商
  • Vercel ai-gateway(含定价、归属和动态发现)
  • GPT-5.5 via Codex OAuth(模型选择器实时发现)
  • Gemini 经由原生 AI Studio API
  • xAI Grok 升级至 Responses API
  • Kimi K2.6(OpenRouter、Nous Portal、原生 Kimi、HuggingFace)
  • Kimi K2.5 提升至所有模型建议列表首位
  • 小米 MiMo v2.5-pro + v2.5(OpenRouter、Nous Portal、原生)
  • Claude Opus 4.7(Nous Portal 目录)
  • Per-provider + per-model request_timeout_seconds 配置
  • 可配置 API 重试次数agent.api_max_retries

Agent 循环与会话

  • /steer <prompt> — 运行中 Agent 引导
  • Orchestrator 角色 + 可配置 spawn 深度(默认扁平)
  • 跨 Agent 文件状态协调
  • 压缩摘要支持对话语言
  • 自动继续被网关重启中断的 Agent 工作
  • /stop 不再重置会话
  • 自动清理旧会话 + 启动时 VACUUM state.db

工具系统

  • register_command() — 插件可添加斜杠命令
  • dispatch_tool() — 插件可直接调用工具
  • pre_tool_call 阻止 — 插件可否决工具执行
  • transform_tool_result — 插件可重写工具结果
  • transform_terminal_output — 插件可转换终端输出
  • Shell Hooks — 用 Shell 脚本作为钩子回调
  • browser_cdp 原始 DevTools Protocol 直通
  • Webhook 直传模式 — 零 LLM 推送通知
  • Cron wakeAgent 门控 — 脚本可完全跳过 Agent
  • Cron per-job enabled_toolsets — 控制 token 开销

消息平台(网关)

  • QQBot(第 17 个平台) — QQ 官方 API v2,支持扫码设置、流式输出、包分流
  • Telegram — 专用代理变量、忽略线程配置、禁用链接预览选项
  • Discord — 论坛频道支持、DISCORD_ALLOWED_ROLES 角色访问控制、禁用斜杠命令选项、原生 send_animation
  • 飞书 — 文档评论智能回复(3 层访问控制)、处理状态反应
  • 钉钉require_mention + allowed_users 门控、AI 卡片流式输出、emoji 反应
  • WhatsApp — 原生音频消息发送(send_voice
  • 企业微信 — 扫码创建 Bot + 交互式设置向导
  • Signal — 媒体发送支持
  • Slack — DM 默认按线程会话

Web 仪表盘

  • i18n(中英文切换)
  • 实时主题切换系统
  • 插件系统 — 可扩展自定义标签页
  • react-router 侧边栏布局
  • 移动端响应式
  • Vercel 部署
  • 按会话真实 API 调用计数
  • 一键更新 + 重启网关按钮

CLI & 用户体验

  • bash/zsh/fish 动态 Shell 自动补全
  • 轻量模式皮肤 + 皮肤感知补全菜单
  • --ignore-user-config--ignore-rules 标志
  • /usage 显示账户限额
  • hermes doctor 命令安装检查

安全与可靠性

  • 允许私有/内部 URL 解析的全局开关
  • 阻止 Agent 通过终端自毁网关
  • Telegram 更新提示的回调授权
  • 完整 ASCII-locale UnicodeEncodeError 恢复

👥 贡献者

核心团队

  • @teknium1 (Teknium)

顶级社区贡献者(按合并 PR 数量)

  • @kshitijk4poor — 49 PRs · 传输层重构(AnthropicTransport、ResponsesApiTransport)、Step Plan 提供商、小米 MiMo v2.5 支持
  • @OutThisLife (Brooklyn) — 31 PRs · TUI 完善、Git 分支状态栏、每轮耗时、稳定选择键
  • @helix4u — 11 PRs · 语音 CLI 录音提示音、MCP 工具中断处理
  • @austinpickett — 8 PRs · 仪表盘 react-router + 侧边栏 + Vercel 部署
  • @alt-glitch — 8 PRs · Matrix/Mattermost/飞书 PLATFORM_HINTS
  • @austinpickett + @DeployFaith — 仪表盘移动端响应式

感谢 290 位(含联作者)贡献者的辛勤付出!


完整变更v2026.4.13...v2026.4.23