Skip to main content

3 posts tagged with "release"

View All Tags

v0.11.0 — Interface 版本

· 7 min read

发布日期: 2026 年 4 月 23 日 自 v0.9.0 以来: 1,556 commits · 761 合并 PR · 1,314 文件变更 · 224,174 行新增 · 29 位社区贡献者(含联作者共 290 位)

Interface 版本 — 交互式 CLI 全面重写为 React/Ink,全新可插拔传输层架构,原生 AWS Bedrock 支持,5 条新推理路径,第 17 个消息平台(QQBot),大幅扩展的插件系统,以及通过 Codex OAuth 支持 GPT-5.5。

本版本同时整合了 v0.10.0 暂缓的所有亮点功能(v0.10.0 仅发布了 Nous Tool Gateway)—— 因此涵盖了约两周的全栈工作。


✨ 亮点功能

🖥️ 全新 Ink 基 TUI

hermes --tui 现已全面重写为 React/Ink CLI,配备 Python JSON-RPC 后端(tui_gateway)。特性包括:粘性编辑器、OSC-52 剪贴板支持的实时流式输出、稳定的选择键、显示每轮耗时和 Git 分支的状态栏、/clear 确认提示、轻量主题预设,以及子 Agent spawn 可观测性覆盖层。约 310 commits 投向 ui-tui/tui_gateway/

🏗️ 传输层抽象 + 原生 AWS Bedrock

格式转换和 HTTP 传输从 run_agent.py 提取为可插拔的 agent/transports/ 层。AnthropicTransportChatCompletionsTransportResponsesApiTransportBedrockTransport 各自负责自己的格式转换和 API 形态。原生的 AWS Bedrock Converse API 支持在此抽象之上构建。

🔮 5 条新推理路径

  • NVIDIA NIM 原生提供商
  • Arcee AI 直连提供商
  • Step Plan 提供商
  • Google Gemini CLI OAuth 推理提供商
  • Vercel ai-gateway 支持(含定价和动态发现)
  • Gemini 经由原生 AI Studio API 路由,性能更佳

🤖 GPT-5.5 via Codex OAuth

OpenAI 全新的 GPT-5.5 推理模型现已通过 ChatGPT Codex OAuth 提供,模型选择器支持实时模型发现,新版 OpenAI 发布后无需更新目录即可使用。

💬 QQBot — 第 17 个支持平台

通过 QQ 官方 API v2 实现原生 QQBot 适配器,支持扫码配置向导、流式光标、emoji 反应和 DM/群组策略隔离,与企业微信/微信功能对等。

🧩 插件系统大幅扩展

插件现在可以:

  • 注册斜杠命令(register_command
  • 直接调度工具(dispatch_tool
  • 阻止工具执行(pre_tool_call 可否决)
  • 重写工具结果(transform_tool_result
  • 转换终端输出(transform_terminal_output
  • 提供图片生成后端
  • 添加自定义仪表盘标签页

内置的磁盘清理插件默认为可选,作为参考实现。

🎯 /steer — 运行中 Agent 引导

/steer <prompt> 在运行中的 Agent 下一次工具调用后注入提示,不中断回合也不破坏提示缓存。适用于需要即时修正 Agent 行为但又不中断工作的场景。

🐚 Shell Hooks

无需编写 Python 插件,即可将任意 Shell 脚本接入 Hermes 生命周期钩子(pre_tool_call、post_tool_call、on_session_start 等)。

📡 Webhook 直传模式

Webhook 订阅现在可以直接将载荷转发到平台聊天,无需经过 Agent —— 实现零 LLM 推送通知,适用于告警、存活检查和事件流。

🧠 更智能的委托

子 Agent 现在拥有明确的 orchestrator 角色,可以自行生成工作器,支持配置 max_spawn_depth(默认扁平)。并发兄弟子 Agent 通过文件协调层共享文件系统状态,避免相互覆盖编辑。

⚙️ 辅助模型 — 可配置 UI + 主模型优先

hermes model 提供专属的"配置辅助模型"界面,支持按任务覆盖(压缩、视觉、session_search、title_generation)。auto 路由现在默认将主模型用于所有用户的辅助任务(此前聚合用户会被静默路由到提供商端的廉价默认值)。

🎨 仪表盘插件系统 + 实时主题切换

Web 仪表盘现已可扩展。第三方插件可以添加自定义标签页、微组件和视图而无需 fork。同时配备实时切换主题系统 —— 主题现在控制颜色、字体、布局和密度,用户可以热切换仪表盘外观而无需重载。

🖥️ 仪表盘完善

i18n(英文+中文)、react-router 侧边栏布局、移动端响应式设计、Vercel 部署、真实的按会话 API 调用追踪,以及一键更新+重启网关按钮。


📊 关键数字

指标数值
自 v0.9.0 以来 Commits1,556
合并 PR761
变更文件1,314
代码新增行224,174
社区贡献者29(含联作者共 290 位)

🏗️ 核心架构

传输层(新增)

  • Transport ABC — 从 run_agent.py 提取格式转换和 HTTP 传输到 agent/transports/
  • AnthropicTransport — Anthropic Messages API 路径
  • ChatCompletionsTransport — OpenAI 兼容提供商的默认路径
  • ResponsesApiTransport — OpenAI Responses API + Codex build_kwargs 接入
  • BedrockTransport — AWS Bedrock Converse API 传输

提供商 & 模型支持

  • 原生 AWS Bedrock 提供商(via Converse API)
  • NVIDIA NIM 原生提供商
  • Arcee AI 直连提供商
  • Step Plan 提供商
  • Google Gemini CLI OAuth 推理提供商
  • Vercel ai-gateway(含定价、归属和动态发现)
  • GPT-5.5 via Codex OAuth(模型选择器实时发现)
  • Gemini 经由原生 AI Studio API
  • xAI Grok 升级至 Responses API
  • Kimi K2.6(OpenRouter、Nous Portal、原生 Kimi、HuggingFace)
  • Kimi K2.5 提升至所有模型建议列表首位
  • 小米 MiMo v2.5-pro + v2.5(OpenRouter、Nous Portal、原生)
  • Claude Opus 4.7(Nous Portal 目录)
  • Per-provider + per-model request_timeout_seconds 配置
  • 可配置 API 重试次数agent.api_max_retries

Agent 循环与会话

  • /steer <prompt> — 运行中 Agent 引导
  • Orchestrator 角色 + 可配置 spawn 深度(默认扁平)
  • 跨 Agent 文件状态协调
  • 压缩摘要支持对话语言
  • 自动继续被网关重启中断的 Agent 工作
  • /stop 不再重置会话
  • 自动清理旧会话 + 启动时 VACUUM state.db

工具系统

  • register_command() — 插件可添加斜杠命令
  • dispatch_tool() — 插件可直接调用工具
  • pre_tool_call 阻止 — 插件可否决工具执行
  • transform_tool_result — 插件可重写工具结果
  • transform_terminal_output — 插件可转换终端输出
  • Shell Hooks — 用 Shell 脚本作为钩子回调
  • browser_cdp 原始 DevTools Protocol 直通
  • Webhook 直传模式 — 零 LLM 推送通知
  • Cron wakeAgent 门控 — 脚本可完全跳过 Agent
  • Cron per-job enabled_toolsets — 控制 token 开销

消息平台(网关)

  • QQBot(第 17 个平台) — QQ 官方 API v2,支持扫码设置、流式输出、包分流
  • Telegram — 专用代理变量、忽略线程配置、禁用链接预览选项
  • Discord — 论坛频道支持、DISCORD_ALLOWED_ROLES 角色访问控制、禁用斜杠命令选项、原生 send_animation
  • 飞书 — 文档评论智能回复(3 层访问控制)、处理状态反应
  • 钉钉require_mention + allowed_users 门控、AI 卡片流式输出、emoji 反应
  • WhatsApp — 原生音频消息发送(send_voice
  • 企业微信 — 扫码创建 Bot + 交互式设置向导
  • Signal — 媒体发送支持
  • Slack — DM 默认按线程会话

Web 仪表盘

  • i18n(中英文切换)
  • 实时主题切换系统
  • 插件系统 — 可扩展自定义标签页
  • react-router 侧边栏布局
  • 移动端响应式
  • Vercel 部署
  • 按会话真实 API 调用计数
  • 一键更新 + 重启网关按钮

CLI & 用户体验

  • bash/zsh/fish 动态 Shell 自动补全
  • 轻量模式皮肤 + 皮肤感知补全菜单
  • --ignore-user-config--ignore-rules 标志
  • /usage 显示账户限额
  • hermes doctor 命令安装检查

安全与可靠性

  • 允许私有/内部 URL 解析的全局开关
  • 阻止 Agent 通过终端自毁网关
  • Telegram 更新提示的回调授权
  • 完整 ASCII-locale UnicodeEncodeError 恢复

👥 贡献者

核心团队

  • @teknium1 (Teknium)

顶级社区贡献者(按合并 PR 数量)

  • @kshitijk4poor — 49 PRs · 传输层重构(AnthropicTransport、ResponsesApiTransport)、Step Plan 提供商、小米 MiMo v2.5 支持
  • @OutThisLife (Brooklyn) — 31 PRs · TUI 完善、Git 分支状态栏、每轮耗时、稳定选择键
  • @helix4u — 11 PRs · 语音 CLI 录音提示音、MCP 工具中断处理
  • @austinpickett — 8 PRs · 仪表盘 react-router + 侧边栏 + Vercel 部署
  • @alt-glitch — 8 PRs · Matrix/Mattermost/飞书 PLATFORM_HINTS
  • @austinpickett + @DeployFaith — 仪表盘移动端响应式

感谢 290 位(含联作者)贡献者的辛勤付出!


完整变更v2026.4.13...v2026.4.23

v0.10.0 — Tool Gateway 发布

· 2 min read

发布日期: 2026 年 4 月 16 日

Tool Gateway 版本 — 付费 Nous Portal 订阅用户现在可以通过现有订阅直接使用网页搜索、AI 生图、语音合成和浏览器自动化,无需额外配置任何 API Key。


✨ 亮点功能

Nous Tool Gateway

付费 Nous Portal 订阅用户现在可以自动获得以下工具的使用权限:

工具服务商说明
网页搜索Firecrawl搜索互联网获取实时信息
AI 生图FAL / FLUX 2 Pro根据文字描述生成图片
语音合成OpenAI TTS将文字转换为自然语音
浏览器自动化Browser Use自动操控浏览器完成网页任务

零配置上手: 不再需要单独申请 API Key,只需运行 hermes model,选择 Nous Portal,然后挑选要启用的工具即可。

灵活可控: 每个工具都可通过 use_gateway 配置独立开关,hermes toolshermes status 命令完整支持网关工具的管理与状态查看。当同时存在直连 API Key 和网关时,运行时会优先使用网关。

替代旧方案: 新的订阅检测机制取代了之前的隐藏环境变量 HERMES_ENABLE_NOUS_MANAGED_TOOLS,更加清晰直观。

相关 PR:#11206,文档更新:#11208


🐛 修复与改进

本版本包含 180+ commits,涵盖 Agent 核心、网关、CLI 和工具系统的多项 Bug 修复、平台改进和可靠性提升。完整变更日志将在 v0.11.0 版本中发布。


👥 贡献者

  • @jquesnelle (emozilla) — Tool Gateway 原始实现(#10799),本版本基于其工作进行修复和发布

完整变更v2026.4.13...v2026.4.16

v0.9.0 — 无处不在的 Hermes

· 3 min read

发布日期: 2026 年 4 月 13 日 自 v0.8.0 以来: 487 commits · 269 合并 PR · 167 已解决 Issue · 493 文件变更 · 63,281 行新增 · 24 位贡献者

"Everywhere" 版本 — Hermes 登陆手机端(Termux/Android),新增 iMessage 和微信支持,上线 Fast Mode,引入后台进程监控,发布本地 Web 仪表盘,并完成了史上最深度的安全加固。


✨ 亮点功能

🖥️ 本地 Web 仪表盘

全新的浏览器端管理界面,无需触碰配置文件或终端即可:

  • 配置 Agent 设置
  • 监控会话状态
  • 浏览和管理 Skill
  • 管理网关连接

这是体验 Hermes 最简单的方式。

⚡ Fast Mode(/fast

为 OpenAI 和 Anthropic 模型提供优先处理通道。输入 /fast 即可通过优先队列显著降低延迟,支持 GPT-5.4、Codex、Claude 等模型。

💬 iMessage(BlueBubbles)

完整的 iMessage 集成,将 Hermes 带入 Apple 消息生态。支持自动 Webhook 注册、设置向导和崩溃恢复。

🟢 微信 & 企业微信

  • 微信:通过 iLink Bot API 实现原生支持,支持流式输出、媒体上传、Markdown 链接处理
  • 企业微信回调模式:适配自建企业应用,支持原子化状态持久化

Hermes 现已完整覆盖中文消息生态。

📱 Termux / Android 支持

在 Android 手机上通过 Termux 原生运行 Hermes,适配安装路径、移动端 TUI 优化、语音后端支持,/image 命令可在设备端运行。

🔔 后台进程监控(watch_patterns

设置输出模式匹配规则,匹配时实时通知。可监控错误、等待特定事件(如 "listening on port")或追踪构建日志——无需轮询。

🤖 原生 xAI & 小米 MiMo 提供商

xAI(Grok)和小米 MiMo 成为一级提供商,支持直连 API 访问、模型目录和设置向导集成。

🧩 可插拔上下文引擎

通过 hermes plugins 切换上下文管理引擎——自定义过滤、摘要或注入领域特定上下文。

🌐 统一代理支持

SOCKS 代理、DISCORD_PROXY 和系统代理自动检测,跨所有网关平台生效。企业防火墙后的 Hermes 开箱即用。

🔒 全面安全加固

路径遍历防护、Shell 注入中和、SSRF 重定向防护、Twilio Webhook 签名验证(修复 SMS RCE)、API 服务器认证强制执行、Git 参数注入防护等。

💾 hermes backup & hermes import

完整的配置备份与恢复——迁移到新机器或在重大变更前创建快照。

🏗️ 16 个支持平台

随着 BlueBubbles(iMessage)和微信的加入,Hermes 现已支持 16 个消息平台:Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Email、SMS、钉钉、飞书、企业微信、Mattermost、Home Assistant、Webhooks、iMessage、微信。


📊 关键数字

指标数值
Commits487
合并 PR269
已解决 Issue167
变更文件493
代码新增行63,281
贡献者24

👥 社区贡献者

感谢 24 位贡献者,特别是社区贡献者 @alt-glitch(6 PR)、@SHL0MS(2 PR)、@sprmn24(2 PR)等。


完整变更v2026.4.8...v2026.4.13