跳到主要内容

工具集参考

工具集(Toolsets)是工具的命名集合,用于控制 Agent 可以执行的操作。它们是按平台、按会话或按任务配置工具可用性的主要机制。

工具集的工作原理

每个工具恰好属于一个工具集。启用某个工具集时,该集合中的所有工具都会对 Agent 可用。工具集分为三种类型:

  • 核心(Core) — 单一逻辑分组的相关工具(例如,file 包含 read_filewrite_filepatchsearch_files
  • 组合(Composite) — 将多个核心工具集组合在一起,用于常见场景(例如,debugging 包含 file、terminal 和 web 工具)
  • 平台(Platform) — 针对特定部署环境的完整工具配置(例如,hermes-cli 是交互式 CLI(命令行界面)会话的默认工具集)

配置工具集

按会话配置(CLI)

hermes chat --toolsets web,file,terminal
hermes chat --toolsets debugging # 组合工具集 — 展开为 file + terminal + web
hermes chat --toolsets all # 启用所有工具

按平台配置(config.yaml)

toolsets:
- hermes-cli # CLI 的默认配置
# - hermes-telegram # Telegram 网关的覆盖配置

交互式管理

hermes tools                            # 基于 curses 的 UI 界面,按平台启用/禁用工具

或者在会话中:

/tools list
/tools disable browser
/tools enable rl

核心工具集

工具集工具用途
browserbrowser_backbrowser_cdpbrowser_clickbrowser_consolebrowser_get_imagesbrowser_navigatebrowser_pressbrowser_scrollbrowser_snapshotbrowser_typebrowser_visionweb_search完整的浏览器自动化。包含 web_search 作为快速查询的备选方案。browser_cdp 是原始 CDP 透传工具,需要可达的 CDP 端点 — 仅在 /browser connect 激活或 browser.cdp_url 已设置时出现。
clarifyclarify当 Agent 需要澄清时向用户提问。
code_executionexecute_code运行以编程方式调用 Hermes 工具的 Python 脚本。
cronjobcronjob调度和管理周期性任务(Cron 定时任务)。
delegationdelegate_task创建隔离的子 Agent 实例以进行并行工作。
feishu_docfeishu_doc_read读取飞书/Lark 文档内容。由飞书文档评论智能回复处理器使用。
feishu_drivefeishu_drive_add_commentfeishu_drive_list_commentsfeishu_drive_list_comment_repliesfeishu_drive_reply_comment飞书/Lark 云文档评论操作。仅限评论 Agent 使用;不在 hermes-cli 或其他消息平台工具集中暴露。
filepatchread_filesearch_fileswrite_file文件读取、写入、搜索和编辑。
homeassistantha_call_serviceha_get_stateha_list_entitiesha_list_services通过 Home Assistant 控制智能家居。仅在设置了 HASS_TOKEN 时可用。
image_genimage_generate通过 FAL.ai 进行文本生成图片。
memorymemory跨会话的持久化记忆管理。
messagingsend_message在会话中向其他平台(Telegram、Discord 等)发送消息。
moamixture_of_agents通过混合智能体(Mixture of Agents)实现多模型共识。
rlrl_check_statusrl_edit_configrl_get_current_configrl_get_resultsrl_list_environmentsrl_list_runsrl_select_environmentrl_start_trainingrl_stop_trainingrl_test_inference强化学习(RL)训练环境管理(Atropos)。
searchweb_search仅网页搜索(不含内容提取)。
session_searchsession_search搜索历史对话会话。
skillsskill_manageskill_viewskills_list技能(Skill)的增删改查和浏览。
terminalprocessterminalShell 命令执行和后台进程管理。
todotodo会话内的任务列表管理。
ttstext_to_speech文本转语音音频生成。
visionvision_analyze通过视觉模型进行图片分析。
webweb_extractweb_search网页搜索和页面内容提取。

组合工具集

这些工具集会展开为多个核心工具集,为常见场景提供便捷的简写方式:

工具集展开为使用场景
debuggingweb + file + processterminal(通过 includes)— 实际包含 patchprocessread_filesearch_filesterminalweb_extractweb_searchwrite_file调试会话 — 文件访问、终端和网页搜索,无需浏览器或任务委派的开销。
safeimage_generatevision_analyzeweb_extractweb_search只读研究和媒体生成。无文件写入、无终端访问、无代码执行。适用于不受信任或受限的环境。

平台工具集

平台工具集定义了部署目标的完整工具配置。大多数消息平台使用与 hermes-cli 相同的工具集:

工具集hermes-cli 的差异
hermes-cli完整工具集 — 包含 clarify 在内的全部 36 个核心工具。交互式 CLI 会话的默认配置。
hermes-acp移除 clarifycronjobimage_generatesend_messagetext_to_speech 和 homeassistant 工具。专注于 IDE 环境中的编码任务。
hermes-api-server移除 clarifysend_messagetext_to_speech。添加其他所有工具 — 适用于无法进行用户交互的编程式访问场景。
hermes-telegramhermes-cli 相同。
hermes-discordhermes-cli 相同。
hermes-slackhermes-cli 相同。
hermes-whatsapphermes-cli 相同。
hermes-signalhermes-cli 相同。
hermes-matrixhermes-cli 相同。
hermes-mattermosthermes-cli 相同。
hermes-emailhermes-cli 相同。
hermes-smshermes-cli 相同。
hermes-bluebubbleshermes-cli 相同。
hermes-dingtalkhermes-cli 相同。
hermes-feishuhermes-cli 相同。注意:feishu_doc / feishu_drive 工具集仅由文档评论处理器使用,不由常规飞书聊天适配器使用。
hermes-qqbothermes-cli 相同。
hermes-wecomhermes-cli 相同。
hermes-wecom-callbackhermes-cli 相同。
hermes-weixinhermes-cli 相同。
hermes-homeassistanthermes-cli 相同,并始终启用 homeassistant 工具集。
hermes-webhookhermes-cli 相同。
hermes-gateway内部网关编排工具集 — 当网关需要接受任意消息来源时,使用最广泛的工具集合的并集。

动态工具集

MCP 服务器工具集

每个已配置的 MCP 服务器会在运行时生成一个 mcp-<server> 工具集。例如,如果你配置了一个 github MCP 服务器,就会创建一个 mcp-github 工具集,包含该服务器暴露的所有工具。

# config.yaml
mcp_servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]

这会创建一个 mcp-github 工具集,你可以在 --toolsets 或平台配置中引用它。

插件工具集

插件可以通过插件初始化期间的 ctx.register_tool() 注册自己的工具集。这些工具集与内置工具集一起出现,可以使用相同的方式启用/禁用。

自定义工具集

config.yaml 中定义自定义工具集,创建项目专用的工具集合:

toolsets:
- hermes-cli
custom_toolsets:
data-science:
- file
- terminal
- code_execution
- web
- vision

通配符

  • all* — 展开为所有已注册的工具集(内置 + 动态 + 插件)

hermes tools 命令的关系

hermes tools 命令提供了一个基于 curses 的 UI 界面,用于按平台启用或禁用单个工具。它在工具级别操作(比工具集更细粒度),并持久化到 config.yaml。即使工具集已启用,被禁用的工具也会被过滤掉。

另见:工具参考,了解各个工具及其参数的完整列表。


📝 本文由 AI 翻译,如有疑问请参考英文原版