← 全部文章

指南

AI Helper 的智能体式工具调用工作流详解

一个只用文字回答的聊天界面是有用的。一个能检查页面、把代码写进实时 TEMP 窗口、并为你保存一条完成的规则的聊天界面则是另一回事。AI Helper 通过智能体式工具调用工作流做到第二件事。下面是它的工作原理。

这里的「智能体式」是什么意思

当你发送一条消息时,模型不必一次性给出回答。它可以判断自己需要信息 —— 调用一个工具来获取它 —— 读取结果,然后继续。这种「思考 → 行动 → 观察 → 思考」的循环就是智能体循环。在 AI Helper 中,这个循环每轮最多运行 8 步,然后模型必须给你一个最终答案。这个上限让一轮保持有界且可预测。

工具协议

每家提供商都有自己原生的函数调用格式,而且它们互不匹配。为了避免三条独立的代码路径,AI Helper 使用一种与提供商无关的文本协议。模型把工具调用作为一个带标记的块发出:

@@JZ_TOOL@@ {"tool": "query_page", "args": {"selector": ".cookie-banner"}} @@END@@

扩展解析那个块,运行工具,并把结果反馈回对话,让模型可以继续。因为它只是文本,完全相同的提示词和解析逻辑在 OpenAI、Anthropic 和 Gemini 上工作方式完全一致 —— 在聊天中途切换提供商,工作流不会改变。

这些工具

AI Helper 暴露了一组小而专注的工具。它们分为三组。

检查

实时测试

持久化(需要你的确认)

这三个中的每一个都需要一次单独的、明确的用户确认。模型不能悄悄地写进你的库 —— 每一个文件夹、每一个分组、每一条规则都是你深思熟虑后给出的「是」。创建动作或动作栏不属于此阶段;这些工具涵盖的是文件夹、分组以及带 CSS 和 JS 的规则。

系统提示词驱动的工作流

这些工具只是故事的一半 —— 系统提示词告诉模型如何按顺序使用它们:

  1. 询问细节 —— 在动任何东西之前澄清你真正想要什么。
  2. 检查页面 —— 用 query_page 确认真实结构,而不是猜测。
  3. 在 TEMP 窗口中测试 —— 打开一个面板,设置代码,让你实时看到它。
  4. 请你验证 —— 「现在页面看起来对吗?」
  5. 只有在你同意后才持久化 —— 而且只有此时才调用一个 create 工具,并附带它自己的确认。

这正是一个谨慎的人会走的路径:先看,再测,最后保存。

一轮,逐步拆解

一轮:「让评论区可折叠」

step 1  query_page    .comments        -> 1 个匹配,返回 HTML
step 2  open_temp_pane  css            -> TEMP CSS 窗口打开
step 3  set_temp_pane_code  ...        -> 折叠 CSS 实时注入
step 4  (文字)「我加了一个折叠开关 - 看看页面。」
        --- 模型停止,等待你 ---
你:「不错,保存它」
step 5  list_structure                 -> 读取你的文件夹/id
step 6  create_rule  (确认?)           -> 你点击确认 -> 已保存

用掉了六步,预算里还剩两步。如果一轮真的撞上了 8 步上限,模型会用手头已有的东西收尾,并告诉你事情进展到哪里。

工具调用芯片

你永远不必猜模型做了什么。每一次工具调用及其结果都会在聊天窗口里渲染为一个芯片 —— 一张紧凑的卡片,显示工具名称、它的参数,以及返回内容的摘要。滚动对话,你就能审计整一轮:查询了哪个选择器、什么代码进了哪个面板、创建了哪条规则。

为什么文本协议对你很重要

与提供商无关的工具机制不只是一个实现细节。它意味着你可以出于成本或质量的原因挑选一家提供商,而智能体能力是相同的。没有「工具调用只在提供商 X 上可用」这类附加说明。在聊天窗口里中途切换并继续下去。

另请参阅

智能体式工作流今天已内置于 AI Helper。下载 JustZix,添加一个 API 密钥,让它构建点什么 —— 然后看那些芯片。

为这篇文章评分

暂无评分 — 成为第一个。

自己动手试试

安装 JustZix,粘贴本文中的任意代码片段。两分钟,从零到一条在你所有设备上生效的规则。

获取 JustZix

功能 · 工作原理 · 示例 · 应用场景