ask_followup_question
ask_followup_question 工具通过提出特定问题来收集完成任务所需的信息,从而实现交互式通信。
参数
该工具接受以下参数:
question(必需):需要向用户提出的具体问题follow_up(可选):2-4 个建议答案列表,用于引导用户回答,每个答案包含在<suggest>标签中
功能说明
该工具在 Roo 和用户之间创建了一个对话界面,允许在遇到模糊性或决策点时收集澄清信息、额外细节或用户偏好。每个问题都可以包含建议答案,以简化交互过程。
使用场景
- 当原始请求中缺少关键信息时
- 当 Roo 需要在多个有效的实现方法之间做出选择时
- 当需要技术细节或偏好以继续进行时
- 当 Roo 遇到需要解决的模糊性时
- 当额外的上下文信息能显著提高解决方案质量时
主要特性
- 提供了一种结构化的方式来收集特定信息,而不会中断工作流程
- 包含建议答案,减少用户输入并引导回答
- 维护对话历史和上下文
- 支持包含图像和代码片段的响应
- 作为“始终可用”工具集的一部分,在所有模式中都可用
- 支持用户对实现决策的直接指导
- 使用
<answer>标签格式化响应,以区别于常规对话 - 成功使用时会重置连续错误计数器
局限性
- 每次工具使用仅限于提出一个具体问题
- 建议作为 UI 中的可选选项显示
- 无法强制结构化响应——用户仍可以自由回答
- 过度使用会减慢任务完成速度,造成碎片化体验
- 建议答案必须完整,不能包含需要用户编辑的占位符
- 没有内置的用户响应验证机制
- 没有强制特定答案格式的机制
工作原理
当调用 ask_followup_question 工具时,它遵循以下流程:
-
参数验证:验证必需的
question参数并检查可选建议- 确保提供了问题文本
- 使用
fast-xml-parser库从follow_up参数解析建议答案 - 将建议标准化为数组格式,即使只有一个建议
-
JSON 转换:将 XML 结构转换为标准化的 JSON 格式以供 UI 显示
{
question: "用户的问题",
suggest: [
{ answer: "建议 1" },
{ answer: "建议 2" }
]
} -
UI 集成:
- 通过
ask("followup", ...)方法将 JSON 结构传递给 UI 层 - 在界面中向用户显示可选择的建议按钮
- 创建交互式体验以选择或输入响应
- 通过
-
响应收集和处理:
- 捕获用户文本输入和响应中包含的任何图像
- 在返回助手时用
<answer>标签包装用户响应 - 保留用户响应中包含的图像
- 通过将响应添加到历史记录来维护对话上下文
- 成功使用工具时重置连续错误计数器
-
错误处理:
- 使用计数器跟踪连续错误
- 成功使用工具时重置计数器
- 提供特定错误消息:
- 缺少必需参数时:"缺少必需参数 'question'"
- XML 解析失败时:"解析操作失败:[错误消息]"
- 格式无效时:"操作 XML 格式无效"
- 包含防止在缺少必需参数时执行工具的安全措施
- 发生错误时增加连续错误计数
工作流程序列
问答循环遵循以下序列:
- 信息缺口识别:Roo 识别需要继续的缺失信息
- 具体问题创建:Roo 制定一个清晰、有针对性的问题
- 建议开发:Roo 创建相关的建议答案(可选但推荐)
- 工具调用:助手使用问题和可选建议调用工具
- UI 呈现:问题和建议作为交互元素显示给用户
- 用户响应:用户选择建议或提供自定义答案
- 消息处理:系统处理部分和完整消息
- 对于流式响应,逐块处理到达的内容
- 对于完整消息,一次性处理整个响应
- 无论消息分块如何,都保持状态一致性
- 响应处理:系统用
<answer>标签包装响应并保留图像 - 上下文集成:响应被添加到对话历史中
- 任务继续:Roo 使用新信息继续任务
使用示例
- 开发 Web 应用程序时,Roo 可能会询问首选的样式框架(Bootstrap、Tailwind、自定义 CSS)
- 创建 API 时,Roo 可能会询问身份验证方法(JWT、OAuth、API 密钥)
- 重构代码时,Roo 可能会询问优先考虑性能还是可读性
- 设置数据库时,Roo 可能会询问特定的模式设计偏好
- 创建自定义功能时,Roo 可能会询问特定的行为期望
- 排查错误时,Roo 可能会询问特定的环境详细信息
响应格式
当用户对问题做出响应时,响应使用 <answer> 标签格式化以确保清晰和一致。这种格式有助于清楚地区分用户的答案和其他对话元素。
响应格式示例:
<answer>
使用 Tailwind CSS 进行实用优先的样式设计,以获得最大的灵活性
</answer>
响应格式的关键特征:
- 被
<answer>标签包围 - 保留原始响应的格式
- 如果响应中包含图像,则保留图像
- 返回完整的文本,即使是长响应
使用示例
询问实现偏好:
<ask_followup_question>
<question>您希望此 Web 应用程序使用哪种样式方法?</question>
<follow_up>
<suggest>使用 Bootstrap 进行快速开发,具有统一的组件</suggest>
<suggest>使用 Tailwind CSS 进行实用优先的样式设计,以获得最大的灵活性</suggest>
<suggest>使用 vanilla CSS 进行自定义样式,以获得完全控制和最少的依赖</suggest>
</follow_up>
</ask_followup_question>
请求技术澄清:
<ask_followup_question>
<question>此应用程序应使用哪种数据库来存储用户数据?</question>
<follow_up>
<suggest>MongoDB 用于灵活的模式和基于文档的存储</suggest>
<suggest>PostgreSQL 用于具有强一致性保证的关系数据</suggest>
<suggest>Firebase 用于实时更新和简化的后端管理</suggest>
<suggest>SQLite 用于无需外部依赖的轻量级本地存储</suggest>
</follow_up>
</ask_followup_question>
解决需求中的模糊性:
<ask_followup_question>
<question>应用程序应如何处理用户身份验证?</question>
<follow_up>
<suggest>实现带有账户验证的电子邮件/密码身份验证</suggest>
<suggest>使用社交登录提供商(Google、GitHub 等)进行快速注册</suggest>
<suggest>同时实现电子邮件/密码和社交登录选项</suggest>
</follow_up>
</ask_followup_question>