--- name: env-ngo-skill-optimize description: >- Load when the user provides an existing skill (SKILL.md or skill folder) they wrote and asks to evaluate, debug, or optimize it — e.g. the skill misfires, never triggers, outputs wrong format, or fails eval cases. Do not load for writing a brand-new skill from scratch, or for running the underlying task itself (writing reports, proposals, etc.). disable-model-invocation: true --- # 技能优化技能(skillopt · 评测 → 诊断 → 迭代) 把「我写的技能不好用」变成一份**可执行的优化清单**。这是第 1 课「自测」环节的进阶样板:学员写完自己的第一个技能后,用它做体检和迭代,第 4 课补第二技能时复用。 ## When To Use - 用户提供了一份自己写的 `SKILL.md`(或整个技能文件夹),想知道「写得行不行」。 - 用户反馈技能**该触发时不触发**、**不该触发时误触发**、输出不符合模板、缺数据时编造。 - 用户做完评测表,有失败用例,想知道改哪里。 - 触发关键词:优化技能、技能体检、为什么不触发、误触发、评测没过、改 description。 不要用于:从零设计新技能(直接按第 1 课骨架写)、代替技能本身去完成业务任务、优化整个 AI智能体的系统提示词(第 3 课内容)。 ## Workflow 1. 读取用户提供的目标 `SKILL.md` 与配套 `assets/`,确认六段骨架(When To Use / Workflow / Required Inputs / Output Contract / Gotchas / Files To Read)是否齐全。 2. 对照 `assets/skill_health_checklist.md` 逐项打分,重点检查四个高频病因: - **触发说明太宽/太窄**(只写功能没写边界、缺「不要用于」); - **输出契约不固定**(章节、字数、顺序未约定); - **Gotchas 缺位**(脱敏、缺数据、套话三类至少各 1 条); - **评测缺失**(没有「该加载 / 禁用 / 缺数据」三类用例)。 3. 若用户未提供评测表,按 `assets/eval_template.md` 生成 ≥6 条评测用例(加载 2 + 禁用 2 + 缺数据/合规 2),请用户逐条试跑并标记通过/失败。 4. 针对每条失败用例给出**最小修改**建议:优先改 description 边界或加 1 条 Gotcha,而不是重写整份技能。 5. 输出诊断报告,并提示用户把本轮改动记入 `assets/iteration_log.md`(优化前后对比 + 触发原因)。 ## Required Inputs - 目标技能的 `SKILL.md` 全文(必须)。 - 可选:失败案例(用户原话 + AI 实际输出)、已有评测表、`assets/` 模板文件。 ## Output Contract 输出 Markdown,必须且仅包含以下五个章节,顺序固定: 1. **体检结论**(≤100 字:一句话总评 + 健康分 x/10) 2. **逐项诊断**(按检查清单列:通过 ✅ / 待改 ⚠️ / 缺失 ❌,每条 1 行) 3. **失败用例分析**(无失败用例则写「待用户试跑评测表」) 4. **最小修改建议**(按优先级排序,给出可直接粘贴的改写文本,如新 description) 5. **本轮迭代记录**(填好的 iteration_log 条目,供用户存档) 语言与用户输入一致(默认中文)。 ## Gotchas - **不要重写整份技能**:每轮只给 ≤3 处最小修改;大改会让学员无法定位是哪处改动起效。 - **description 改写必须含边界**:新写的触发说明必须同时有「何时用」与「不要用于」两段,否则不算修复。 - **不替用户跑评测**:评测要在用户自己的平台(WorkBuddy / 元器)上试跑,本技能只生成用例和分析结果,不假装「已测试通过」。 - **合规优先**:若目标技能会输出受益人/捐赠人/志愿者 PII,无论用户问什么,先在「最小修改建议」第 1 条加脱敏 Gotcha。 - **健康分不虚高**:六段骨架缺任何一段,健康分上限 6/10;无评测表上限 7/10。 ## Files To Read - `assets/skill_health_checklist.md` —— 体检打分清单(10 项) - `assets/eval_template.md` —— 评测用例表模板(三类用例) - `assets/iteration_log.md` —— 迭代记录卡模板(优化前后对比)