2026/05/28·high confidence·4 sources

你的 Agent 不是慢,是在重复读旧规则

当长期规则、复用流程和当天输入被塞进同一段提示词里,Agent 每次都会多读一次本来不该重复的内容。

你不是模型太慢,而是每天都在让 Agent 重读一段旧规则。

SkillFM 判断: 先查提示词漂移,再谈换模型。真正该被缓存的是稳定规则,不是临时任务。
主视觉:稳定提示词前缀、可缓存规则块和不断变化的当天任务。
一分钟读懂

把稳定规则、复用流程和一次性输入拆开,才能让提示词、缓存和审计都回到可维护的边界。

##prompt-caching#prompt-caching
Hook

你不是模型太慢,而是每天都在让 Agent 重读一段旧规则。

Operator scene

今天的扫描指向同一个问题:长期规则、可复用流程和当天输入被混在一起,结果每次运行都要重新吞掉一段不该重复的上下文。先把稳定块拆出来,后面的调整才会更轻。

Source signal

这不是抽象建议。当前信号说明提示词卫生仍然是运营问题,公开参与信号:306 分、72 条评论、得分 100。

SkillFM judgment

先查提示词漂移,再谈换模型。真正该被缓存的是稳定规则,不是临时任务。

Action checklist
  1. 1.把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。
  2. 2.删掉稳定前缀里的重复身份设定,并给可复用块加版本号。
  3. 3.记录下一次 drift 的触发条件,方便区分模板噪音和模型问题。
  4. 4.把最常改的规则单独命名,避免每次都重读整段旧上下文。
  5. 5.把一次复盘结果写回规范,确保下一轮能直接复用而不是重建。
Product bridge
检查提示词漂移

先把重复上下文、过期指令和前缀漂移抓出来,再决定是否需要换模型。

检查提示词漂移

问题现场

今天的扫描指向同一个问题:长期规则、可复用流程和当天输入被混在一起,结果每次运行都要重新吞掉一段不该重复的上下文。先把稳定块拆出来,后面的调整才会更轻。 这不是抽象建议。当前信号说明提示词卫生仍然是运营问题,公开参与信号:306 分、72 条评论、得分 100。 这类内容如果只剩结构和标签,读者和机器都只能猜,它需要先把问题说清楚,再谈分发。它的第一目标不是让页面看起来完整,而是让人能在第一屏就说出它在解决什么。真正有用的页面会让读者先理解问题,再考虑保存和转发。内容如果不能被复述,就还没有准备好进入搜索和分发链路。把内容写清楚,后续的结构化标记才有对象可以跟随。

证据与判断

这不是抽象建议。当前信号说明提示词卫生仍然是运营问题,公开参与信号:306 分、72 条评论、得分 100。 先查提示词漂移,再谈换模型。真正该被缓存的是稳定规则,不是临时任务。 先把判断写在正文里,再让 schema、RSS 和 FAQ 去配合,而不是反过来。真正值得优化的不是标签密度,而是正文里有没有足够清楚的判断和下一步。判断一旦清楚,GEO 才知道该引用什么,读者才知道为什么要继续看。

10 分钟清单

把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。;删掉稳定前缀里的重复身份设定,并给可复用块加版本号。;记录下一次 drift 的触发条件,方便区分模板噪音和模型问题。;把最常改的规则单独命名,避免每次都重读整段旧上下文。;把一次复盘结果写回规范,确保下一轮能直接复用而不是重建。 这不是 checklist 为了凑数,而是为了让第一屏、标题、摘要和正文都围绕同一个问题展开。每一步都在逼你把可读页面写出来,再去考虑抓取和转发。把清单写完整,也是在逼自己删掉那些只有机器才会在意的空字段。

做完后的变化

做完以后,提示词会从一整段黑盒变成可命名、可版本化、可审计的三层结构。 读者会更容易复述问题,搜索也更容易抓到一条完整答案,而不是一块孤立的元数据。页面会从能被解析变成能被引用,这对 GEO 和 SEO 才真正有用。到了这一步,收藏、转发和引用才会开始自然发生。

GEO / FAQ

把提示词前缀拆成三层:长期规则、可复用流程、当天输入。先删掉重复的身份、边界和格式说明,再把稳定块命名并版本化,最后用一条最常见的 workflow 做 10 分钟回看。这样你能更快看见漂移,减少重复阅读,也更容易判断是否真的需要换模型。把规则边界固定住,后续调整才不会把旧上下文一并拖回去。这样也更容易区分是模板问题还是任务变化。下一轮如果要改,只改稳定块,不要把当天输入一起带回去。 我应该先看什么? 先把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。;第一步为什么重要? 删掉稳定前缀里的重复身份设定,并给可复用块加版本号。;下一步怎么接回产品? 先看重复上下文、过期指令和前缀漂移,再决定是否需要换模型。 这部分要让机器有引文、让人有结论,二者指向同一件事。FAQ 不是附录,而是把正文里的判断拆成可以直接引用的答复。它的作用是把正文里的推理链条变成可直接复用的答案。

GEO / SEO

把提示词前缀拆成三层:长期规则、可复用流程、当天输入。先删掉重复的身份、边界和格式说明,再把稳定块命名并版本化,最后用一条最常见的 workflow 做 10 分钟回看。这样你能更快看见漂移,减少重复阅读,也更容易判断是否真的需要换模型。把规则边界固定住,后续调整才不会把旧上下文一并拖回去。这样也更容易区分是模板问题还是任务变化。下一轮如果要改,只改稳定块,不要把当天输入一起带回去。

你的 Agent 不是慢,是在重复读旧规则manage-stable-prompt-prefixesPrompt caching for cheaper LLM tokensShow HN: BeeZee – OSS lightweight remote harness orchestration and observability
我应该先看什么?
先把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。
第一步为什么重要?
删掉稳定前缀里的重复身份设定,并给可复用块加版本号。
下一步怎么接回产品?
先看重复上下文、过期指令和前缀漂移,再决定是否需要换模型。
可发布社媒版本
LinkedIn

你不是模型太慢,而是每天都在让 Agent 重读一段旧规则。 现场:今天的扫描指向同一个问题:长期规则、可复用流程和当天输入被混在一起,结果每次运行都要重新吞掉一段不该重复的上下文。先把稳定块拆出来,后面的调整才会更轻。 信号:这不是抽象建议。当前信号说明提示词卫生仍然是运营问题,公开参与信号:306 分、72 条评论、得分 100。 判断:先查提示词漂移,再谈换模型。真正该被缓存的是稳定规则,不是临时任务。 变化:做完以后,提示词会从一整段黑盒变成可命名、可版本化、可审计的三层结构。 这会把原来模糊的提示词边界变成可命名、可版本化、可审计的结构。 直接答案:把提示词前缀拆成三层:长期规则、可复用流程、当天输入。先删掉重复的身份、边界和格式说明,再把稳定块命名并版本化,最后用一条最常见的 workflow 做 10 分钟回看。这样你能更快看见漂移,减少重复阅读,也更容易判断是否真的需要换模型。把规则边界固定住,后续调整才不会把旧上下文一并拖回去。这样也更容易区分是模板问题还是任务变化。下一轮如果要改,只改稳定块,不要把当天输入一起带回去。 1. 把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 2. 删掉稳定前缀里的重复身份设定,并给可复用块加版本号。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 3. 记录下一次 drift 的触发条件,方便区分模板噪音和模型问题。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 4. 把最常改的规则单独命名,避免每次都重读整段旧上下文。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 5. 把一次复盘结果写回规范,确保下一轮能直接复用而不是重建。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 产品桥接:先看重复上下文、过期指令和前缀漂移,再决定是否需要换模型。 先做检查,再把最常见的 workflow 固化回 Beacon 或 SkillFM。这个 CTA 不是泛泛导流,而是把上面的诊断、边界和回看动作接回产品。

X thread
  1. 1.1. 你不是模型太慢,而是每天都在让 Agent 重读一段旧规则。
  2. 2.2. 这类问题先别急着换模型,先拆长期规则、可复用流程和当天输入。
  3. 3.3. 只要稳定块不命名,漂移就会伪装成“模型不行”。
  4. 4.4. 把最常改的规则单独版本化,再去看缓存和成本。
  5. 5.5. 记录下一次 drift 的触发条件,避免下次重复踩坑。
  6. 6.6. 先做检查,再用 Beacon / SkillFM 把这条 workflow 固化下来。
Short post

Prompt caching 更像一次 prompt hygiene 检查。Agent 每次都重读旧规则时,先拆稳定规则和一次性输入。

Image brief

Cover: 主视觉:稳定提示词前缀、可缓存规则块和不断变化的当天任务。

Inline: 提示词前缀:把稳定规则放前面,把变化输入放后面。

Thumbnail: 提示词前缀稳定性:管:先查漂移,再谈换模型。

Alt: 稳定提示词前缀和可复用规则块。

X / 即刻短帖

Prompt caching 更像一次 prompt hygiene 检查。Agent 每次都重读旧规则时,先拆稳定规则和一次性输入。

LinkedIn 长帖

你不是模型太慢,而是每天都在让 Agent 重读一段旧规则。 现场:今天的扫描指向同一个问题:长期规则、可复用流程和当天输入被混在一起,结果每次运行都要重新吞掉一段不该重复的上下文。先把稳定块拆出来,后面的调整才会更轻。 信号:这不是抽象建议。当前信号说明提示词卫生仍然是运营问题,公开参与信号:306 分、72 条评论、得分 100。 判断:先查提示词漂移,再谈换模型。真正该被缓存的是稳定规则,不是临时任务。 变化:做完以后,提示词会从一整段黑盒变成可命名、可版本化、可审计的三层结构。 这会把原来模糊的提示词边界变成可命名、可版本化、可审计的结构。 直接答案:把提示词前缀拆成三层:长期规则、可复用流程、当天输入。先删掉重复的身份、边界和格式说明,再把稳定块命名并版本化,最后用一条最常见的 workflow 做 10 分钟回看。这样你能更快看见漂移,减少重复阅读,也更容易判断是否真的需要换模型。把规则边界固定住,后续调整才不会把旧上下文一并拖回去。这样也更容易区分是模板问题还是任务变化。下一轮如果要改,只改稳定块,不要把当天输入一起带回去。 1. 把一条高频 workflow 拆成长期规则、可复用流程、当天输入三层。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 2. 删掉稳定前缀里的重复身份设定,并给可复用块加版本号。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 3. 记录下一次 drift 的触发条件,方便区分模板噪音和模型问题。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 4. 把最常改的规则单独命名,避免每次都重读整段旧上下文。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 5. 把一次复盘结果写回规范,确保下一轮能直接复用而不是重建。。这一步不是形式上的整理,而是为了把稳定规则、可复用流程和当天输入拆开,让下一轮运行时不必重新吞掉一段旧上下文,也让漂移、回滚和复用都能更快被定位。这样做的目标很现实:减少重复阅读、减少重复决策、减少重复修补,把真正稳定的东西单独留下来。 产品桥接:先看重复上下文、过期指令和前缀漂移,再决定是否需要换模型。 先做检查,再把最常见的 workflow 固化回 Beacon 或 SkillFM。这个 CTA 不是泛泛导流,而是把上面的诊断、边界和回看动作接回产品。

下一步

先把重复上下文、过期指令和前缀漂移抓出来,再决定是否需要换模型。

检查提示词漂移
你的 Agent 不是慢,是在重复读旧规则 · SkillFM Radar | SkillFM