<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Llm-Agent on 王占伟</title><link>https://zhanwei.wang/zh/tags/llm-agent/</link><description>Recent content in Llm-Agent on 王占伟</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Fri, 17 Apr 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://zhanwei.wang/zh/tags/llm-agent/index.xml" rel="self" type="application/rss+xml"/><item><title>Claude Code Skill 的成本与性能优化：来自一次真实会话的 6 条通用原则</title><link>https://zhanwei.wang/zh/posts/skill-cost-optimization/</link><pubDate>Fri, 17 Apr 2026 00:00:00 +0800</pubDate><guid>https://zhanwei.wang/zh/posts/skill-cost-optimization/</guid><description>&lt;blockquote&gt;
&lt;p&gt;本文基于一次为期一周的 Claude Code Skill 优化实践，涉及 &lt;code&gt;prd-analysis&lt;/code&gt;、&lt;code&gt;system-design&lt;/code&gt;、&lt;code&gt;autoforge&lt;/code&gt; 三个生产级 Skill，覆盖从 token 级测量到实际代码改动的完整流程。所有数字均来自真实 JSONL session 文件，已做夸张系数修正。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id="为什么要专门讲-skill-的成本"&gt;为什么要专门讲 Skill 的成本？&lt;/h2&gt;
&lt;p&gt;通用 LLM 省钱文章通常讲的是&amp;quot;上下文剪裁、cache 热身、模型降档&amp;quot;。这些对 Skill 也成立，但 Skill 执行环境有几个&lt;strong&gt;结构性差异&lt;/strong&gt;：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;长会话 + 深调用栈&lt;/strong&gt;。Skill 内会派发多个子代理（subagent），每个子代理又可能调起自己的工具循环。一次派发 = 一个独立的对话上下文，&lt;strong&gt;子代理之间不共享 prompt cache&lt;/strong&gt;。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;主代理的 context 一旦被撑大就全程 cache_read&lt;/strong&gt;。Skill 会话常有 15–20 个主代理轮次；任何文件一旦进了主代理 context，就会在&lt;strong&gt;每一轮&lt;/strong&gt;以 cache_read 计费。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;档位由谁决定&lt;/strong&gt;含糊不清。&lt;code&gt;subagent_type&lt;/code&gt; 是内置代理（如 &lt;code&gt;Explore&lt;/code&gt;）会强制某个档位，而 &lt;code&gt;general-purpose&lt;/code&gt; + 显式 &lt;code&gt;model&lt;/code&gt; 才由 Skill 控制。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;输出 token 严重被低估&lt;/strong&gt;。Sonnet 的 output 价格是 cache_read 的 &lt;strong&gt;50×&lt;/strong&gt;；Opus 是 &lt;strong&gt;50×&lt;/strong&gt;。Skill 作者凭直觉会优化&amp;quot;少读文件&amp;quot;，却忽略&amp;quot;少写 prompt&amp;quot;这条更大的杠杆。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;以下 6 条是从实测中提炼的、能直接改动 Skill 文件即生效的原则。&lt;/p&gt;</description></item></channel></rss>