返回博客列表

10个可以立刻借鉴的工程实践

2026-04-10

1 min read

Claude 学习记录 10个最具普适性的工程实践： 1. Agent Loop要极简，Harness要极厚。核心循环保持20行以内，把工程投入放在周围的基础设施上。 2. 流式执行不是可选优化，而是必备能力。用async generator串联整个执行链，让工具在模型输出过程中就开始执行。 3. 上下文压缩要分层设计。从零成本的本地裁剪到有成本的LLM摘要，层层递进，避免"一刀切"。 4....

Claude 学习记录

10个最具普适性的工程实践：

Agent Loop要极简，Harness要极厚。核心循环保持20行以内，把工程投入放在周围的基础设施上。
流式执行不是可选优化，而是必备能力。用async generator串联整个执行链，让工具在模型输出过程中就开始执行。
上下文压缩要分层设计。从零成本的本地裁剪到有成本的LLM摘要，层层递进，避免"一刀切"。
安全检查嵌入使用点。安全规则写在工具描述里、模型看得到的地方，而不是藏在独立的策略文件中。
用小模型监管大模型。权限检查用Haiku，情绪检测用正则——不是每个决策都需要最强模型。
记忆要"怀疑式"设计。记忆只是指针，使用前必须验证。"记忆说X存在"≠"X现在存在"。
多Agent成本控制靠缓存共享。 Fork子Agent继承父上下文的KV Cache，让并行几乎免费。
静态与动态prompt分离。不变的放前面吃缓存，变化的放后面——这是最低成本的优化。
用声明式Schema定义工具。每个工具通过Schema定义输入、通过权限模型定义安全边界、通过独立模块实现逻辑。新增工具的边际成本极低。
不要用向量数据库搜索代码。 Claude Code用grep和ripgrep做代码搜索——可预测、可解释、零幻觉。在信息检索领域，简单可靠往往胜过"智能"。

返回博客列表

最后更新于 2026-04-10

想法或问题？在 GitHub Issue 下方参与讨论