返回博客列表

10个可以立刻借鉴的工程实践

2026-04-10
1 min read

Claude 学习记录 10个最具普适性的工程实践: 1. Agent Loop要极简,Harness要极厚。 核心循环保持20行以内,把工程投入放在周围的基础设施上。 2. 流式执行不是可选优化,而是必备能力。 用async generator串联整个执行链,让工具在模型输出过程中就开始执行。 3. 上下文压缩要分层设计。 从零成本的本地裁剪到有成本的LLM摘要,层层递进,避免"一刀切"。 4....

Claude 学习记录

10个最具普适性的工程实践:

  1. Agent Loop要极简,Harness要极厚。 核心循环保持20行以内,把工程投入放在周围的基础设施上。

  2. 流式执行不是可选优化,而是必备能力。 用async generator串联整个执行链,让工具在模型输出过程中就开始执行。

  3. 上下文压缩要分层设计。 从零成本的本地裁剪到有成本的LLM摘要,层层递进,避免"一刀切"。

  4. 安全检查嵌入使用点。 安全规则写在工具描述里、模型看得到的地方,而不是藏在独立的策略文件中。

  5. 用小模型监管大模型。 权限检查用Haiku,情绪检测用正则——不是每个决策都需要最强模型。

  6. 记忆要"怀疑式"设计。 记忆只是指针,使用前必须验证。"记忆说X存在"≠"X现在存在"。

  7. 多Agent成本控制靠缓存共享。 Fork子Agent继承父上下文的KV Cache,让并行几乎免费。

  8. 静态与动态prompt分离。 不变的放前面吃缓存,变化的放后面——这是最低成本的优化。

  9. 用声明式Schema定义工具。 每个工具通过Schema定义输入、通过权限模型定义安全边界、通过独立模块实现逻辑。新增工具的边际成本极低。

  10. 不要用向量数据库搜索代码。 Claude Code用grep和ripgrep做代码搜索——可预测、可解释、零幻觉。在信息检索领域,简单可靠往往胜过"智能"。

返回博客列表
最后更新于 2026-04-10
想法或问题?在 GitHub Issue 下方参与讨论
去评论