Claude 学习记录
10个最具普适性的工程实践:
-
Agent Loop要极简,Harness要极厚。 核心循环保持20行以内,把工程投入放在周围的基础设施上。
-
流式执行不是可选优化,而是必备能力。 用async generator串联整个执行链,让工具在模型输出过程中就开始执行。
-
上下文压缩要分层设计。 从零成本的本地裁剪到有成本的LLM摘要,层层递进,避免"一刀切"。
-
安全检查嵌入使用点。 安全规则写在工具描述里、模型看得到的地方,而不是藏在独立的策略文件中。
-
用小模型监管大模型。 权限检查用Haiku,情绪检测用正则——不是每个决策都需要最强模型。
-
记忆要"怀疑式"设计。 记忆只是指针,使用前必须验证。"记忆说X存在"≠"X现在存在"。
-
多Agent成本控制靠缓存共享。 Fork子Agent继承父上下文的KV Cache,让并行几乎免费。
-
静态与动态prompt分离。 不变的放前面吃缓存,变化的放后面——这是最低成本的优化。
-
用声明式Schema定义工具。 每个工具通过Schema定义输入、通过权限模型定义安全边界、通过独立模块实现逻辑。新增工具的边际成本极低。
-
不要用向量数据库搜索代码。 Claude Code用grep和ripgrep做代码搜索——可预测、可解释、零幻觉。在信息检索领域,简单可靠往往胜过"智能"。