AI 技术工程实践：36 场直播复盘精华

小模型优先，大模型兜底

企业 90% 的需求可以用小模型解决——这是 36 场直播复盘中最频繁被印证的观点。

小参数模型（0.5B-3B）在摘要处理、文本结构化、调度分发中性价比极高。响应快（毫秒级）、成本低、部署灵活。大模型仅用于需要深度推理的复杂 case，作为兜底方案而非默认选择。

关键不是模型大小，而是需求拆解粒度。先把需求拆成足够细的单元，再用合适大小的模型处理，这是成本控制的核心。

多 AI 协同架构中，最容易被忽略的是中间调度层。它包含三个核心模块：

关键教训：多 AI 协同必须做异步解耦，而非串行处理。上下层数搭多了会引发”雪崩”效应——一层出错，层层放大。记忆系统越简单越好，不要过度设计。

无论是 MCP 还是 SKILL，本质都是告诉 AI”你可以用什么工具”。

MCP 是 Agent 与工具交互的标准协议，可以理解为 AI 的”USB 接口”。而 CLI 是更轻量的调用方式——直接通过命令行调用工具，省去了复杂的协议层。

A2A（Agent to Agent）协议正在成为 Agent 间通信的标准。未来多个 Agent 协同工作时，A2A 将扮演类似 HTTP 在 Web 中的角色。

这可能与直觉相反，但核心逻辑是：AI 降低的是代码实现的门槛，而非架构设计的门槛。

架构层的抽象能力——如何把复杂问题拆解为可处理的组件、如何定义组件间的接口和协议——这些才是真正的门槛。AI 让会的人更快，让不会的人面临更多的”看起来能跑但实际不可维护”的代码。

OpenClaw 等 Agent 框架分五层，最核心的第二层”工具层”需要极强的架构思维。这不是 AI 能替代的。

约 51 万行 TypeScript 代码泄露（非黑客攻击，而是 Anthropic 打包失误），其中几个关键发现：