作者

FunTester

FunTester

FunTester，Have Fun ~ Tester ！

829 文章

0 精华

335 粉丝

FunTester 软件 3.0 来了，瓶颈依旧在

FunTester · May 09, 2026 · 278 hits

「All right reserved, any unauthorized reproduction or transfer is prohibitted」

人工智能确实加快了编码速度，但真正卡住交付的瓶颈，并没有因此自动消失。

编码变快，交付没跟上

这几年，AI 编码工具对研发效率的提升已经很明显。过去需要几天才能写完的一批代码，现在可能几个小时就能生成出来。但在移动应用和数字平台团队里，我经常看到另一个现象：编码速度提升之后，整体交付速度并没有同步提升，瓶颈只是从编码环节转移到了审查、测试、集成和稳定性验证这些下游环节。

换句话说，键盘变快了，流水线不一定变快。代码可以更快产生，但它仍然要排队等待代码审查，要进入测试套件，要和既有服务、真实用户流量以及不断演进的平台能力放在一起验证。编码阶段被 AI 推着往前跑，周围的流程如果没有跟上，交付压力反而会集中爆发。

软件 3.0 改变了编码方式

人工智能研究员 Andrej Karpathy 将这种变化称为软件 3.0：团队不再手动编写每一行代码，而是描述希望系统完成什么，再让 AI 生成大部分实现代码。

在最近的一次采访中，卡帕西提到，到 2024 年底，他自己的工作比例已经发生逆转：原来大约 80% 的代码由自己编写，现在则把 80% 的代码委托给代理。他认为，新的动词不再是编码，而是实现，也就是把意图准确传达给能够执行它的系统。

智能体时代已经到来。像 Claude Code 和 OpenAI 的 Codex 智能体这样的工具，已经超越了自动补全的范畴。它们不只是补上一行函数调用，而是可以规划、编写、调试，甚至推进一个完整功能的初版。

在任何项目的早期阶段，这种变化都很诱人。你可以在一个下午里，把一个模糊想法变成可运行的概念验证。这个速度对原型探索、客户演示和早期方案验证都很有价值。

真正的瓶颈转向下游

问题出现在下一步：当这个初始版本要进入真实产品时，复杂性马上就会回来。新代码仍然需要兼容现有服务，需要处理真实用户流量，需要在平台其他部分持续变化的过程中保持可靠。更快的生成速度不会取消这些工作，只会把它们推到下游，并让它们在更短时间里集中到来。

于是，工程团队不得不把更多时间花在审查、集成和稳定那些快速生成、但缺乏系统全局视角的代码上。代码审查队列会变长，测试套件要承担更多验证压力，发布前的风险判断也会更重。

单独看似完整的功能，只有在所有功能连接起来、并在真实负载下运行时，才会暴露出细微的不一致。接口契约、状态流转、异常处理、权限边界、性能退化，这些问题不会因为代码是 AI 生成的就自动消失。

还有一个更隐蔽的挑战：开发人员在等待智能体执行任务时，到底应该做什么。与代理协作意味着把任务委托出去，然后等待服务返回结果。这段等待时间如果被有效利用，就会变成新的生产力；如果被碎片化消耗，就会直接打断深度工作的节奏。

善用这段时间的开发者，会准备下一个任务提示，在系统其他部分启动并行代理，或者提前审查架构风险。他们能把等待变成流水线的一部分。相反，如果只是把 AI 当作减少工作量的工具，而不是提高团队产出的工具，个人体感会轻松一些，团队交付却未必更快。

这也是我在自己团队以及合作组织中经常看到的差距：个人效率提升了，但团队交付速度没有等比例提升。要弥合这个差距，需要积极的项目领导、明确的交付预期，以及开发人员工作方式的真正变化。工具只是问题的一半。

当整个过程赶上来的时候

真正从软件 3.0中受益的团队，并不是只把 AI 接进编辑器，而是重新设计了从需求到交付的整个流程。能实现全周期加速的团队，通常抓住了三件事。

首先，是前期架构投入。当智能体拥有清晰的结构约束、模块边界和验收标准时，产出质量会明显更稳定。反过来，如果需求和架构本身含糊，智能体只能在模糊空间里猜测，生成速度越快，后续返工也可能越快。

因此，在开发智能体之前投入足够时间做系统设计，并不是拖慢速度。它更像是给后续生成、审查和集成铺轨道。前面多花一点时间把边界讲清楚，后面节省的审查和集成成本，往往会成倍返还。

其次，是让代理之间互相检查。这意味着用专门的审查代理检查生成代码中的安全漏洞、架构一致性和质量标准，尽早把问题拦住，而不是等它们扩散到集成阶段。

同样重要的是测试生成代理。它可以根据测试人员编写的规范创建测试用例并持续运行。在大型项目中，过去需要数周人工完成的回归验证，现在可以被压缩到更短的周期里。这里的重点不是让测试人员消失，而是把他们从重复执行中释放出来，转向测试策略、风险判断和规范设计。

第三，是给智能体正确的上下文和能力。模糊指令只会得到模糊结果。这件事首先从需求编写开始：产品需求文档必须足够精确、结构化、可执行，让智能体不仅能读懂，还能据此行动。

这还包括把代理连接到正确的信息来源：一致的设计系统、最新的项目管理信息、准确的技术文档，以及能避免它们凭空猜测的组织知识。真正的长期优势，往往就在这些上下文资产里积累起来。

不同组织的采用节奏也会不同。初创公司通常冲得更快，因为融资环境更紧，团队需要尽快拿出结果，而且早期系统的安全、合规和声誉约束相对少一些。快速写出第一个版本，已经成为很多初创团队的日常能力。

大型企业则更谨慎。它们的系统更复杂，合规要求更严格，声誉风险也更高。AI 编码工具正在普及，但生成代码进入生产环境之前，仍然需要经过更严格的审查和治理。

根据 JetBrains 发布的《2025 年开发者生态系统现状调查报告》，85% 的开发者目前经常使用 AI 编码工具，而 2025 年编写的所有代码中有 41% 由 AI 生成。工具已经无处不在，但围绕工具的工程规范还远没有同样成熟。

工程师角色的转变

更根本的变化，发生在工程师角色本身。开发人员正在从单纯的实现者，转向系统总监。日常工作的重心不再只是写出优雅代码，而是定义架构、管理代理输出、保障安全性，并持续思考系统的可扩展性。

工作重心已经从编写代码，转向验证和协调。Karpathy 的判断很直接：瓶颈不再是键盘。优秀工程师现在可以更快进入过去不熟悉的语言和技术栈，前端与后端之间的壁垒也在变薄。

整个 MVP（最小可行产品）可以由一两个人组成的小团队交付。过去需要数周完成的概念验证，现在可能一个下午就能做出来，并在当天发给客户。这确实改变了提案、售前验证和早期合作中的竞争格局。

在模式成熟的场景里，例如标准集成、可重复工作流和常规业务逻辑，AI 代理的优势最明显。但当系统变得复杂、长期运行、积累多年上下文，或者涉及安全性、可扩展性和组织责任时，人的判断仍然是关键变量。

软件 3.0时代已经到来。编码阶段的加速是真实且显著的。

但真正创造最大价值的团队，不是那些生成最多代码的团队，而是那些围绕新现实重建流程的团队：预先投资架构，用代理验证代理，为代理提供正确的工作环境，并重新管理工程师一天中的协作节奏。

瓶颈不再是把代码写出来，而是判断应该构建什么、如何构建，以及代理生成的内容是否真的适合运行在真实环境中。这才是软件 3.0 时代的工程能力。

FunTester 名片｜万粉千文，百无一用

TesterHome 为用户提供「保留所有权利，禁止转载」的选项。除非获得原作者的单独授权，任何第三方不得转载标注了「All right reserved, any unauthorized reproduction or transfer is prohibitted」的内容，否则均视为侵权。具体请参见TesterHome 知识产权保护协议。

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！

No Reply at the moment.

需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up。