FunTester 软件 3.0 来了,瓶颈依旧在

FunTester · May 09, 2026 · 278 hits

人工智能确实加快了编码速度,但真正卡住交付的瓶颈,并没有因此自动消失。

编码变快,交付没跟上

这几年,AI 编码工具对研发效率的提升已经很明显。过去需要几天才能写完的一批代码,现在可能几个小时就能生成出来。但在移动应用和数字平台团队里,我经常看到另一个现象:编码速度提升之后,整体交付速度并没有同步提升,瓶颈只是从编码环节转移到了审查、测试、集成和稳定性验证这些下游环节。

换句话说,键盘变快了,流水线不一定变快。代码可以更快产生,但它仍然要排队等待代码审查,要进入测试套件,要和既有服务、真实用户流量以及不断演进的平台能力放在一起验证。编码阶段被 AI 推着往前跑,周围的流程如果没有跟上,交付压力反而会集中爆发。

软件 3.0 改变了编码方式

人工智能研究员 Andrej Karpathy 将这种变化称为软件 3.0:团队不再手动编写每一行代码,而是描述希望系统完成什么,再让 AI 生成大部分实现代码。

在最近的一次采访中,卡帕西提到,到 2024 年底,他自己的工作比例已经发生逆转:原来大约 80% 的代码由自己编写,现在则把 80% 的代码委托给代理。他认为,新的动词不再是编码,而是实现,也就是把意图准确传达给能够执行它的系统。

智能体时代已经到来。像 Claude Code 和 OpenAI 的 Codex 智能体这样的工具,已经超越了自动补全的范畴。它们不只是补上一行函数调用,而是可以规划、编写、调试,甚至推进一个完整功能的初版。

在任何项目的早期阶段,这种变化都很诱人。你可以在一个下午里,把一个模糊想法变成可运行的概念验证。这个速度对原型探索、客户演示和早期方案验证都很有价值。

真正的瓶颈转向下游

问题出现在下一步:当这个初始版本要进入真实产品时,复杂性马上就会回来。新代码仍然需要兼容现有服务,需要处理真实用户流量,需要在平台其他部分持续变化的过程中保持可靠。更快的生成速度不会取消这些工作,只会把它们推到下游,并让它们在更短时间里集中到来。

于是,工程团队不得不把更多时间花在审查、集成和稳定那些快速生成、但缺乏系统全局视角的代码上。代码审查队列会变长,测试套件要承担更多验证压力,发布前的风险判断也会更重。

单独看似完整的功能,只有在所有功能连接起来、并在真实负载下运行时,才会暴露出细微的不一致。接口契约、状态流转、异常处理、权限边界、性能退化,这些问题不会因为代码是 AI 生成的就自动消失。

还有一个更隐蔽的挑战:开发人员在等待智能体执行任务时,到底应该做什么。与代理协作意味着把任务委托出去,然后等待服务返回结果。这段等待时间如果被有效利用,就会变成新的生产力;如果被碎片化消耗,就会直接打断深度工作的节奏。

善用这段时间的开发者,会准备下一个任务提示,在系统其他部分启动并行代理,或者提前审查架构风险。他们能把等待变成流水线的一部分。相反,如果只是把 AI 当作减少工作量的工具,而不是提高团队产出的工具,个人体感会轻松一些,团队交付却未必更快。

这也是我在自己团队以及合作组织中经常看到的差距:个人效率提升了,但团队交付速度没有等比例提升。要弥合这个差距,需要积极的项目领导、明确的交付预期,以及开发人员工作方式的真正变化。工具只是问题的一半。

当整个过程赶上来的时候

真正从软件 3.0中受益的团队,并不是只把 AI 接进编辑器,而是重新设计了从需求到交付的整个流程。能实现全周期加速的团队,通常抓住了三件事。

首先,是前期架构投入。当智能体拥有清晰的结构约束、模块边界和验收标准时,产出质量会明显更稳定。反过来,如果需求和架构本身含糊,智能体只能在模糊空间里猜测,生成速度越快,后续返工也可能越快。

因此,在开发智能体之前投入足够时间做系统设计,并不是拖慢速度。它更像是给后续生成、审查和集成铺轨道。前面多花一点时间把边界讲清楚,后面节省的审查和集成成本,往往会成倍返还。

其次,是让代理之间互相检查。这意味着用专门的审查代理检查生成代码中的安全漏洞、架构一致性和质量标准,尽早把问题拦住,而不是等它们扩散到集成阶段。

同样重要的是测试生成代理。它可以根据测试人员编写的规范创建测试用例并持续运行。在大型项目中,过去需要数周人工完成的回归验证,现在可以被压缩到更短的周期里。这里的重点不是让测试人员消失,而是把他们从重复执行中释放出来,转向测试策略、风险判断和规范设计。

第三,是给智能体正确的上下文和能力。模糊指令只会得到模糊结果。这件事首先从需求编写开始:产品需求文档必须足够精确、结构化、可执行,让智能体不仅能读懂,还能据此行动。

这还包括把代理连接到正确的信息来源:一致的设计系统、最新的项目管理信息、准确的技术文档,以及能避免它们凭空猜测的组织知识。真正的长期优势,往往就在这些上下文资产里积累起来。

不同组织的采用节奏也会不同。初创公司通常冲得更快,因为融资环境更紧,团队需要尽快拿出结果,而且早期系统的安全、合规和声誉约束相对少一些。快速写出第一个版本,已经成为很多初创团队的日常能力。

大型企业则更谨慎。它们的系统更复杂,合规要求更严格,声誉风险也更高。AI 编码工具正在普及,但生成代码进入生产环境之前,仍然需要经过更严格的审查和治理。

根据 JetBrains 发布的《2025 年开发者生态系统现状调查报告》,85% 的开发者目前经常使用 AI 编码工具,而 2025 年编写的所有代码中有 41% 由 AI 生成。工具已经无处不在,但围绕工具的工程规范还远没有同样成熟。

工程师角色的转变

更根本的变化,发生在工程师角色本身。开发人员正在从单纯的实现者,转向系统总监。日常工作的重心不再只是写出优雅代码,而是定义架构、管理代理输出、保障安全性,并持续思考系统的可扩展性。

工作重心已经从编写代码,转向验证和协调。Karpathy 的判断很直接:瓶颈不再是键盘。优秀工程师现在可以更快进入过去不熟悉的语言和技术栈,前端与后端之间的壁垒也在变薄。

整个 MVP(最小可行产品)可以由一两个人组成的小团队交付。过去需要数周完成的概念验证,现在可能一个下午就能做出来,并在当天发给客户。这确实改变了提案、售前验证和早期合作中的竞争格局。

在模式成熟的场景里,例如标准集成、可重复工作流和常规业务逻辑,AI 代理的优势最明显。但当系统变得复杂、长期运行、积累多年上下文,或者涉及安全性、可扩展性和组织责任时,人的判断仍然是关键变量。

软件 3.0时代已经到来。编码阶段的加速是真实且显著的。

但真正创造最大价值的团队,不是那些生成最多代码的团队,而是那些围绕新现实重建流程的团队:预先投资架构,用代理验证代理,为代理提供正确的工作环境,并重新管理工程师一天中的协作节奏。

瓶颈不再是把代码写出来,而是判断应该构建什么、如何构建,以及代理生成的内容是否真的适合运行在真实环境中。这才是软件 3.0 时代的工程能力。


FunTester 名片|万粉千文,百无一用
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
No Reply at the moment.
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up