AI 写代码这件事，真的被"解决"了吗？

上周 VentureBeat 发了篇文章，标题很炸：《Agentic AI solved coding and exposed every other problem in SE》。大意是说，AI 编程代理已经解决了写代码这件事，但软件工程里其他的问题——需求理解、架构设计、调试、维护——反而被暴露得更明显了。

我第一反应是标题党。但仔细想想，好像又没完全说错。

现在的 coding agent 到底什么水平？#

先说个背景。2026 年的编程工具市场已经卷得不行了。Claude Code、OpenAI Codex CLI、GitHub Copilot、Cursor、Windsurf……每家都在说自己能帮你写代码。有人搞出了用手机远程控制 Claude Code 和 Codex 的工具（叫 Circus Chief），还有人做了个 Dragoman，让你在 Claude Code 里切到别的模型跑。生态已经长到有点离谱了。

这些工具确实能干活。你给它一个清晰的需求，它能生成一个能跑的函数、一套 CRUD 接口、一组测试用例。速度快得离谱，以前要写半小时的 boilerplate，现在一句话搞定。

Eli Bendersky 最近写了篇博客，讲他用 AI agent 从零开始写一个 Go 项目（watgo）的经历。他的说法比较实在：agent 确实能加速编码，但你得一直盯着。有时候一个 changelist 相当于好几天的工作量，但他花了好几个小时让 agent 反复清理和重构。总体有提升，“只是没某些人吹的那么大”。

这话我挺认同的。

Vibe coding 的隐患#

Cursor 的 CEO 四月份发了个警告，说 vibe coding（就是那种完全不看代码、纯靠 AI 生成的写法）会”建立摇摇欲坠的基础，最终一切崩塌”。

说这话的人是卖 AI 编程工具的，这本身就挺有意思。他显然看到了什么让他不安的东西。

我自己也碰到过。agent 生成的代码能编译、能过 lint、测试也能跑。但过两周你要改需求的时候，才发现它用了个奇怪的抽象方式，或者把本该分离的逻辑揉在了一起。代码”能跑”和”好改”之间差着十万八千里，agent 目前还跨不过去。

有句老话说得好——调试比写代码难两倍。当你让 AI 用它的方式写代码，而你压根没理解它为什么这么写的时候，这句话就变成了一个很现实的问题。你连调试的入口都找不到，因为你根本不知道代码是怎么运转的。

写代码从来都不是最难的部分#

VentureBeat 那篇文章的核心洞察其实不是”AI 解决了编码”，而是”AI 解决了编码之后，我们终于能看清楚真正的难题在哪了”。

真正的难题是什么？

需求理解。用户说”我想要一个搜索功能”，这话听着简单，但你要搞清楚搜什么字段、要不要模糊匹配、结果怎么排序、分页还是无限滚动。这些 agent 搞不定，因为提需求的人自己往往也说不清楚。

架构决策。这个服务要不要拆微服务？数据库选 PostgreSQL 还是 MongoDB？缓存层怎么设计？没有标准答案，取决于团队规模、业务预期、运维能力。agent 可以列 pros and cons，但做不了这个判断。

长期维护。代码写完只是开始。上线之后有 bug 要修、有需求要加、有依赖要升级。一个 agent 写出来的”一次性”代码库，和一个经过人类工程师深思熟虑的代码库，三个月后的维护成本完全不是一个量级。

调试。这可能是 agent 最弱的地方。线上出了个偶发的并发问题，或者某个 edge case 导致数据不一致，你需要的不是更多的代码，而是理解系统是怎么运转的。agent 可以帮你加日志、写断言，但它替代不了那种”盯着日志想了半小时突然想通了”的过程。

那我们该怎么用这些工具？#

说了这么多不是要唱衰 AI 编程工具。它们确实有用，我自己也在用。关键是怎么用。

Eli Bendersky 把项目分了两类，我觉得这个分法挺好：

低重要度的项目——原型、一次性脚本、hackathon 作品。这些可以 vibe code，反正不打算长期维护，快速出活就行。

你真正要维护的项目。这种情况下 agent 生成的每一行代码都值得过一遍。不用逐字审查，但你得理解它在做什么、为什么这么做。否则你就是在积累技术债，只是这个债现在还不用还。

我的做法是让 agent 处理那些我知道该怎么写但懒得写的部分——配置文件、测试用例、数据转换、文档。涉及到核心业务逻辑的时候，让它先写一版，然后自己过一遍，该改的改、该重写的重写。

效率确实比纯手写高，但远没有”一句话生成完整应用”那么夸张。现实就是这么无聊。

一个更大的观察#

Anthropic 上个月花了三亿多美金收购了 Stainless，一个做 API SDK 生成的工具。连 AI 公司自己都觉得光有模型不够，开发者工具链的每个环节都得做好。

编程代理的战场已经不只是”谁的模型写代码更好”了。上下文管理、多模型路由、沙箱执行、安全审计、团队协作——每个环节都有创业公司在挤。GitHub 的 CPO 最近接受采访，说未来的开发者更多是在做”宏观委托”，把大块任务交给 agent，自己负责审查和整合。

这个方向我信。但”宏观委托”的前提是你得有能力做”微观审查”。你完全不懂代码的话，怎么判断 agent 给你的东西是对的？

所以结论可能有点反直觉：AI 越强大，基础功反而越重要。不是说你要手写每一行代码，而是说你得理解每一行代码。

写代码这件事，AI 解决了一半。剩下那一半，刚好是区分”会写代码的人”和”工程师”的那一半。