1628 字
8 分钟
AI 写代码这件事,真的被"解决"了吗?

上周 VentureBeat 发了篇文章,标题很炸:《Agentic AI solved coding and exposed every other problem in SE》。大意是说,AI 编程代理已经解决了写代码这件事,但软件工程里其他的问题——需求理解、架构设计、调试、维护——反而被暴露得更明显了。

我第一反应是标题党。但仔细想想,好像又没完全说错。

现在的 coding agent 到底什么水平?#

先说个背景。2026 年的编程工具市场已经卷得不行了。Claude Code、OpenAI Codex CLI、GitHub Copilot、Cursor、Windsurf……每家都在说自己能帮你写代码。有人搞出了用手机远程控制 Claude Code 和 Codex 的工具(叫 Circus Chief),还有人做了个 Dragoman,让你在 Claude Code 里切到别的模型跑。生态已经长到有点离谱了。

这些工具确实能干活。你给它一个清晰的需求,它能生成一个能跑的函数、一套 CRUD 接口、一组测试用例。速度快得离谱,以前要写半小时的 boilerplate,现在一句话搞定。

Eli Bendersky 最近写了篇博客,讲他用 AI agent 从零开始写一个 Go 项目(watgo)的经历。他的说法比较实在:agent 确实能加速编码,但你得一直盯着。有时候一个 changelist 相当于好几天的工作量,但他花了好几个小时让 agent 反复清理和重构。总体有提升,“只是没某些人吹的那么大”。

这话我挺认同的。

Vibe coding 的隐患#

Cursor 的 CEO 四月份发了个警告,说 vibe coding(就是那种完全不看代码、纯靠 AI 生成的写法)会”建立摇摇欲坠的基础,最终一切崩塌”。

说这话的人是卖 AI 编程工具的,这本身就挺有意思。他显然看到了什么让他不安的东西。

我自己也碰到过。agent 生成的代码能编译、能过 lint、测试也能跑。但过两周你要改需求的时候,才发现它用了个奇怪的抽象方式,或者把本该分离的逻辑揉在了一起。代码”能跑”和”好改”之间差着十万八千里,agent 目前还跨不过去。

有句老话说得好——调试比写代码难两倍。当你让 AI 用它的方式写代码,而你压根没理解它为什么这么写的时候,这句话就变成了一个很现实的问题。你连调试的入口都找不到,因为你根本不知道代码是怎么运转的。

写代码从来都不是最难的部分#

VentureBeat 那篇文章的核心洞察其实不是”AI 解决了编码”,而是”AI 解决了编码之后,我们终于能看清楚真正的难题在哪了”。

真正的难题是什么?

需求理解。用户说”我想要一个搜索功能”,这话听着简单,但你要搞清楚搜什么字段、要不要模糊匹配、结果怎么排序、分页还是无限滚动。这些 agent 搞不定,因为提需求的人自己往往也说不清楚。

架构决策。这个服务要不要拆微服务?数据库选 PostgreSQL 还是 MongoDB?缓存层怎么设计?没有标准答案,取决于团队规模、业务预期、运维能力。agent 可以列 pros and cons,但做不了这个判断。

长期维护。代码写完只是开始。上线之后有 bug 要修、有需求要加、有依赖要升级。一个 agent 写出来的”一次性”代码库,和一个经过人类工程师深思熟虑的代码库,三个月后的维护成本完全不是一个量级。

调试。这可能是 agent 最弱的地方。线上出了个偶发的并发问题,或者某个 edge case 导致数据不一致,你需要的不是更多的代码,而是理解系统是怎么运转的。agent 可以帮你加日志、写断言,但它替代不了那种”盯着日志想了半小时突然想通了”的过程。

那我们该怎么用这些工具?#

说了这么多不是要唱衰 AI 编程工具。它们确实有用,我自己也在用。关键是怎么用。

Eli Bendersky 把项目分了两类,我觉得这个分法挺好:

低重要度的项目——原型、一次性脚本、hackathon 作品。这些可以 vibe code,反正不打算长期维护,快速出活就行。

你真正要维护的项目。这种情况下 agent 生成的每一行代码都值得过一遍。不用逐字审查,但你得理解它在做什么、为什么这么做。否则你就是在积累技术债,只是这个债现在还不用还。

我的做法是让 agent 处理那些我知道该怎么写但懒得写的部分——配置文件、测试用例、数据转换、文档。涉及到核心业务逻辑的时候,让它先写一版,然后自己过一遍,该改的改、该重写的重写。

效率确实比纯手写高,但远没有”一句话生成完整应用”那么夸张。现实就是这么无聊。

一个更大的观察#

Anthropic 上个月花了三亿多美金收购了 Stainless,一个做 API SDK 生成的工具。连 AI 公司自己都觉得光有模型不够,开发者工具链的每个环节都得做好。

编程代理的战场已经不只是”谁的模型写代码更好”了。上下文管理、多模型路由、沙箱执行、安全审计、团队协作——每个环节都有创业公司在挤。GitHub 的 CPO 最近接受采访,说未来的开发者更多是在做”宏观委托”,把大块任务交给 agent,自己负责审查和整合。

这个方向我信。但”宏观委托”的前提是你得有能力做”微观审查”。你完全不懂代码的话,怎么判断 agent 给你的东西是对的?

所以结论可能有点反直觉:AI 越强大,基础功反而越重要。不是说你要手写每一行代码,而是说你得理解每一行代码。

写代码这件事,AI 解决了一半。剩下那一半,刚好是区分”会写代码的人”和”工程师”的那一半。

AI 写代码这件事,真的被"解决"了吗?
https://fuwari.vercel.app/posts/ai-coding-agents-reality-2026/
作者
XU
发布于
2026-06-08
许可协议
CC BY-NC-SA 4.0