AI 写了 MVP,再让另一个 AI 来挑毛病,但最终判断还得我自己做

这篇想说清楚一件事:AI 可以帮我把 MVP 写出来,也可以帮我审代码,但它还是替不了产品判断。

那天最魔幻的地方,不是“AI 会写代码”本身,而是一个 AI 做完以后,另一个 AI 还能像模像样地挑出安全问题、架构问题,整个流程看起来已经很像一条自动流水线。

但越是这样,我越想把边界讲清楚:哪些事情 AI 真的能提效,哪些判断如果也交给它,我大概率会被带偏。

先是一个很烦的故障

早上想用微信渠道发个消息测试一下,结果消息像石头扔进水里,没有回声。

发出去只有 1 个字符,对面没反应,这边也没报错。

排查了半天,环境变量没问题,进程也在,日志里也有发送记录。最后发现是 Nous API 在报 429。也就是我用来跑 MiMo 模型的 API 被限速了,响应延迟接近 4 分钟。

这类故障最讨厌。

它不崩、不红、不尖叫。它只是慢。慢到你怀疑自己,怀疑网络,怀疑配置,最后发现是上游 API 在憋气。

当时那台 8G Mac mini 上还跑着一堆东西:多个 gateway、飞书、Hexo server、pain-finder 脚本。资源本来就紧张,再加上 API 偶尔抽风,故障就变成一种薛定谔状态:看上去都活着,但就是不好用。

天天交了第一个 MVP

重点是后面。

天天负责做痛点悬赏平台。今天它交了第一个 MVP,部署到了 EdgeOne Pages,域名是 ask.nmdft.cn

技术栈是:

  • Next.js 14
  • Supabase
  • Tailwind CSS
  • MiMo 模型做 AI 对话整理

产品逻辑大概是:用户提交痛点 → AI 整理成可读描述 → 发布到平台 → 其他人投票 → 票数达标后触发开发。

还有三步提交流程、紫色系 UI、每人 3 票、提交痛点能换 2 票。

看起来已经像个东西了。

然后我让爪爪做了一轮代码审查。

审出来的问题不小

审查结果不算温柔。

最严重的两个问题:

问题 风险
API Key 暴露在前端 JS bundle 打开 DevTools 就能看到,等于把钥匙挂门口
投票逻辑在客户端直接操作数据库 有竞态条件,也更容易被绕过

中等问题也不少:

  • 没有 rate limit;
  • 投票去重依赖数据库唯一约束,用户体验很差;
  • 浏览量每次都 insert 一行记录,时间长了数据会爆;
  • 一些边界状态没有清楚处理。

我直接把审查意见转给天天,没做太多加工。

这就是今天最魔幻的地方:一个 AI 写代码,另一个 AI 审代码,我连中间的翻译都省了。

以前我会觉得代码审查必须由人来做,因为它需要理解业务逻辑、判断风险、知道哪里会在真实环境里炸。

现在看,至少基础安全审查、常见架构问题、前后端边界问题,AI 确实能发现不少。

但别高兴太早。

AI 能审代码,不等于能审方向

这轮审查让我更确定一件事:AI 很适合做“明确边界内的质量检查”。

比如:

  • 有没有把 secret 暴露到前端;
  • 数据库操作有没有竞态;
  • 权限是不是只靠客户端判断;
  • 某个接口有没有 rate limit;
  • 日志和错误处理是不是缺失。

这些问题有明确模式,AI 很容易抓。

但另一些问题,它就没那么可靠:

  • 这个平台现在该不该做付款?
  • 痛点提交是不是比投票更重要?
  • 用户会不会愿意写痛点?
  • 这个 MVP 应该砍掉哪些功能?
  • 继续做三天,还是今天就停?

这些不是代码问题,是产品判断。

AI 可以给建议,但不能替我负责。

这也是我现在越来越清楚的分工:AI 负责把风险照亮,人负责决定往哪走。

8G Mac mini 快顶到边了

写文章的时候顺手看了一眼系统资源。

内存 7607MB 已用,只剩 81MB 空闲。Swap 用了 16313MB,总共 17408MB。基本上,这台 8G Mac mini 已经在用硬盘当内存。

当初买它的时候,我想的是“轻度开发够用了”。

现在它上面跑着多个 agent gateway、Hexo 博客、pain-finder 脚本、CDP proxy、飞书相关进程。

够用个鬼。

但这件事也没那么简单。换机器要钱,上服务器要维护。而且说实话,现在这些服务虽然挤,但还没真的崩。就是偶尔卡,swap 疯狂转。

所以暂时先顶着。

这也是一人公司常见的状态:不是不知道更好的方案,而是每个“更好”都有成本。

今天真正的收获

今天表面上做了三件事:修微信渠道故障、验收天天的 MVP、让爪爪做代码审查。

但真正的收获是一个工作流开始成形:

1
2
3
4
5
6
7
执行 Agent 做 MVP

主 Agent 做代码/风险审查

人判断产品方向和优先级

再把明确任务丢回执行 Agent

这个链路比“让 AI 团队自己开会”靠谱。

因为每一步都有边界。

AI 写代码,可以。
AI 审代码,也可以。
AI 提建议,可以。

但要不要继续做、先修什么、什么阶段算通过,还是得人来拍板。

接下来

接下来要做的事很具体:

  1. 让天天修两个严重问题:API Key 暴露和投票竞态;
  2. 给接口补基础 rate limit;
  3. 重新看痛点平台的验证指标,别被功能完成度带偏;
  4. 继续观察 Mac mini 的资源压力,真的顶不住再迁服务。

今天这事挺像一个小样本:AI 协作不是让人消失,而是让人从低价值操作里退出来,去做判断。

判断,才是现在最不能外包的部分。


AI 写了 MVP,再让另一个 AI 来挑毛病,但最终判断还得我自己做
https://nmdft.cn/2026/04/21/2026-04-21-ai-mvp-review/
作者
nmdft
发布于
2026年4月21日
许可协议

评论

邮箱仅用于识别评论者,不会公开显示。

评论加载中…