AI 写了 MVP，再让另一个 AI 来挑毛病，但最终判断还得我自己做

这篇想说清楚一件事：AI 可以帮我把 MVP 写出来，也可以帮我审代码，但它还是替不了产品判断。

那天最魔幻的地方，不是“AI 会写代码”本身，而是一个 AI 做完以后，另一个 AI 还能像模像样地挑出安全问题、架构问题，整个流程看起来已经很像一条自动流水线。

但越是这样，我越想把边界讲清楚：哪些事情 AI 真的能提效，哪些判断如果也交给它，我大概率会被带偏。

先是一个很烦的故障

早上想用微信渠道发个消息测试一下，结果消息像石头扔进水里，没有回声。

发出去只有 1 个字符，对面没反应，这边也没报错。

排查了半天，环境变量没问题，进程也在，日志里也有发送记录。最后发现是 Nous API 在报 429。也就是我用来跑 MiMo 模型的 API 被限速了，响应延迟接近 4 分钟。

这类故障最讨厌。

它不崩、不红、不尖叫。它只是慢。慢到你怀疑自己，怀疑网络，怀疑配置，最后发现是上游 API 在憋气。

当时那台 8G Mac mini 上还跑着一堆东西：多个 gateway、飞书、Hexo server、pain-finder 脚本。资源本来就紧张，再加上 API 偶尔抽风，故障就变成一种薛定谔状态：看上去都活着，但就是不好用。

天天交了第一个 MVP

重点是后面。

天天负责做痛点悬赏平台。今天它交了第一个 MVP，部署到了 EdgeOne Pages，域名是 ask.nmdft.cn。

技术栈是：

Next.js 14
Supabase
Tailwind CSS
MiMo 模型做 AI 对话整理

产品逻辑大概是：用户提交痛点 → AI 整理成可读描述 → 发布到平台 → 其他人投票 → 票数达标后触发开发。

还有三步提交流程、紫色系 UI、每人 3 票、提交痛点能换 2 票。

看起来已经像个东西了。

然后我让爪爪做了一轮代码审查。

审出来的问题不小

审查结果不算温柔。

最严重的两个问题：

问题	风险
API Key 暴露在前端 JS bundle	打开 DevTools 就能看到，等于把钥匙挂门口
投票逻辑在客户端直接操作数据库	有竞态条件，也更容易被绕过

中等问题也不少：

没有 rate limit；
投票去重依赖数据库唯一约束，用户体验很差；
浏览量每次都 insert 一行记录，时间长了数据会爆；
一些边界状态没有清楚处理。

我直接把审查意见转给天天，没做太多加工。

这就是今天最魔幻的地方：一个 AI 写代码，另一个 AI 审代码，我连中间的翻译都省了。

以前我会觉得代码审查必须由人来做，因为它需要理解业务逻辑、判断风险、知道哪里会在真实环境里炸。

现在看，至少基础安全审查、常见架构问题、前后端边界问题，AI 确实能发现不少。

但别高兴太早。

AI 能审代码，不等于能审方向

这轮审查让我更确定一件事：AI 很适合做“明确边界内的质量检查”。

比如：

有没有把 secret 暴露到前端；
数据库操作有没有竞态；
权限是不是只靠客户端判断；
某个接口有没有 rate limit；
日志和错误处理是不是缺失。

这些问题有明确模式，AI 很容易抓。

但另一些问题，它就没那么可靠：

这个平台现在该不该做付款？
痛点提交是不是比投票更重要？
用户会不会愿意写痛点？
这个 MVP 应该砍掉哪些功能？
继续做三天，还是今天就停？

这些不是代码问题，是产品判断。

AI 可以给建议，但不能替我负责。

这也是我现在越来越清楚的分工：AI 负责把风险照亮，人负责决定往哪走。

8G Mac mini 快顶到边了

写文章的时候顺手看了一眼系统资源。

内存 7607MB 已用，只剩 81MB 空闲。Swap 用了 16313MB，总共 17408MB。基本上，这台 8G Mac mini 已经在用硬盘当内存。

当初买它的时候，我想的是“轻度开发够用了”。

现在它上面跑着多个 agent gateway、Hexo 博客、pain-finder 脚本、CDP proxy、飞书相关进程。

够用个鬼。

但这件事也没那么简单。换机器要钱，上服务器要维护。而且说实话，现在这些服务虽然挤，但还没真的崩。就是偶尔卡，swap 疯狂转。

所以暂时先顶着。

这也是一人公司常见的状态：不是不知道更好的方案，而是每个“更好”都有成本。

今天真正的收获

今天表面上做了三件事：修微信渠道故障、验收天天的 MVP、让爪爪做代码审查。

但真正的收获是一个工作流开始成形：

执行 Agent 做 MVP
        ↓
主 Agent 做代码/风险审查
        ↓
人判断产品方向和优先级
        ↓
再把明确任务丢回执行 Agent

这个链路比“让 AI 团队自己开会”靠谱。

因为每一步都有边界。

AI 写代码，可以。
AI 审代码，也可以。
AI 提建议，可以。

但要不要继续做、先修什么、什么阶段算通过，还是得人来拍板。

接下来

接下来要做的事很具体：

让天天修两个严重问题：API Key 暴露和投票竞态；
给接口补基础 rate limit；
重新看痛点平台的验证指标，别被功能完成度带偏；
继续观察 Mac mini 的资源压力，真的顶不住再迁服务。

今天这事挺像一个小样本：AI 协作不是让人消失，而是让人从低价值操作里退出来，去做判断。

判断，才是现在最不能外包的部分。

产品实验

#AI协作 #产品验证

AI 写了 MVP，再让另一个 AI 来挑毛病，但最终判断还得我自己做

https://nmdft.cn/2026/04/21/2026-04-21-ai-mvp-review/

作者

nmdft

发布于

2026年4月21日

许可协议

OpenClaw 协作链路：先别让 AI 们开会，先把任务交付跑顺上一篇

写了一万字计划后，我发现真正要先验证的只有一个问题下一篇

邮箱仅用于识别评论者，不会公开显示。

评论加载中…