文章作者、来源:不睡觉的大锤,大锤沉思录

YC 现在的内部系统会在夜里偷偷给自己改代码。流程是这样,第一天有 YC 员工向内部 agent 发了一条 query,跑失败了。一个监督 agent (monitoring agent) 会读到这次失败,反推为什么,再决定要不要补一个新的确定性工具、要不要更新 skills 文件、要不要换一个数据库视图、要不要建一个新索引。判断完了它直接写代码,向 YC 代码库提 MR,让另一个 agent 完成 review、合并、部署。第二天有人再发同一条 query,这次能跑通了。重点是,整件事在所有 YC 员工睡觉时跑完。
讲这件事的是 Tom Blomfield。Monzo 联合创始人,GoCardless 创始人,2019 年因为推动英国银行业竞争被授予 OBE 勋章,目前是 YC General Partner,在 4 个批次里跑了 1000 多次 office hour,辅导的公司估值合计大约 50 亿美元。这场 13 分钟的内部演讲是他对 AI 时代公司形态的一次提议。
他想回答的问题是,当一家公司可以让 AI 在自己睡觉时完成自我修复和迭代时,组织的样子应该长什么样。
罗马军团的设计是嵌套层级,每一层有稳定的管辖宽度,每一层有明确的指挥官。命令从罗马城里发出,要传到驻守在苏格兰哈德良长城的士兵手里,靠的就是这套层层下传、层层上汇的结构。Tom 的判断是,今天大多数公司还是按罗马军团的形态组织的,人在里面承担的角色,是信息上下流动的导管。
Jack Dorsey 几周前的一条推文戳破了这件事。我们对「科层制公司是组织经济单元的最优形态」这个判断,是基于一个默认假设的。AI 把这个假设打破了。
这套话听上去激进。但它戳中的是一个一年前广为流行的错误叙事。一年前你跟人聊 AI 怎么有用,得到的回答多半是「提效」,给工程师配 Copilot,让产出多 20%,把 Copilot 塞进各种工作流,公司发版速度提升。Tom 引用 Pete Koomen 的一篇博客,把这种用法叫「把旧工作方式照搬,加一台更猛的引擎」。
更准确的视角是把公司重新理解为一组「递归自我改进的 AI 循环」。AI 不是绑在公司侧面的一件提效工具,也不是给工程师的副驾驶。它是公司这台机器本身的运转方式。
YC Group Partner Diana Hu 之前用过一个框架来讲这个 AI 循环,Tom 沿用了它。一个完整的循环包含五层。
第一层叫传感层 (sensor layer)。落到地面上就是客户邮件、support ticket、代码改动、用户取消订阅、产品埋点数据,所有从外部世界进入这套系统的信号。
第二层叫策略层 (policy layer)。规定 AI 能做什么,哪些事情必须先问人,哪些必须留下记录。
第三层叫工具层 (tool layer)。Gary Tan 之前讲过的 skills 和代码就在这层。一组确定性的 API,比如查我的数据库、读我的日历,AI 能调用的所有动作都写在这一层。
第四层叫质量门禁 (quality gate)。eval 检查、安全过滤、高风险动作走人审,全部在这里。
第五层叫学习机制 (learning mechanism)。系统跑去跟真实世界交互,捕捉哪里没跑通,再回到顶层重跑一遍。
这五层每一层都能做到不需要人或最少需要人介入时,整套循环就开始自我改进。
YC 自己跑通的那条路径是这样进化的。第一代是简单的 query agent,能用确定性工具查数据库,回答「我上一次跟这家公司开 office hour 是什么时候」这种事实问题。第二代加上 RAG,变成一个能根据当前 office hour 上下文给出五个石化行业相关创始人推荐的 sidekick。这两代都是去年的 AI 用法,把 group partner 的产出推到原本的 120% 到 130%。
第三代是把监督 agent 加在最上面。Tom 把这一刻称为「holy shit moment」。这不是 AI 让你多产出 30%,这是 AI 自己跑完一整个回路、自己琢磨出怎么变得更好。
只要公司里能找到一段流程符合这五层结构,把人剥离出来只做监督和兜底,就可以往这件事上无脑砸 token,公司会自己变好。
类推到产品决策。一个 agent 翻你的产品数据,找出销售漏斗里最卡的那一段,自己研究业界 best practice,自己上一个 A/B 测试跑一周,自己挑出胜出版本,自己部署。然后对你的产品反复跑这个流程。整条产品优化链路变成自我改进的回路,不用 PM 排期,不用工程师手动跑 A/B。
类推到客服。客户建议源源不断地进来,需要一个 agent 充当 CPO 加 CTO 的角色,做这种 triage 判断。这条建议跟我们的方向不一致,丢掉。这条建议跟路线图吻合,今晚就能做,写代码、部署、推给客户,全程不用人。
要意识到这种公司跟罗马军团有多么不同,最直接的方式是把同样一件事在两种结构里跑一遍。一条客户建议进入罗马军团式的公司,会经过客服、客服 leader、产品 PM、产品 leader、研发 PM、研发 leader、发布工程师 7 个人手。同样一条建议进入 AI 循环式的公司,触达 triage agent、确认匹配路线图、生成代码、跑测试、合并、部署,链路里没有人。
如果公司按这种形态搭,第一个推论是 burn tokens, not headcount。烧 token,不要烧人头。
YC 看到的一个数据点是,跑到 Demo Day 的批次公司,人均收入比 18 个月前高大约 5 倍。Tom 判断这个趋势会延续到 A 轮、B 轮。瓶颈很快就会从 headcount 变成 token 用量。
最粗暴的衡量办法就是看每个人的 token 用量。这个指标做到极致肯定会被刷数据,做成跟升降挂钩的排行榜更是必然出问题。但方向上它是合理的。我们现在还在「这玩意能干什么」的探索阶段,每个人都该把实验拉到最满。在这个阶段,搞清楚公司里谁在 token maxing、谁没在 token maxing,可以决定你的时间应该花在哪些员工身上。
第二个推论是中层管理结束了。「协同」这件事不需要中层做,AI 来做就行。Tom 把 Jack Dorsey 那个三角色的框架删掉了第三个,留下两个对他来说重要的。
一是所有人都得是 IC、builder、operator。二是每件事都必须有 DRI (directly responsible individual),必须是一个具名的人,不是委员会,不是一群人,就是一个具体的人。
公司可以靠 IC 这一层撑起来。中层这层就到此为止。
要让一家公司变成 AI 循环结构,前提是这家公司对 AI 是「可读」(legible to AI) 的。可读这件事的核心规则只有一句。被记录下来的事情,对 AI 来说才算发生过。没被记录下来的事情,对你的 AI 就等于没发生过。
YC 的实践是这样的。所有合伙人邮件入库,你给任何一位 YC 合伙人发邮件,这封邮件就进了 YC 的数据库。过去三四个月开始录所有 Slack 消息、DM、office hour 录音。
Tom 在演讲现场举了一个反思。刚才他在场外跟几位创始人聊得很好,但每聊一次他心里就在喊「卧槽,这段我应该录下来」。其中一位创始人请他做某个介绍,他当场答应,转头已经记不清要介绍给谁。他对自己的解决方案是手机录音、随身录音夹、智能眼镜,再不行就把每个房间装上麦克风。
录下来只是第一步,下一步是 diarization。不能把 10 万小时的录音原封不动地塞进 context window,必须先做说话人分离、压缩、提炼,再把面包屑式的索引喂给 AI。
YC user manual 的重生是这套方法的一次小型 demo。现有版本大部分是 5 到 10 年前写的,内容已经过时。上周末 Haj 想了一下,过去三个月录了大约 2000 小时 office hour,能不能用这些录音直接重新生成手册。给一组指令,做 diarization 拆出说话人,按主题归类(融资、招人、联创纠纷之类),然后让模型写一本新手册。
到周末结束 Haj 拿到了一本 150 页的新手册,比旧版好得多。配套机制是每月更新一次,每条新建议跟现有手册比对,要么吸收进去,要么丢掉。这本手册变成了一个一直保鲜的活脑。
把这本活脑作为 context 喂给一个 AI agent,相当于一次性获得 16 位 YC 合伙人的合集智慧。前提是它得对机器可读。所以一切都要被记录下来。
第三个推论是每个职能都可以即时生成自己用的 on-demand software。Tom 在幻灯片上原本写的是「dashboard」,但这件事不止于 dashboard。Codex 5.5 已经够强,大多数简单的内部软件、内部 dashboard 可以一次 prompt 出一个相当不错的版本。他周末用 YC 内部的几个场景试过,效果离谱。
这意味着公司的内部运营团队应该坐在「智能理解层」之上,自己生成自己的 dashboard 和工作流。这些产物当成完全一次性的来用。
底层数据要极其珍惜地存好。Gary Tan 把自己所有的邮件存成 markdown 形式,什么都不扔。但跑在数据上面的软件是消耗品。能生成就能再生成。
值钱的东西在人脑子里。这个职能是怎么跑的,YC 一场活动是怎么办出来的,路径里哪些步骤涉及判断,这些理解才是公司的资产。具体跑这场活动需要的软件,为这场活动现生一套,活动办完就扔。一两个月后模型变得更聪明,把旧软件丢掉,把最初那组指令喂回去,让模型重新生成一遍。
业务 context 和 skills 是资产,跑在上面的软件是消耗品。
如果公司的中央是这样一个由数据、邮件、DM、skills 和 knowhow 拼出来的「公司大脑」,人应该坐在哪里。Tom 给的答案是外圈。
人是这个智能跟现实世界接触的接口。人能伸进模型暂时还伸不进去的那些地方。线下会议、伦理判断、全新情境、高赌注高情绪的瞬间。比如一个创始人来 YC 找他,认真考虑跟联创分手,这种事关重大、情绪高度卷入的时刻,需要的是一个活人。
对在座大多数 YC 创业者,销售对话也是一样。接下来 20 年这件事大概率还得靠一个活人坐在房间里。所以人就站在公司大脑的外缘。
Tom 留给在座创始人一个问题。今天才开始做你的公司,你会按这种形态从零搭吗。
他自己的判断是,在座大多数公司体量都还小,没有借口不从一开始就做对。也有几位 YC 创始人正在干一件费力气的事,把已经搭好的公司推倒重建。
这个问题对正在做企业流程自动化的团队、对刚开始组建早期工程团队的创始人、对正在评估「该不该多招一个中层」的人都直接有用。再往前一步问,把「多招一个人」这个动作换成「为这个职能再做一层 AI 循环」,这两件事的成本差距在未来几个季度大概率会持续拉大。如果你的公司现在还小,这道选择题非常便宜,做错了重做也快。如果你的公司已经搭起了一整套科层结构,则要回答另一个更难的问题,重建一遍的痛苦,会不会小于继续按罗马军团跑下去的代价。
内容来源,Y Combinator 内部演讲「How to Build a Self-Improving Company with AI」,YouTube 链接 https://www.youtube.com/watch?v=X_JsIHUfUjc


