Satya Nadella 谈全栈建造者：让生态而非单一模型成为护城河

微软 CEO 拆解 AI 时代的平台逻辑：私有 eval 才是新 IP，通才是最大杠杆。

核心要点

生态即护城河：Nadella 把本届 Build 定位为"生态打法"而非单一模型，平台的价值在于它能在自身之外创造多少价值，让任何公司都能成为"第一方参与者"。
私有 eval 是新 IP：判断你是否掌控局面的试金石，是能否在不泄露 traces 的前提下把模型 A 换成模型 B 并继续优化；能就掌控，不能就被锁定。
2 年自建前沿模型：微软 MAI 系列强调从预训练开始的干净 lineage；一个 5B 推理模型靠 scaffold 爬坡能超越 GPT-5 级表现。
Harness 闭环：模型+数据+工具构成企业级闭环，微软用统一的 GitHub harness 跑遍所有产品线，且对开放 harness 开放接入。
Agent 应进资产负债表：人力资本的隐性知识从来无法上表，但 agent 在时间中积累的 traces 能捕获它，因此可以入表。
15 个月超 15 年：Azure 网络团队靠把工作"meta 化"（造一个建网络的 agentic 系统，代号 Miles），15 个月建的容量超过去 15 年总和——"我们不要 headcount，我们要 tokens"。
通才的黄金时代：LinkedIn 已结构性出现 full-stack builder 新岗位；未来工程角色或收敛为 agent 管理者、FDE、安全与大规模基建四类。

Satya Nadella 谈全栈建造者：让生态而非单一模型成为护城河信息图 — 一图速览本期内容（点击查看大图）

章节时间轴

1:33 开场:Build 之后的最大反思 — Nadella 把整场发布定调为"生态 play"而非单一模型或平台。
3:05 MAI 模型与训练策略 — 干净 lineage、hill-climbing scaffold、temporal 前沿:用 GPT-5 收 traces 再用 5B 推理模型超越。
7:44 最具价值的用例 — 编码好到要重建 IDE(100 个 agent 会话需要 canvas);autopilot/glue work 的放大。
9:15 企业的 harness 是什么 — 模型+数据+工具的闭环;多模型开放 harness 与 mdash 的存在性证明。
11:36 平台承诺与开发者价值捕获 — 这一代网络效应靠少量数据学习;private eval 成最大 IP 与"掌控"试金石。
15:26 新 IP:从人的工龄到 agent 经验 — company veteran agent 入资产负债表的设想。
17:45 SAS 的存废与解绑重绑 — 数据模型/业务逻辑依然珍贵;M365 work IQ 把"沉睡数据库"激活。
21:37 定价模型之争 — per-user / consumption / outcome 各有时空;GitHub 加上 consumption 计费。
23:58 SAS 的耐久性与"agent 狂欢" — 自建 vs 采购的边际成本框架;要走完一个完整预算周期才见均衡。
25:31 Nadella 自己在造什么 — 全栈能力下沉到 CEO;一周内搭出 work IQ + Foundry 长运行的 chief-of-staff autopilot。
27:51 工程角色的未来与通才杠杆 — full-stack builder、基础设施科学、RLE;通才是最大杠杆,"idea people"的黄金时代。
30:58 组织雄心与"meta work" — Azure 网络团队把工作 meta 化的故事;把不可能变为可能。
34:01 数据中心建设与社会许可 — 规模空前;必须在社区交付能源、就业、税基等真实利益。
37:54 社会影响与最乐观的更新 — 让每个人成为第一方参与者;健康、财富创造、教育的机会与挑战。

详细内容

一、从"单一模型"到"生态":平台的定义之争

被问到三小时 Build 演讲后最重要的反思,Nadella 给出的第一个判断就是:应该把当下这一切"概念化为生态打法,而非单一模型甚至单一平台之争"。这是贯穿全场的母题。他从在微软经历过四次重大平台变迁的视角出发,给出他对平台的定义:一个平台的价值,在于它能在自身之外创造多少价值,而非它自己捕获了多少价值。

由此推出这次 Build 主旨演讲想回答的问题:任何公司——无论是 AI 原生公司还是传统企业——如何作为"第一方参与者"(first-class participant)参与进来,能指着"自己创造的 AI"说话。Nadella 明确这不是说企业不用别人的 AI(当然会用),而是要给出路径、配方、堆栈和工具——"这就是我们的活儿"。

Elad 顺势点出生态战略的复杂性:你既要自建组件、又要为某些组件做合作伙伴、还要支持他们。这正是后文 harness、定价、SAS 存废等所有讨论的底层张力来源。

二、MAI 模型、干净 lineage 与"时间维度的前沿"

关于自研模型 MAI,Nadella 的关键词是"干净的 lineage"。他解释当下构建干净 lineage 的模型反而更难了——因为外部"东西太多",必须真正 ablate 掉才能得到一个优秀的预训练模型。他借此批评很多开放权重模型:"在一两个 benchmark 上看着很棒,但实战不行。"这是嘉宾本人的鲜明观点。

他进一步引出"认知核心"(cognitive core)的概念:从干净 lineage 出发,再为公司创造"不只是当通才、而是打造自己的专才"的能力——围绕模型建一个 hill-climbing scaffold,然后开始做 RL、收集 traces,最重要的是拥有 private eval。他坦言"外面所有的 eval 都有趣但已不关键,因为它们都能被刷满",所以每家公司都要有自己的私有 eval。

Nadella 还抛出一个新颖视角——给前沿"加上时间性"(temporality):在 Land O'Lakes 的 demo 里,他们用 GPT-5 级别模型先收集一批 traces,再用一个 5B 推理模型达到更高表现。这意味着"在前沿运作"不只是用最大的模型,还可以是这种 teacher→student 的时序蒸馏。Sarah 据此恭喜他"两年内在微软内部建出了一个前沿新实验室"。

三、最有价值的用例:从编码到 autopilot 的 glue work

被问到除编码外哪些用例创造了最大价值,Nadella 先承认编码确实大规模见效,但话锋一转抛出一个有意思的悖论:编码好用到了"必须重建 IDE"的地步——"我有 100 个 agent 会话,转嫁回我这个人类身上的认知负荷太大了",而且"把聊天作为唯一产物也不可能",所以需要 canvas。这说明即便在全 agentic 世界里,软件和 UI 依然不可或缺,连写代码都需要。

更大的机会在 glue work。他用 co-work、autopilot、Claude 的工作举例:大量人力资本其实在做"胶水活儿",一旦用长运行、持久的 tokens/agents 去增强它,你处理判断和胶水活儿的能力就会像编码一样被放大。他预言"六个月后我们都会说,哇,整夜这些 autopilot 用我授予的权限(delegated authority)、以我的身份做了一堆活儿",而这又会催生新需求:需要一个新的"AD"(类比 Active Directory 的身份/审计层)来回答"它到底做了什么、是不是我做的"。

四、企业的 harness:模型 + 数据 + 工具的闭环

Elad 把开发者围绕编码 agent 搭建的"harness/环境/上下文"概念抛给企业场景:企业有没有等价物?Nadella 给出明确架构:harness 定义模型、数据和工具,让这三者形成一个 loop。微软确保自己每个产品——GitHub Copilot、安全 copilot、mdash、科研 discovery——都是"多模型 harness",带工具访问,并能对工具做"渐进式披露"(progressive disclosure)以节省 token。

他强调过去两年学到的最硬的一课:"准备 context 层所需的工作量大得吓人",而让计划以最高效方式执行的魔法恰恰在这一层。微软的做法是用统一的 GitHub harness 跑遍所有产品,且在 Foundry 中开放——你可以用自己的 llama harness 或任意开放 harness,接入自己的工具、多个模型和上下文。

最有力的论据是 mdash:行业里一种流行说法是"只有把 harness+工具+模型一起训练才能得到好 eval",而微软用 mdash 上线即发现了 Mythos 未发现的漏洞/bug,作为"多模型 harness 在真实世界反而更强"的存在性证明。Sarah 据此提出微软的"第三幕":从操作系统公司、到云公司,如今或许是"harness/eval 公司"——平台承诺就是"在我们这儿,你能用你的数据获得你的前沿智能"。

五、新 IP:private eval、掌控的试金石,与 agent 入资产负债表

这一节是嘉宾观点最锋利的部分。Nadella 解释这一代的网络效应不同:智能从数据中学习,而且"不是靠海量数据,而是看几个样本就能理解某事物的新颖之处"。因此游戏的关键变成"如何保护",而每家公司拥有 private eval 可能就是最大的 IP。

他给出极具操作性的"掌控试金石":你有一个私有 eval,正用模型 A,能否切换到模型 B 并继续 hill-climb?能,你就掌控局面;不能,你就不掌控。正因如此,harness 的选择也变得至关重要——要用开放 harness、让所有模型进来,用你的 eval、上下文、工具帮你 hill-climb。这是 AI 原生创业公司、SAS 公司、每个企业都需要的技能。

Elad 进一步追问"公司 IP 从人的工龄经验,转变为应用 agent 的经验"这一观点。Nadella 展开:每家公司都会同时拥有人力资本(人类发现处处存在的 gap 的能力依然超有价值)和 token capital,问题是如何让两者复利。在 Teams 里,一堆 agent 和一堆人在干活,它们之间的 traces 就是该企业如何创造价值的重要 context——拿这个去训练的不是通才模型,而是"company veteran agent"。他大胆主张这种 agent 应该进资产负债表:人力资本从来无法上表(无法捕获隐性知识),但 agent 通过时间、通过 traces 学到了 tacit knowledge,所以可以上表。Sarah 打趣"SEC 得为 token 专长制定会计准则了"。

六、SAS 的解绑重绑、M365 的"沉睡数据库",与定价之争

面对"软件终结论"(workflow 现在很便宜就能生成),Nadella 拆解了 SAS 二十年来的三层结构:数据模型(schema 化业务流程)、业务逻辑、加一点配置、再加 UI。他认为现在可以"重新审判"这套垂直堆叠,但底层数据模型依然超好、不必重造——"我的总账就该是个总账,不需要新建 schema";业务逻辑同理,PowerBI 仪表盘底下是有人花功夫做出的丰富语义模型,这是你想喂给 agent 的。所以挑战在于:过去用一种方式打包,现在要学会解绑、再以新方式重绑,发现新的商业模式。

一个绝佳案例是 M365 的 work IQ。微软发现历史会重演:当年先卖 Exchange、SharePoint、Lync server,以为都会迁云,结果"云上用 server 的人多了 10 倍、100 倍",因为人们买的是订阅而非 server。如今 work IQ 把"公司里最重要却从未被当作数据库使用的数据库"暴露了出来——过去它只被邮件、Teams、Word、Excel、PowerPoint、SharePoint 这些 app 私有占用。Nadella 给的演示场景很具体:他去一个 GitHub repo 说"我上周开了几个跟这个 repo 相关的设计会,能不能把它们都抓取出来、告诉我该改什么",系统就能去看所有会议记录、回来给出改代码库的计划。但这也意味着 M365 上的 agent 用量可能超过终端用户,且必须重构架构——"服务一个收件箱用的东西,不能用来服务一个 agent"。

定价上,Nadella 不相信任何领域有"永久商业模式"。他剖析 per-user 定价本质是"需要预算确定性的产物"——per-user 不过是一组使用权限。演化路径是:先把一些用量打包进 per-user 套餐卖订阅;下一个大事是 consumption;再之后有人会说"我连订阅和消费都不想付,只为 outcome 付费"。但他给了一句金句式提醒:"大多数人爱 outcome 定价,直到他们真有了一个 outcome"——届时像分掉版税一样肉痛,又会要回 per-user 和 consumption。现实印证:GitHub Copilot 最初按 per-user 设计,是在还没理解 agent 使用强度时(那时是开发者交互式用 code complete),如今"我启动一万个 agent 整天跑",所以微软最近给 GitHub 加上了 consumption 计量——"永远会有 per-user,但必须再加一个 consumption meter"。

七、SAS 的耐久性与"agent 狂欢"后的回归

Elad 观察到企业内部出现"agent euphoria":有些团队兴奋到想重建大量应用、或对 SAS 供应商说"我们不跟你合作了、要自建",但六到九个月后可能会回来承认"我们没法重建所有东西"。Nadella 认为要走完"一个完整的预算周期"才能看到均衡浮现。

他给出一个可量化的框架:如果自建并维护某物的边际成本高于采购,你就应该采购——而"维护"这部分很重要。他举例:AI 会更快找出安全问题、也会逼你太快修复,当然有 coding agent 帮你,但那会烧 token,那么责任归谁?这是一个需要想透的循环。他判断行业已经过了"我能生成大量软件"的兴奋期,下一步是想清楚"我真正想生成什么软件、想从别人那里用什么软件、如何把两者组合进一个我有 agency 的 agentic workflow"。他强调对"不灵活"的供应商将几乎零容忍,但灵活、肯交付价值的供应商会回归——只是换成不同的商业模式来卖软件。

八、CEO 也能全栈、工程角色收敛,与"通才"的最大杠杆

Sarah 问 Nadella 自己最近在造什么。他先自嘲"造软件这件事如今让像我们公司 CEO 这样的无能之辈都能 build 了,谢天谢地",随后认真表示 GitHub Copilot 新会话应用让人对"以前碰不了的产物"有了 agency——他作为 CEO 都能去学一个代码库;回忆刚加入微软时,人人得去读 Cutler 的 malloc 之类来学好 C++,如今这种"上下全栈、检视/学习/查看事物"的能力强太多了(但不意味着每个人都该做同样的事)。

他最近大量在造的是 Foundry 长运行 agent / autopilot。他举上周的亲手例子:想要一个持续监控的"chief of staff autopilot"(Scout 里也会有),他对 work IQ 说"基于 work IQ 去建一个 Foundry 长运行 agent,把记忆存在 Rayfin(后端即服务)里",它就建出来了;他再说"发布到 Teams",它就真把这玩意儿发布到了 Teams——"端到端跑完一个项目,简直神奇"。

Elad 抛出工程角色收敛的假说:四五年后可能只剩四类工程师——agent 管理者、forward-deployed 工程师(FDE)、安全工程师、为少量服务做大规模基础设施的人,其余都坍缩进 agentic 世界。Nadella 说要"实验着趟过去",但印证了趋势:LinkedIn 在规模上做了结构性改变,造出一个叫 full-stack builder 的新学科——把设计、产品管理、前端工程的人拉到一起,但每个人仍保留自己的"edge"(设计的人保留设计 edge),只是不再被单一角色束缚。同时基础设施变得极关键:连 Excel 团队都发现"构建一个能学到 reward 的 RLE 是最难的基础设施问题之一",所以在曾被视为终端用户 app 的团队里也需要分布式系统人才;基础设施科学是另一类。

但他给出全场最响亮的一句:通才角色将是最令人兴奋、杠杆最高、回报最大的。当 Sarah 问他"你在写代码吗",他说自己现在是个通才——过去做知识工作是写 Word 文档、表格,如今"在同一句话里"还能 build 一个 app,通才技能获得了更高杠杆。Sarah/Elad 接梗:这是"CEO 和 VC 的福音"、"idea people 的黄金时代"——"有大量 agency 的 idea people"。

九、组织的雄心:把工作"meta 化",把不可能变为可能

Elad 引用其合伙人 Mike Renol(职业生涯始于微软)的文章:这是一个你能、也必须更有雄心的时代,因为环境节奏快、用户和公司对新技术的采纳意愿强。他半开玩笑地问一家万亿美元公司如何更有雄心。

Nadella 的答案是要建立一个"工作如何改变以追逐过去难以想象的产出"的概念模型。他引 Kevin Scott 的话:"把难事变容易是一种杠杆,但真正的雄心是把不可能变为可能。"现在各组织缺的正是"什么是过去不可能、如今能建"的新概念模型。

他给的标志性例子是 Azure 网络团队:过去 15 个月建的 Azure 容量超过前 15 年总和(还是同一支团队)。团队意识到"再这么干肯定不行,除非重新概念化我们的工作",于是他们说"我们的工作不是做 Azure 网络,而是建一个做 Azure 网络的 agentic 系统"——管理 500 多家光纤运营商、WAN、物理修复等,他们造了一个有角色名的系统叫 Miles,并喊出"我们不需要 headcount,我们需要 tokens"。这种把工作变 meta 的做法,"meta work 成了他们的新工作"。Nadella 类比:80 年代若有人说"40 亿人每天起床开始打字",我的模型会是"我们需要 40 亿打字员"——但我们做的不是打字,是知识工作。给自己许可去做新型的 meta 认知、meta 工作,改变真正重要的产出,才能把不可能变为可能,而连接这些点正是企业价值的来源。

十、数据中心建设、社会许可与对社会影响的更新

转到数据中心,Nadella 承认建设规模空前("从未有过这样的事")。但他更强调另一面:除非整个行业"非常有原则地确保我们谈论的这些好处在社区层面被真实感受到",否则做不下去。他列举必须做实的事:让人们看到能源价格不升反降(因为长期会有更好的电网、更多能源)、水被补充(闭环系统)、培训、就业、税基——尤其最少被谈及的建设期与建成后创造的就业。"如果做到了,我们就有许可;做不到,就没有,就这么简单。"他认为社区抱有怀疑、提出尖锐问题是好事,行业要做苦活去赢得它。他相信人类历史上,"用大量能源同时为社会创造大量价值"的故事都很精彩;若 token 经济能驱动生产力、经济增长、广泛参与、更好的健康结果,就会落到好结局。

Sarah 提到 ROI 或许在社区比在企业更易先看到;Nadella 认为两边最终会合流——社区里被雇佣的人是真实经济的参与者,市场力量会把点连起来,关键是要能看到证据、且不能只关乎某一家公司,而要是广泛的经济增长和广泛的社区许可。

被问到对 AI 社会影响"更新最大"的认知,Nadella 回到全场起点:必须讲好故事并做实——让每个人都有真正的机会作为第一方参与者进入新经济。他说未来 12~18 个月需要让人们说出"哦,我懂了",亲眼看到健康结果、创业能力、把本地小店经营得更高效等好处正在发生。他最大的更新是:世界会非常怀疑那些说"相信我们,我们搞定了,未来会很辉煌"的科技公司;你必须交付可感知的切实利益,而且为之倡导的政治家会因此赢得选举——"因为这次它对经济太重要了,不可能不是这样"。

他给出一个简单框架来理解 AI 的广泛益处:科技/创业与大公司的财富创造;医疗(他点名 Open Evidence,称当天有惊艳 demo);教育——一个"显而易见的善",但"影响还不如预期"。谈到为何教育进展慢,他说自己最近见了 Alpha School 创始人,学到很多关于"重新思考教育到底是什么"的东西;他也提到斯坦福某门 AI/CS 课程刻意确保学生学会"恰当地应用 softmax",而不是"帮我修一下训练 run"——学概念依然关键。但他认为变的是激励、credential、如何为 credential 定价、对应的就业机会,因此必须有一整套改变。他以此收尾:也许下一个大创业和成功故事,会是有人建一所新大学、或一种新的教学法(pedagogy),带人走完一套课程并找到经济机会——"这极有价值"。Sarah 评价这是个"长期感觉不可能、如今或许可能"的好结尾。

金句

真正的雄心不是把难事变容易,而是把不可能变为可能。 —— Satya Nadella(引 Kevin Scott)31:43

我们的工作不是做 Azure 网络,而是建一个做 Azure 网络的 agentic 系统……我们不需要 headcount,我们需要 tokens。 —— Satya Nadella 32:29

大多数人爱 outcome 定价,直到他们真有了一个 outcome——因为那时就像在分掉你的版税。 —— Satya Nadella 22:25

如果你有一个私有 eval,正用模型 A,能不能切到模型 B 还继续往上爬?能,你就掌控了局面;不能,你就没掌控。 —— Satya Nadella 13:09

世界会非常怀疑那些说"相信我们,我们搞定了,未来会很辉煌"的科技公司——你必须交付切实可感的利益。 —— Satya Nadella 38:41

通才技能获得了更高的杠杆,这是我们将在各处看到的——idea people 的黄金时代。 —— Satya Nadella / Sarah Guo 30:12

提到的书·产品·人物

Satya Nadella(人物):微软董事长兼 CEO,本期唯一嘉宾。
Sarah Guo / Elad Gil / Swix(人物):主持人,分别来自 No Priors 与 Latent Space。
Microsoft Build(活动):本期录制于 Build 大会现场,Nadella 刚做完约三小时发布演讲。
MAI 模型(产品):微软自研的前沿模型系列,强调干净 lineage 与 hill-climbing scaffold。
GPT-5(产品):在 Land O'Lakes demo 中用于先收集 traces,再由 5B 模型超越。
Land O'Lakes(公司/案例):temporal 前沿演示——用大模型收 traces、5B 推理模型达更高表现。
GitHub Copilot / GitHub harness / 新会话(sessions)应用(产品):统一 harness 跑遍微软产品;因 agent 用量从 per-user 加上 consumption 计费。
mdash(产品):安全相关多模型 harness,上线即发现 Mythos 未发现的漏洞,作为"多模型 harness 实战更强"的存在性证明。
Mythos(产品):被对比的安全工具,未发现 mdash 找到的漏洞。
Foundry(产品):微软 agent 平台,用于构建长运行 agent;开放接入任意 harness。
work IQ / Microsoft 365 (M365)(产品):暴露公司"沉睡的最重要数据库",支撑跨 repo 抓会议记录改代码等场景。
PowerBI(产品):举例说明 SAS 业务逻辑(底层语义模型)的持久价值。
Exchange / SharePoint / Lync server / Teams / Word / Excel / PowerPoint(产品):说明 server→云订阅用量 10x/100x 的历史类比,及被 work IQ 激活的数据来源。
Scout(产品):微软将提供的 chief-of-staff autopilot 能力。
Rayfin(产品):被用作长运行 agent 的后端即服务来存储记忆。
Active Directory(AD,语境化引用)(产品/概念):类比未来需要新的身份/审计层来记录 agent 以委派权限做了什么。
Jensen Huang / NVIDIA / CUDA / DirectX(DX)(人物/公司/技术):平台之上他人构建价值的类比,Nadella 自嘲在 DX 与 CUDA 上"吃了亏"。
Adobe / Autodesk(Windows 生态)(公司):平台被他人扩展并构建自身价值的历史例子。
LinkedIn(公司):结构性地造出 "full-stack builder" 新工程学科。
Kevin Scott(人物):微软 CTO,"把不可能变为可能"金句来源。
Mike Renol(人物):Elad 的合伙人,职业生涯始于微软,写了关于"更有雄心的时代"的文章。
Open Evidence(公司):医疗 AI 公司,被举为当天惊艳 demo / 价值落地的例子。
Alpha School(公司):Nadella 近期会见其创始人,讨论重新思考教育的形态。
Stanford AI/CS 课程(机构/案例):刻意确保学生学会"恰当应用 softmax"等概念,论证学概念依然关键。
No Priors / Latent Space(产品/播客):两档联合制作本期的播客。

适合谁听

想看懂微软 AI 战略全貌、并思考企业如何在 agent 时代构建可持续护城河(private eval、harness、新商业模式)的创业者、产品/工程负责人与投资人。