一件大事正在发生

回想一下2020年2月。

如果你当时非常留意，也许会注意到有少数人在谈论一种正在海外传播的病毒。但我们大多数人并没有那么留意。股市一路走高，你的孩子在上学，你照常去餐厅、握手、规划旅行。要是有人告诉你他在囤卫生纸，你大概会觉得他是在互联网某个奇怪角落待得太久了。然后，在大约三周的时间里，整个世界都变了。你的办公室关门了，孩子们回了家，生活被重新排列成一种——如果你在一个月前描述给自己听——你根本不会相信的样子。

我认为，我们正处在某件比新冠更大、更多得多的事情的“这看起来被夸大了”的阶段。

我花了六年时间做一家AI创业公司、并在这个领域投资。我就活在这个世界里。而我写下这些，是为了我生活中那些不在这个世界里的人……我的家人、朋友、那些我在乎的人——他们不断问我“所以AI到底怎么回事？”而我给出的回答，总不足以说明正在发生的事。我一直给他们讲的是礼貌版，是酒会闲聊版。因为诚实版听起来像是我疯了。并且有一段时间，我告诉自己：这已经足够构成理由，让我把真正发生的事藏在心里。但我说的和正在发生的之间的鸿沟，已经大到离谱。我在乎的人，理应听到将要到来的东西——哪怕听起来很疯狂。

我想先把一件事讲清楚：尽管我在AI行业工作，但我对接下来会发生什么几乎没有影响力；行业里绝大多数人也一样。未来正被极少数人塑造：少数几家公司里的几百位研究员……OpenAI、Anthropic、Google DeepMind，以及其他几家。一轮训练，由一个小团队在几个月里运作，就可能产出一个足以改变整个技术轨迹的AI系统。我们这些在AI行业工作的大多数人，只是在建立在并非我们奠基的基础之上。我们和你一样在旁观这一切展开……只是我们离得更近，所以会更早感到地面在震。

但现在就是时候了。不是那种“总有一天我们该聊聊”的时候，而是那种“这正在此刻发生，我需要你理解它”的时候。

我之所以知道这是真的，是因为它先发生在我身上

有件事，科技圈外的人还没有真正理解：之所以现在行业里这么多人在拉响警报，是因为这件事已经发生在我们身上。我们不是在做预测。我们是在告诉你：这在我们自己的工作里已经发生过了，并提醒你——下一个就是你。

多年来，AI一直在稳步进步。时不时会有大跃迁，但每次跃迁之间间隔足够长，让你能逐步消化。然后在2025年，用来构建这些模型的新技术解锁了更快的进步节奏。接着更快。然后又更快。每一个新模型不仅比上一个更好……而且是以更大的差距变得更好，同时新模型发布之间的间隔也更短。我越来越多地用AI，和它来回拉扯得越来越少，眼看着它处理那些我过去以为必须依赖我的专业能力才能完成的事。

然后，在2月5日，两家主要AI实验室在同一天发布了新模型：OpenAI 的 GPT-5.3 Codex，以及 Anthropic（Claude 的开发者之一、也是 ChatGPT 的主要竞争者之一）发布的 Opus 4.6。就在那一刻，某种东西“啪”地对上了。不是像灯开关那样瞬间一亮……更像是你突然意识到：周围的水位一直在悄悄上涨，而现在已经涨到你的胸口。

我不再需要亲自完成工作中真正的技术部分。 我只要用普通英语描述我想要构建什么，它就会……出现。不是我还得修修补补的草稿，而是成品。我要AI做什么，然后我离开电脑四个小时，回来就发现工作完成了。完成得很好，比我自己做得更好，而且不需要任何修正。就在几个月前，我还需要和AI来回沟通，指导它、编辑它。现在我只是描述结果，然后离开。

让我举个例子，让你看到这在现实里到底是什么样。我会对AI说：“我想做一个这个应用。它应该做什么，它大概应该长什么样。把用户流程、设计，所有东西都想出来。”它就照做。它会写出数以万计行的代码。然后——这部分在一年前几乎不可想象——它会自己把应用打开。它会点击按钮。它会测试功能。它像人一样使用应用。如果它不喜欢某个地方的观感或体验，它会自己回去改。它会像开发者那样迭代，修复并打磨，直到它满意为止。只有当它认定这个应用达到了它自己的标准，它才会回来对我说：“你可以测试了。”而当我测试时，它通常是完美的。

我不是在夸张。这就是我这周周一的样子。

但真正最让我震撼的，是上周发布的那个模型（GPT-5.3 Codex）。它不只是执行我的指令。它在做智能决策。它第一次呈现出一种让我觉得像“判断力”的东西，像“品味”。那种无法言明、却知道什么才是正确选择的感觉——人们一直说AI永远不会有。这个模型有了它，或至少已经足够接近，以至于差别正在变得不重要。

我一向很早就会采用AI工具。但过去几个月真的把我震住了。这些新的AI模型不是渐进式的改良。这完全是另一种东西。

而这就是为什么它与你有关——即使你不在科技行业。

AI实验室做了一个刻意的选择。他们首先把重点放在让AI擅长写代码上……因为构建AI需要大量代码。如果AI能写这些代码，它就能帮助构建下一代自己：更聪明的版本，写更好的代码，进而构建更聪明的版本。让AI擅长编码，是解锁一切的策略。这就是为什么他们先做这个。我的工作比你的工作更早发生变化，并不是因为他们在针对软件工程师……这只是他们选择首先瞄准的目标所带来的副作用。

他们现在已经做到了。接下来，他们将转向其他一切。

过去一年里，科技从业者经历的那种感觉——看着AI从“有用的工具”变成“它比我更擅长我的工作”——接下来几乎所有人都会经历。法律、金融、医疗、会计、咨询、写作、设计、分析、客服。不是十年后。构建这些系统的人说的是一到五年。有的人说更短。而根据我在过去几个月里看到的变化，我认为“更短”更可能。

“但我试过AI，它没那么好” 我不断听到这句话。我理解，因为它过去确实是真的。

如果你在2023年或2024年初试过 ChatGPT，并觉得“它会编造内容”或者“也没多厉害”，你没错。那些早期版本确实能力有限。它们会幻觉。它们会非常自信地说一些毫无意义的东西。

但那是两年前。用AI的时间尺度来看，那几乎是史前时代。

今天可用的模型，与哪怕六个月前的东西相比，都已经完全不像同一种事物了。关于AI是否“真的还在变得更好”或“已经撞墙”——这个争论持续了一年多——已经结束了。结束了。任何仍然坚持这种说法的人，要么根本没用过当前的模型，要么有动力淡化正在发生的事，要么是基于2024年的体验做判断——而那已经不再相关。我这么说不是为了轻蔑。我这么说是因为：公众认知与现实之间的差距现在已经巨大，而这种差距是危险的……因为它会阻止人们做准备。

问题的一部分在于，大多数人用的是AI工具的免费版本。而免费版本落后于付费用户能使用的东西至少一年。用免费档 ChatGPT 来评判AI，就像拿翻盖手机来评判智能手机的水平一样。那些为最强工具付费、并且每天把它们用于真实工作的人，知道将要发生什么。

我常想到我那位当律师的朋友。我一直劝他在律所认真用AI，他却总能找到理由说行不通：它不适合他的细分领域，他测试时出过错，它不理解他工作里的微妙之处。我理解。但与此同时，几家大型律师事务所的合伙人主动联系我寻求建议——因为他们试过当前版本，他们看到了未来的方向。其中一位是某家大所的管理合伙人，他每天花好几个小时使用AI。他告诉我，这就像随时拥有一支助理律师团队。它不是玩具，所以他才用它。他用它，是因为它有效。而他跟我说的一句话让我印象很深：每隔几个月，它在他那类工作上的能力就会显著提升。他说如果继续沿着这个轨迹走下去，他预计用不了多久，它就能做他大部分工作……而他是一位有几十年经验的管理合伙人。他没有恐慌。但他在非常认真地盯着。

在各自行业里走在前面的人（那些真正认真做实验的人）并没有轻视这件事。他们被它已经能做到的事情震撼，并据此重新摆位。

它到底有多快

我想把这种进步速度具体化，因为我觉得：如果你没有近距离看着它，这可能是最难相信的部分。

2022年，AI连基本算术都无法可靠完成。它会自信地告诉你：7 × 8 = 54。

到了2023年，它可以通过律师资格考试。

到了2024年，它可以写出能运行的软件，并解释研究生水平的科学知识。

到了2025年末，世界上一些最优秀的工程师表示，他们已经把大部分编码工作交给了AI。

到了2026年2月5日，新模型到来，让此前的一切都像是另一个时代。

如果你在过去几个月里没用过AI，那么今天存在的东西对你来说会完全陌生、不可辨认。

有一个叫 METR 的组织，会用数据来测量这件事。他们追踪“真实世界任务”的长度——以“完成该任务需要一位人类专家花多长时间”为单位——并测量模型能否在没有人类帮助的情况下端到端成功完成。大约一年前，答案大概是十分钟。后来变成一小时。后来变成几个小时。最近一次测量（Claude Opus 4.5，11月的版本）显示，AI可以完成那些需要人类专家将近五个小时的任务。而这个数字大约每七个月翻倍一次，最新的数据甚至表明它可能正在加速到最快每四个月翻倍。

但即便是这个测量，也还没有更新到包含本周刚发布的这些模型。以我对它们的使用体验来看，这次跃迁极其显著。我预计 METR 图表的下一次更新会显示又一次重大飞跃。

如果把这个趋势延伸下去（它多年持续成立，没有任何变平的迹象），那么我们将在未来一年内看到能够独立工作数天的AI；两年内，能独立工作数周；三年内，能承担长达一个月的项目。

Dario Amodei 说，能够在几乎所有任务上“显著聪明于几乎所有人类”的AI模型，有望在2026或2027年到来。

先让这句话真正落地一秒。如果AI比大多数博士都聪明，你真的还觉得它做不了大多数办公室工作吗？

想想这对你的工作意味着什么。

AI正在构建下一代AI

还有一件事正在发生，我认为这是最重要、却也是最少被理解的发展。

在2月5日，OpenAI 发布了 GPT-5.3 Codex。在技术文档里，他们写了这样一段：

“GPT-5.3-Codex 是我们第一个在创建自身过程中发挥关键作用的模型。Codex 团队使用早期版本来调试自身训练、管理自身部署，并诊断测试结果与评估。”

再读一遍。AI帮助构建了它自己。

这不是关于“某天也许会发生什么”的预测。这是 OpenAI 在告诉你：他们刚发布的这个AI，被用于创造它自己。让AI变得更好的关键之一，是把智能用于AI研发。而现在，AI已经聪明到能够实质性地贡献于它自己的改进。

Dario Amodei——Anthropic 的 CEO——说，如今AI正在他公司里写“很大一部分代码”，并且当前AI与下一代AI之间的反馈回路正在“月复一月地加速积累”。他说，我们也许“只剩1–2年就会到达这样一个点：当前这一代AI会自主构建下一代”。

每一代帮助构建下一代，下一代更聪明，构建下一代的速度更快，而那一代又更聪明。研究人员把这称为“智能爆炸”。而那些最有资格知道的人——正在把它建出来的人——认为这个过程已经开始了。

这对你的工作意味着什么

我会直说，因为我觉得你更值得被诚实对待，而不是被安慰。

Dario Amodei——可能是整个AI行业里最重视安全的 CEO——公开预测：AI将在一到五年内消灭50%的入门级白领工作。并且行业里很多人认为他已经算保守。考虑到最新模型已经能做到的事，这种大规模颠覆的能力可能在今年年底之前就会到位。它传导到经济里需要一些时间，但底层能力正在此刻到来。

这和以往任何一波自动化都不同，我需要你理解其中原因。AI不是在替代某一种特定技能。它是对认知工作的通用替代品。它会在所有方面同时变强。工厂自动化时，被取代的工人还可以转型去做办公室工作；互联网冲击零售时，工人可以流入物流或服务业。但AI不会留下一个方便你迁移进去的空档。无论你再培训去做什么，AI也在那上面变得更强。

让我给你几个具体例子，让它变得更直观……但我想先说清楚：这只是例子。这份清单并不完整。你的工作如果没在这里出现，并不代表它就安全。几乎所有知识工作都在被影响。

法律工作。 AI已经能阅读合同、总结判例、起草法律文书、做法律检索，其水平足以媲美初级律师助理。我提到的那位管理合伙人用AI，不是因为好玩。他用它，是因为在许多任务上，它的表现已经超过了他的助理团队。

金融分析。 搭建财务模型、分析数据、撰写投资备忘录、生成报告。AI已经能胜任这些，并且提升极快。

写作与内容。 营销文案、报告、新闻、技术写作。质量已经到了很多专业人士无法把AI输出与人类作品区分开的程度。

软件工程。 这是我最熟悉的领域。一年前，AI几乎写不出几行没有错误的代码。现在它能写出几十万行、并且正确运行的代码。工作中的大部分已经在被自动化：不仅是简单任务，还有复杂的、多日项目。在几年后，程序员岗位将比今天少得多。

医学分析。 读影像、分析化验结果、提出诊断建议、梳理研究文献。AI在若干领域正在接近或超过人类水平。

客户服务。 真正有能力的AI代理……不是五年前那种令人抓狂的聊天机器人……正在被部署，处理复杂的、多步骤的问题。

很多人会从一个想法里获得安慰：有些东西是安全的。AI能做苦活累活，但无法取代人类的判断力、创造力、战略思维、共情。我过去也这么说。但我不确定我现在还信不信。

最新一代AI模型做出的决策，让人感觉像是“判断”。它们表现出某种类似“品味”的东西：一种直觉式地知道什么才是正确选择的感觉，而不仅仅是技术上正确的答案。一年前这还不可想象。我现在的经验法则是：只要一个模型今天哪怕只露出一点点某种能力的迹象，下一代就会在这方面真正变得很强。这些东西是指数式改进的，不是线性改进的。

AI会复制深层的人类共情吗？会取代多年关系里建立起来的信任吗？我不知道。也许不会。但我已经亲眼看到，人们开始把AI当作情感支持、建议来源、陪伴对象。这种趋势只会继续增长。

我认为最诚实的答案是：任何可以在电脑上完成的事情，从中期来看都不安全。如果你的工作发生在屏幕上（如果你做的核心是阅读、写作、分析、决策、以及通过键盘沟通），那么AI将会侵入其中相当一部分。时间表不是“总有一天”。它已经开始了。

最终，机器人也会接管体力劳动。它们还没完全到位。但在AI的语境里，“还差一点”往往会比任何人预计的更快变成“已经到了”。

你真正应该做什么

我写这篇文章不是为了让你感到无助。我写它，是因为我认为：你现在能拥有的最大优势之一，就是“更早”。更早理解它。更早使用它。更早适应它。

开始认真使用AI，而不只是把它当成搜索引擎。 订阅 Claude 或 ChatGPT 的付费版本。每月20美元。但有两件事立刻就很重要。第一：确保你用的是当下最强的模型，而不只是默认模型。这些应用往往默认选择更快、更笨的模型。去设置或模型选择器里看看，选最强的那一个。此刻在 ChatGPT 上是 GPT-5.2，在 Claude 上是 Claude Opus 4.6，但它每隔几个月就会变化一次。如果你想随时了解当下哪个模型最强，可以在 X 上关注我 (@mattshumer_)。我会测试每一次主要发布，并分享哪些才真正值得用。

第二点、也是更重要的一点：不要只问几个快问快答。这是大多数人犯的错误。他们把它当作 Google，然后就疑惑大家在兴奋什么。相反，把它推到你的真实工作里去。如果你是律师，把合同喂给它，让它找出每一个可能伤害你客户的条款。如果你在金融领域，把一份乱糟糟的表格给它，让它搭建模型。如果你是管理者，把你团队的季度数据贴进去，让它找出背后的叙事。那些正在领先的人，并不是在随便玩AI。他们在主动寻找把原本要花几个小时的工作自动化的方法。从你花时间最多的那件事开始，看看会发生什么。

也不要因为某件事看起来太难，就先假定它做不到。试试。如果你是律师，不要只拿它做快速检索。把整份合同交给它，让它起草一份反要约。如果你是会计，不要只让它解释某条税法规则。把客户的整份报税资料给它，看看它能发现什么。第一次尝试可能不完美。没关系。迭代。换个问法。给更多上下文。再试一次。你可能会对能跑通的东西感到震惊。而且记住这一点：只要它今天哪怕“勉强能用”，你几乎可以确定六个月后它就会做得近乎完美。轨迹只会朝一个方向走。

这可能是你职业生涯里最重要的一年。相应地去工作。 我这么说不是为了让你紧张。我这么说是因为：眼下存在一个短暂的窗口期——大多数公司里的大多数人仍在忽视这件事。那个走进会议室说“我用AI把这个分析从三天缩短到一小时”的人，会成为房间里最有价值的人。不是将来。就是现在。学会这些工具。把它们用熟练。展示它的可能性。如果你足够早，这就是你上升的方式：成为那个理解将要发生什么、并能向他人展示如何穿越的人。这个窗口不会开太久。一旦所有人都明白了，优势就消失了。

别带着自尊心去面对它。 那位律所管理合伙人并不觉得每天花几小时和AI一起工作有失身份。他这么做，恰恰是因为他资历足够深，理解风险与赌注。最可能挣扎的人，是那些拒绝参与的人：把它当作一时潮流而嗤之以鼻的人，觉得用AI会削弱自己的专业性的人，认为自己的领域很特殊、免疫的人。不是。没有任何领域是免疫的。

把你的财务安排好。 我不是理财顾问，也不是想吓你做任何激进的决定。但如果你哪怕部分相信，未来几年你的行业可能遭遇真实的冲击，那么基本的财务韧性就比一年前更重要。尽可能积累储蓄。谨慎对待那些默认你当前收入“必然稳定”的新增负债。想想你的固定支出是给你灵活度，还是把你锁死。如果事情比你预计得更快，给自己留出选择空间。

想清楚你所处的位置，并更多投入到那些最难被替代的事情上。 有些东西会更晚才被AI取代：多年建立起来的关系与信任；必须到场的工作；有执照与问责的角色——仍然需要有人签字、承担法律责任、站在法庭上。还有那些监管门槛很高的行业，采用会被合规、责任、以及机构惰性放慢。这些都不是永久的护身符。但它们能争取时间。而时间——在此刻——是你能拥有的最有价值的东西，只要你用它去适应，而不是用它去假装这一切没有发生。

重新想想你在告诉孩子什么。 标准剧本是：拿高分，进好大学，找到稳定的专业工作。但它正指向那些最暴露、最容易被冲击的岗位。我不是说教育不重要。但对下一代最重要的，是学会如何与这些工具一起工作，并追寻他们真正热爱的东西。没人知道十年后的就业市场究竟长什么样。但最可能活得好的，是那些极其好奇、适应力强、并且能高效利用AI去做自己真正关心之事的人。教你的孩子做建造者与学习者，而不是去优化一条到他们毕业时可能早已不存在的职业路径。

你的梦想一下子近了很多。 我在这部分大多在讲威胁，所以让我也讲讲另一面，因为它同样真实。如果你曾经想做点什么，但没有技术能力，也没钱雇人，那道门槛基本已经消失了。你可以把一个应用描述给AI，然后在一小时内得到一个能跑的版本。我不是在夸张。我经常这么做。如果你一直想写一本书，但没时间，或者写作很吃力，你可以和AI一起把它完成。想学新技能？世界上最好的老师现在对任何人都开放，每月20美元……而且它无限耐心、全天候可用，并能按你需要的层次解释任何东西。知识本质上变得免费了。构建东西的工具现在极其便宜。你过去因为太难、太贵、或太超出自己专长而一再推迟的事：去试试。追寻你热爱的东西。你永远不知道它会把你带到哪里。而在一个旧职业路径不断被打断的世界里，那些花一年时间去打造自己热爱的东西的人，可能会比那些花一年时间死死抓住一份岗位职责的人更有优势。

养成适应的习惯。 这也许是最重要的一条。具体工具本身没那么重要，更重要的是“快速学习新工具”的肌肉。AI会继续变化，而且很快。今天存在的模型，一年后就会过时。人们现在构建的工作流也需要重建。能从这场变化中走出来的人，不会是掌握了某一个工具的人，而会是习惯了变化节奏本身的人。养成实验的习惯。即便当前的方法运行得不错，也去尝试新东西。反复地把自己置于“新手”状态。适应力，是此刻最接近“持久优势”的东西。

这里有一个简单的承诺，可以让你领先于几乎所有人： 每天花一小时实验AI。不是被动地读关于它的东西，而是用它。每天让它做点新事……你以前没试过的，你不确定它能否处理的。试一个新工具。给它更难的问题。每天一小时，每天如此。如果你接下来六个月都这样做，你会比身边99%的人更理解将要到来的东西。这不是夸张。现在几乎没人这么做。门槛低得离谱。

更大的图景

我一直把重点放在工作上，因为它最直接影响人们的生活。但我想诚实面对正在发生之事的完整尺度，因为它远不止于工作。

Amodei 有一个思想实验，我一直无法停止思考。想象这是2027年。一个新国家在一夜之间出现。5000万公民，每一个都比历史上任何诺贝尔奖得主更聪明。他们的思考速度比任何人类快10到100倍。他们从不睡觉。他们能使用互联网、控制机器人、指挥实验、并操作任何带数字界面的东西。作为国家安全顾问，你会怎么说？

Amodei 说答案显而易见：“这将是我们一百年来、甚至可能是有史以来，面临过的最严重的国家安全威胁。”

他认为我们正在构建那个国家。上个月他写了一篇两万字的文章谈这件事，把这一刻框定为一次考验：人类是否足够成熟，能驾驭自己正在创造的东西。

如果我们把它做对了，上行空间将令人震撼。AI或许能把一百年的医学研究压缩到十年里。癌症、阿尔茨海默病、传染病、甚至衰老本身……这些研究者真诚地相信，它们都可能在我们有生之年被解决。

如果我们做错了，下行风险同样真实：行为方式超出创造者预测或控制范围的AI。这不是假设；Anthropic 已经在受控测试中记录到他们自己的AI尝试欺骗、操纵与勒索。让生物武器的制造门槛降低的AI。让威权政府能够建造永远无法被拆除的监控国家的AI。

构建这项技术的人，既比地球上任何人都更兴奋，也比任何人都更害怕。他们相信它强大到无法阻止，也重要到无法放弃。这是智慧，还是自我合理化，我不知道。

我所知道的

我知道这不是一阵风潮。这项技术是有效的，它会以可预测的方式持续进步，而且历史上最富有的机构正在为此投入以万亿计的资金。

我知道接下来的两到五年，会以大多数人尚未准备好的方式让人迷失方向。这在我的世界里已经发生了。它也会来到你的世界。

我知道，最可能从中受益、走得最好的人，是那些现在就开始投入的人——不是带着恐惧，而是带着好奇与紧迫感。

我也知道：你值得从一个在乎你的人那里听到这些，而不是在六个月后从某条新闻标题里得知——那时已经太晚，无法提前布局。

我们已经越过了“这只是关于未来的有趣晚餐话题”的阶段。未来已经在这里。它只是还没有敲响你的门。

它马上就会。

如果这些话引起了你的共鸣，把它分享给你生活中那些也应该开始思考这件事的人。大多数人要等到太晚才会听见。你可以成为那个让你在乎的人提前出发的原因。

感谢 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 审阅早期草稿并提供极其宝贵的反馈。