GPT-5.4,已经把白领桌面一口吞下!1M 上下文,原生 Computer Use,Excel 直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被 AI 彻底颠覆了吗?
前天,OpenAI 发布了 GPT-5.4,震惊了整个 AI 圈。100 万 token 的上下文,「编程 + 智能体」的巨大飞跃,原生的 computer use,所有这些,都将彻底改变 AI 智能体的格局。
「GPT-5.4,将灭绝所有知识型工作!」
一位软件工程师在试用 GPT-5.4 后,发出这样的惊呼。
它爬取 Zillow 后,提取了所有旧金山的房价,在 4 分钟内,就把所有数据都导入到 Google 表格中。
几乎所有的白领工作,都能被 GPT-5.4 代替。
所有的浏览器工作,GPT-5.4 都能胜任,而且它又准又便宜!可以确信,像编程智能体那样的白领革命,马上会再发生一遍。
而且,搭载 GPT-5.4 的 ChatGPT 插件,已经可以直接在 Excel 中使用了!
在最新测试中,这一插件在投资银行基准测试中的表现,从 43.7% 大幅提升到 87.3%。用户可以直接通过自然语言完成许多原本复杂的操作。
从此,构建财务或分析模型,修正和生成复杂公式,对数据进行自然语言分析与解释,都可以靠 Excel 完成了,而且用嘴说就可以。
如果这个插件普及,Excel 将不再是一个表格工具,而是变成一个对话式的数据分析平台。
打工人的饭碗,是要被彻底颠覆了。
超越麦肯锡,GPT-5.4 暴击华尔街!取代咨询投行律所
MercorAI CEO 表示,GPT-5.4 是他们在 APEX-Agents 上测试过的最佳模型,而且,它也是首个平均分超过 50% 的模型。
一年前,前沿模型甚至无法编辑 Excel 表格,得分不到 5%。而现在,不到三个月,GPT 5.4 就已经提升了 15.7%。
当智能体的工作效率达到 50% 的时刻,这些系统就不再只是令人印象深刻的演示,而是开始成为真正的运营者。
可以肯定,ChatGPT 将很快超越最好的咨询公司、最好的投资银行和最好的律师事务所!
最惊人的还是不是头条分数,而是进步曲线依然陡峭,任务却越来越真实。
这其中最关键的洞察就在于,当你将「推理 + 编码」结合在一个模型中,就可以减少大约 80% 的开发工具间上下文切换。这,才是真正的生产力倍增器。
仅仅一年,AI 模型就从无法编辑电子表格,跃升到了能超越麦肯锡,这要比绝大多数公司更新策略方案的速度快得多!
GPT-5.4 能力超强,AI 圈震惊
GPT-5.4 的 1M 上下文,意味着什么?
这就表明,整个代码库都能一次性放到模型里,得到连贯、可靠的结果了。
无需再做分块(chunking)、无需复杂的检索(retrieval),也不必频繁压缩上下文,更不会因为上下文丢失而影响理解。
光是这一点,就可能彻底改变 AI Agent 的工作方式!
而 1M 上下文和 Computer use 的结合,让智能体能够完成多文件任务,而不丢失上下文。
AI 圈大佬 Eric Hartford 试完 GPT-5.4,评价只有一句:「理解力和解题速度,肉眼可见地飞升了。」
他出了一道硬核测试题:从零构建一个编译器。
Claude Code 直接卡住了,GPT-5.3 勉强能推进但很吃力。
而 GPT-5.4?用 Eric 的原话说 ——it just gets it。它就是懂。
OpenAI 总裁看到这条,直接秒转。
要知道,构建编译器是一个极其严格的基准,需要满足单会话、深度逻辑、紧密的反馈循环。
这些,恰恰是 GPT-5.4 的强项。
另一大 V 实测后,给 GPT-5.4 的评价是 —— 完美!
才花了大概 24 分钟,它就解决了 Minecraft 里的难题。
甚至有人发现,GPT-5.4 可以对 NES(任天堂红白机)的 ROM 进行逆向工程了!
曾经被认为牢不可破的代码壁垒正在迅速瓦解 —— 只要把 ROM 扔进去,模型就能一点点拆解程序结构、还原逻辑,甚至解释当年的汇编技巧。
那些沉睡在老卡带里的代码,正在被逐层剖开。某种意义上说,在这种能力面前,已经没有什么代码是真正安全的了!
物理学家都在挠头的题,它也能做了
逆向工程搞得定,编译器写得出,那真正的硬科学呢?
别急,物理学家已经开始坐不住了。
CritPt,一个让所有大模型现原形的「地狱级」物理基准,最近放出了最新排名。
30 家机构、50 多位一线物理研究员联手出题,71 道题全是没发表过的前沿难题,横跨 11 个物理学细分领域。
每道题平均审查超过 40 小时,答案要你输出浮点数组、符号表达式、甚至直接写 Python 函数,专门堵死「瞎蒙」这条路。
GPT-5.4 Pro(xhigh)拿下了 30.0% 的最高分,稳坐第一。GPT-5.4(xhigh)紧随其后,20.0%。第三名是 Gemini 3.1 Pro Preview,17.7%。
要知道,2025 年那些最牛的模型跑下来,大多也只有个位数的正确率。
能力的天花板被一次次捅破,而另一边的地板,正在同步塌陷。
5.7 万岗位蒸发,科技行业迎来「AI 版大萧条」
就在 GPT-5.4 发布的同一周,经济学家 Joey Politano 在 X 上甩出了一组让人倒吸凉气的数字 ——
美国科技行业上月就业人数净减 1.2 万,过去一年累计蒸发 5.7 万个岗位。
更扎心的是他的第二条补刀。
当前科技就业的萎缩程度,已经几乎追平 2024 年科技衰退最惨烈的时刻,而且比 2008 年和 2020 年的两次危机还要严重。
拉长时间线看更吓人。
从 1990 年到 2026 年的美国科技就业年同比变化图上,当前的下坠曲线从 2023 年开始一路走低,规模和持续时间上,只有一个时期能与之相比 ——2001 年互联网泡沫破裂。
但这一次,在本质上并不相同。
互联网泡沫破裂,是因为钱烧光了、商业模式不成立,那是金融层面的出清。
公司倒了,人散了,但市场还在,需求还在,缓过来就能重新上岗。
但如今,恰恰相反。头部科技公司的利润不仅没崩,反而赚得盆满钵满。
岗位消失不是因为公司倒闭,而是因为公司发现:有了 AI,它们不再需要那么多人了。
2001 年的失业者可以等市场回暖再重新上桌。2026 年的失业者面对的,是一张永远不会再给你摆上碗筷的桌子。
但诡异的一幕出现了:科技行业总就业在暴跌的同时,AI 岗位的需求反而在飙升。
也就是说,公司并没有在收缩,而是在「换人」—— 准确地说,是在换掉人。
5 个人的活,现在 1 个人加一个 AI 就能干完。省下来的 4 个人?对不起,没有 plan B。
诺奖得主警告,公司最完美的员工数量是 0
如果你觉得这只是科技行业的「内部调整」,和普通白领没什么关系,那请听听约瑟夫 · 斯蒂格利茨(Joseph Stiglitz)怎么说。
斯蒂格利茨,83 岁,诺贝尔经济学奖得主,世界银行前首席经济学家。
金融危机、全球化的空头支票、美国中产阶级的被掏空,他全程看在眼里。
如今,这位老爷子正在眼睁睁看着新的一幕上演。
在近期接受《财富》杂志的专访中,他的判断简洁而刺骨:
如果我们不对 AI 加以管理,它势必会带来更加严重的不平等。不平等本身已经是我们社会里一个极其恶劣、严重的问题,所以这让我非常担忧。
但斯蒂格利茨真正让人警醒的,不是他指出了问题,而是他指出了问题背后的机制。
技术战略家 Daniel Miessler 最近说了一句被广泛引用的话:「任何公司里最完美的人类员工数量,是零。」
刺耳吗?刺耳。
但它精准地概括了老板们的真实想法 —— 人力从来就是成本中心。
而 AI,是第一个靠谱地承诺能把人工彻底踢出局的技术。
斯蒂格利茨在 2024 年出版、近期再版的《通往自由之路》里,系统地拆解了这个链条:
AI 让企业甩掉人工、利润集中到金字塔尖,转型的风险全甩锅给工人和普通人。
而更讽刺的是,那些最积极推动 AI 的科技大佬们,同时也在高呼削减恰恰可以用来缓冲 AI 冲击的公共机构。
你的工位还在,但倒计时已经开始了
GPT-5.4 在 GDPval 上拿到 83%,CritPt 物理基准 30% 创纪录,OSWorld 电脑操作 75% 超越人类基线。
这些数字叠在一起,传递出一个信号:
AI 已经不是「未来可能替代白领」,而是「正在替代白领」。
然而,真正的问题,从来不是 AI 能不能做你的工作。而是 ——
当 AI 做了你的工作之后,多出来的利润归谁?
被省掉的你,又该去哪?
这不是技术问题,是选择问题。
而做选择的窗口,正在迅速关闭。
参考资料:
https://fortune.com/2026/03/06/nobel-prize-economist-joseph-stiglitz-ai-inequality-tech-bros/
https://x.com/JosephPolitano/status/2029916364664611242
https://artificialanalysis.ai/evaluations/critpt
https://x.com/sawyerhood/status/2030041230512476481
https://x.com/Angaisb_/status/2029635731585372598