AI太烧钱微软也扛不住:考虑采用开源模型降低智能体费用

倚天百科 百科资讯 3

6月17日消息,据媒体报道,微软正着手调整其智能体产品Copilot Cowork的计费模式,从固定订阅转向“按使用量计费”,同时积极评估采用DeepSeek V4等开源模型,以缓解日益高昂的AI运行成本。

背景在于,Copilot Cowork、Anthropic的Claude Code以及OpenAI的Codex等智能代理工具在执行任务时需持续调用AI模型,在提升效率的同时也产生巨额算力消耗。尤其在越来越多供应商转向用量计费后,成本压力愈发显著。

微软负责Copilot、智能体及平台业务的执行副总裁查尔斯·拉曼纳坦言,测试表明Copilot Cowork无法支持无限制使用模式。“我们有用户每周执行数百项任务,效率提升显著,但代价是成本可能变得极高。”

为此,微软正探索基于DeepSeek V4或其他开源模型的微调版本,作为驱动Copilot Cowork的更经济替代方案——当前该业务日常调用Anthropic或OpenAI的模型。

成本对比尤为突出:Anthropic最新发布的Fable 5模型,每token成本比DeepSeek-V4 Pro高出50倍。而对多数无需顶级算力的日常工作,开源模型足以胜任,且成本可降低九成以上。

值得关注的是,在开源AI领域,中国大模型公司正集体占据领先位置。“大模型竞技场” Arena榜单显示,智谱公司的GLM-5.2 (Max) 升至第10位,此前GLM 5.1排名第13,DeepSeek-V4 Pro位列第 14。