智谱年内API价格涨超八成:大模型为何出现“涨价潮”?

“全球大模型第一股”智谱宣布涨价,引发行业关注。

3月16日,国产大模型企业智谱(2513.HK)宣布推出全球首个面向OpenClaw龙虾场景深度优化的基座模型——GLM-5-Turbo,这也是自2025年以来的智谱首个闭源模型,拥有专项增强工具调用、指令遵循、定时与持续性任务、长链路执行等龙虾场景能力。

值得注意的是,在发布时,智谱也宣布同步上调GLM-5-Turbo的API价格,幅度为20%。这已是智谱近期第二次涨价——智谱于2月12日正式推出新一代旗舰模型GLM-5并上调智谱GLM Coding Plan套餐和API价格,这一消息落地后,带动了AI产业链的表现。

澎湃新闻记者经过计算发现,智谱此次涨价力度不小。相对GLM-4.7,GLM-5涨幅超30%;在此基础上,GLM-5-Turbo相对GLM-5涨价20%,相对GLM-4.7平均上涨83%,这也意味着智谱年内涨幅达到83%,API价格接近翻倍,量价双增趋势明显。

据智谱方面披露,GLM-5-Turbo已登陆OpenRouter、扣子Coze、美团、TRAE等平台,成为互联网大厂龙虾背后的主力模型,首发接入GLM-5-Turbo模型的机械革命“龙虾盒子”也将全球开售。

当天,智谱还推出基于该模型的“龙虾套餐”,体验月卡39元就能获得3500万Tokens,进阶月卡99元获得1亿Tokens,这也是继编程套餐后,国内首个专为龙虾场景打造的套餐。

针对外界担忧的龙虾安全风险问题,智谱强调,已经专门构建了一套面向企业级场景的OpenClaw安全管理体系“Claw for Enterprise Security”,在安全保障层面系统性提供多层防护机制。

从行业来看,曾经一度陷入价格战的大模型行业已经出现集体涨价趋势,以大洋彼岸的AI龙头OpenAI为例,近日GPT-5.4标准版输入价格涨至2.5美元/百万token,输出价格15美元/百万token。

3月11日,腾讯云智能体开发平台宣布将对部分模型的计费策略进行优化调整。本次调整主要涉及两类变更,一类是公测模型结束免费,GLM 5、MiniMax 2.5、Kimi 2.5模型将于3月13日结束免费公测,转为正式商用服务,根据模型调用按量计费;另一类变更为对混元系列模型Tencent HY2.0 Instruct与Tencent HY2.0 Think服务进行涨价。

根据统计,无论是输入价格或输出价格,腾讯云此次涨价幅度约在4倍以上。例如Tencent HY2.0 Instruct由原先的0.0008元/千tokens调整为0.004505元/千tokens,涨幅超460%。

之所以出现集体性涨幅,受到近期OpenClaw(龙虾)影响显著,背后主要是算力缺口带来需求。

OpenRouter平台数据显示,OpenClaw的Token消耗量从2026年2月3日的806亿,在一个月内飙升至3月4日的3580亿,翻了约4.4倍;到3月2日当周,OpenRouter平台周度Token调用量已达14.8万亿,两个月内增长约160%,且OpenClaw贡献其中的绝大部分。根据Anthropic的数据,AI Agent的Token消耗量最高可达普通聊天交互的15倍。

国盛证券分析,由于Agent天然多工具调用+长上下文+多流程工作的特性,AI Agent的Token消耗量较大,随着智能体运行规模与任务复杂度的同步提升,活跃智能体的Token消耗进入高速增长期。根据IDC预测,中国活跃智能体数量将在2031年突破3.5亿,智能体Token消耗将迎来年均超30倍的指数级跃升。

国盛证券表示,在Token消耗量骤增的情况下,一众主流模型厂商纷纷出现算力缺口,算力需求进一步加大。OpenClaw的爆发式渗透验证商业可行性,Agent渗透率和复杂度提升驱动Token消耗激增,催生刚性算力需求。随着国内市场Token消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导。

近期包括智谱、MiniMax在内的AI应用股价受到OpenClaw带来风潮影响,出现集体大涨。据大智慧VIP数据,截至收盘,智谱港股报收605港元,涨超14%;MiniMax报1027港元,涨超1.68%。

海通国际分析,科技模型层面竞争格局变化迅速,甚至有人认为过快,这从模型排名即使按季亦不断变化可见一斑。尽管如此,与ChatGPT出现初期众多初创企业涌现以捕捉新浪潮时相比,现时市场上的参与者根基稳固得多。更可预测的竞争环境将增加MiniMax及智谱持续蓬勃发展的机会,并有可能成为人工智能时代“终局”的一部分。

对于AI应用等公司未来的前景,海通国际在研报中建议,投资者不要专注于每季的排行榜排名,而是聚焦于智谱及MiniMax当前成功的基础因素,创新速度及持续创新的应用。两家公司均能以加速的步伐迭代其模型版本,而各项模型能力的应用亦日益明显。

下载中心

移动交互,随时随地

×