• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

最高涨价463%,你的AI员工变贵了

2026-04-10 14:09 来源:南方网·粤学习

  4月8日,智谱公布了今年以来的第三次提价计划,发布新一代旗舰模型GLM-5.1的同时提价10%,而其距离上次调价30%起仅一个月。

  但除智谱外,腾讯、阿里等也接连停止免费公测,提高API调用价格,其中,腾讯混元大模型最高涨价463%。与2025年降价、免费试用相对,目前明显的信号是,国产AI大模型正在进入集体涨价的时代。

副本图文制作模版(3比4)111_02(1)

  Token变得更加紧俏。对于普通用户而言,能直观感受到的是免费额度正在收紧。大模型Chat产品开始限制提问次数以及附件识别字符,“7.9元”、“一杯奶茶钱”等尝鲜宣传的首月优惠套餐也逐步悄然下架。

  对于开发人员而言,各家大模型API调用价格都在上涨,Coding Plan是更具性价比的选择,但其具体额度消耗标准也在出现变化,从以prompt次数为基准转向以模型调用次数或Token为计费基准。

  Prompt意味着一次提示指令,即给AI传达的一次任务,而一次指令通常会触发多次模型调用。以阿里云百炼提供的信息作为参考,简单任务约消耗5~10次,复杂任务约10~30+次,实际消耗受任务难度、上下文及工具使用影响。

  特别是在Agent场景中。智谱CEO张鹏此前在中关村论坛上表示,完成一个Agent任务所需要的Token量,可能是回答一个简单问题时的十倍甚至百倍。

  大模型商们把账算得更细了,要求用户需要对更高水平的“数字员工”支付匹配的价格。1月30日,Kimi公布称Coding plan将从基于prompt请求切换至基于Token计费方式;3月20日,阿里云百炼暂停Lite套餐订购;3月23日,Minimax也将Prompt基准改为模型调用次数。

  Coding plan甚至一度出现“限购”现象,智谱从1月下旬便公告称将试行限量发售GLM Coding Plan,限售后每日可销售量降为当前的20%,引发用户蹲点抢购。但这也许并不是大模型商们的饥饿营销,而是算力突发告急。

  涨价潮正在向上游AI算力层蔓延。4月9日,腾讯云公告将于2026年5月9日起进行调价,AI算力相关产品服务费用上调5%;容器服务TKE-原生节点相关产品服务费用上调5%;弹性MapReduce(EMR)相关产品服务费用上调5%。

编辑:陈榕   责任编辑:于艳彬  
回到首页 南方网二维码 回到顶部

南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

违法和不良信息举报电话:020-87373397 18122015068

ICP备案号:粤B-20050235