• 南方网

  • 南方日报

  • 南方都市报

  • 南方杂志

  • 南方日报出版社

豆包大模型公布价格清单,支持国内最高并发标准

2024-05-21 11:49 来源:南方网

  近期,火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型pro-32k为例,价格比行业低99%TPM限额则高达同规格模型的2.7倍到8倍。

豆包系列模型“后付费”定价信息

  豆包系列模型“后付费”定价信息

  官方信息显示:在按照Tokens实际使用量计算费用的“后付费”模式下,豆包通用模型-pro、豆包通用模型-lite32k及以下窗口版本,模型限流为10K RPM 800K TPM(以RPMTPM其中之一到达上限为准)。国内其他主流模型的TPM限额大多在100K300K之间,RPM则是在60120区间,轻量级模型的RPM限额相对较高,但仅仅在300500之间。

  按照10K RPM 限额计算,企业客户平均每秒可以同时调用167次豆包通用模型,从而满足绝大多数业务场景在生产系统的大模型应用需求。这一标准,已经达到OpenAI为高级别客户(Tier4Tier5等级客户)提供的RPM上限。

  在算力挑战更大的长文本模型上,豆包通用模型prolite128k版本,模型限流为1K RPM 400K TPM,同样大幅高于国内其他的128k长文本模型。

  此外,豆包大模型公布了最新的“预付费”模型单元价格。“预付费”是以调用某个特定模型的TPM配额,企业购买后无需再为Tokens消耗付费,提前为可以预见的流量波动规划好算力 。

豆包系列模型“预付费”模型单元价目表

  豆包系列模型“预付费”模型单元价目表

以豆包通用模型 pro-32k为例:

按照 “预付费”模型单元价格计算,10K TPM 的包月价格为2000元。10K*60*24*30=43200K。即 432000K Tokens的价格为2000元,平均价格为 0.0046/Tokens

按照“后付费”模式计算:在模型推理的计算成本中,推理输入通常占绝大部分比例,业界一般认为推理输入是输出的5倍。根据豆包通用模型 pro-32k 推理输入 0.0008/Tokens、推理输出 0.002/Tokens 计算,模型推理的综合价格为 0.001/Tokens

  火山引擎方面表示,豆包大模型为客户提供了灵活、经济的付费模式,“后付费”即可满足绝大多数企业客户的业务需求,助力企业以极低成本使用大模型、加速大模型的应用落地。

  “豆包模型的超低定价,来源于我们有信心用技术手段优化成本,而不是补贴或是打价格战争夺市场份额。”火山引擎总裁谭待认为,“羊毛出在猪身上”在企业市场行不通,技术驱动的极致性价比才能真正创造价值。火山引擎与字节跳动豆包大模型团队正在密切合作,将持续优化模型效果和推理成本,为企业和开发者提供更好模型、更低成本和更易落地的平台支持。

扫二维码分享

回到首页 南方网二维码 回到顶部

南方报业传媒集团简介- 网站简介- 广告服务- 招标投标- 物资采购- 联系我们- 法律声明- 友情链接

本网站由南方新闻网版权所有,未经授权禁止复制或建立镜像 广东南方网络信息科技有限公司负责制作维护

违法和不良信息举报电话:020-87373397 18122015068

ICP备案号:粤B-20050235