阿里云千问-大语言模型推理通用抵扣包是什么?怎么用?

阿里云千问-大语言模型推理通用抵扣包是什么?千问-大语言模型推理通用抵扣包是阿里云百炼平台提供的一种预付费资源包,用于抵扣大语言模型推理服务在超出免费额度后产生的费用,覆盖千问LLM、VL模型以及百炼上架的三方文本模型,用于抵扣模型推理超出免费额度后产生的推理费用。详细参考阿里云百炼官方页面:https://t.aliyun.com/U/fPVHqY

千问-大语言模型推理通用抵扣包怎么用?不需要设置,购买后会自动抵扣你在阿里云百炼平台上调用适用大语言模型产生的实时推理费用(按Token计费),不需要手动操作。这个通用抵扣包可以抵扣哪些费用?适用范围如下:

  • 适用于已上架百炼平台、以 Token 计费的文本生成模型,包括通义千问系列(如 qwen-max、qwen-plus、qwen-turbo、Qwen3 等)、多模态模型(如千问VL、Qwen-Audio)及第三方模型(如 GLM、Kimi、DeepSeek 等)。
  • 仅支持 实时推理(非思考模式) 的输入和输出 Token 费用。

千问-大语言模型推理通用抵扣包档位与有效期:

  • 20元档:有效期1个月
  • 100元档:有效期3个月
  • 1,000元及以上档位(最高500,000元):有效期6个月或1年(其中1,000元档为6个月,5,000元及以上档位为1年)
  • 领取优惠券:aly.wiki 免费领取阿里云折扣券和代金券

千问-大语言模型推理通用抵扣包适用于实时推理(非思考模式)产生的输入和输出Token费用,但不支持抵扣Batch调用、上下文缓存、模型调优或部署等费用。

注意:2026云服务器大降价:阿里云99元服务器新老同享,续费也是99元1年;腾讯云4核服务器秒杀38元1年;京东云服务器CPU内存带宽配置高价格优惠;配置从2核2G3M、2核4G5M、2核8G、4核8G、4核16G、8核16G、8核32G、16核32G、16核64G等CPU内存皮配置可选,详细移步到官方活动页面: