文章来源:放心AI网发布时间:2025-04-15 11:14:50
硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1 V3API 的批量推理(Batch Inference)功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,并在预期24小时内完成大规模数据处理任务。
此次更新的一大亮点是价格的大幅下调。DeepSeek-V3批量推理的价格相较实时推理直降50%。更令人惊喜的是,在3月11日至3月18日期间,DeepSeek-R1批量推理的优惠价格更是直降75%,输入价格仅为1元/百万 Tokens,输出价格为4元/百万 Tokens。
批量推理功能的推出,旨在帮助用户更高效地处理生成报告、数据清洗等大批量数据处理任务,以更低的成本享受 DeepSeek-R1 V3API 服务。此功能尤其适用于无需实时响应的数据分析、模型性能评估等场景。
值得一提的是,此前 DeepSeek-R1 V3API 已相继支持 Function Calling、JSON Mode、Prefix、FIM 等功能,并且 Pro 版 DeepSeek-R1 V3API 的 TPM(每分钟处理的 Token)上限已从1万提升至100万。
相关攻略 更多
最新资讯 更多
硅基流动宣布DeepSeek-R1&V3API支持批量推理价格暴降75%
更新时间:2025-04-15
硅基流动:DeepSeek-R1&V3API升级,支持批量推理、R1价格直降75%
更新时间:2025-04-15
马来西亚Maxis与华为携手推动智能网络运营的AI与ML技术应用
更新时间:2025-04-15
腾讯元宝电脑版发布1.3.0更新支持大字体、拖拽上传
更新时间:2025-04-15
西班牙将推新法案:未标注AI生成内容将面临巨额罚款
更新时间:2025-04-15
Meta“挥刀”砍向650亿美元AI账单!自研芯片亮剑,誓要摆脱英伟达“卡脖子”?
更新时间:2025-04-15
腾讯元宝电脑版重磅更新:新增大字体和拖拽上传功能
更新时间:2025-04-15
谷歌开源新一代多模态模型Gemma-3:性能卓越、成本降低10倍
更新时间:2025-04-15
理想汽车AI助手理想同学网页版上线:接入DeepSeekR1满血版
更新时间:2025-04-15
字节Trae接入硅基流动SiliconCloud支持DeepSeek多款模型API
更新时间:2025-04-15