Rate Limits 是指用户 API 在指定时间内访问 SiliconFlow 平台服务频次规则。
Rate Limits 是 API 的常见做法,其实施原因如下:
目前 Rate Limit 以七种指标衡量:
模型名称 | Rate Limit 指标 | 当前指标 |
---|---|---|
语言模型 (Chat) | RPM、TPM | RPM=1000-10000 TPM=50000-5000000 |
向量模型 (Embedding) | RPM、TPM | RPM:2000-10000 TPM:500000-10000000 |
重排序模型 (Reranker) | RPM、TPM | RPM:2000 TPM:500000 |
图像生成模型 (Image) | IPM、IPD | IPM:2- IPD:400- |
多模态模型 (Multimodal Models) | - | - |
Rate Limits 可能会因在任一选项(RPM、RPH、RPD、TPM、TPD、IPM、IPD)中达峰而触发,取决于哪个先发生。 例如,在 RPM 限制为 20,TPM 限制为 200K 时,一分钟内,账户向 ChatCompletions 发送了 20 个请求,每个请求有 100 个 Token,限制即触发,即使账户在这些 20 个请求中没有发满 200K 个 Token。
平台依据账户每月消费金额将其划分为不同的用量级别,每个级别有各自的 Rate Limits 标准。月消费达到更高级别标准时,自动升级至相应用量级别。升级立即生效,并提供更宽松的 Rate Limits。
Tier | RPM | TPM |
---|---|---|
L0 | 1,000 | 40,000 |
L1 | 1,200 | 60,000 |
L2 | 2,000 | 80,000 |
L3 | 4,000 | 160,000 |
L4 | 8,000 | 500,000 |
L5 | 10,000 | 2,000,000 |
平台目前提供文本生成、图像生成、向量化、重排序和语音五大类,具体模型的 Rate Limits 指标在 模型广场 中查看。
deepseek-ai/DeepSeek-R1
和 deepseek-ai/DeepSeek-V3
Rate Limits 具体规则::新增 RPH 限制(Requests Per Hour,每小时请求数)
新增 RPD 限制(Requests Per Day,每日请求数)
随着流量和负载变化,策略可能会不定时调整,SiliconFlow 保留解释权。
如果超出 Rate Limits 调用限制,用户的 API 请求将会因为超过 Rate Limits 而失败。用户需要等待一段时间待满足 Rate Limits 条件后方能再次调用。对应的 HTTP 错误信息为:
Rate Limits 是指用户 API 在指定时间内访问 SiliconFlow 平台服务频次规则。
Rate Limits 是 API 的常见做法,其实施原因如下:
目前 Rate Limit 以七种指标衡量:
模型名称 | Rate Limit 指标 | 当前指标 |
---|---|---|
语言模型 (Chat) | RPM、TPM | RPM=1000-10000 TPM=50000-5000000 |
向量模型 (Embedding) | RPM、TPM | RPM:2000-10000 TPM:500000-10000000 |
重排序模型 (Reranker) | RPM、TPM | RPM:2000 TPM:500000 |
图像生成模型 (Image) | IPM、IPD | IPM:2- IPD:400- |
多模态模型 (Multimodal Models) | - | - |
Rate Limits 可能会因在任一选项(RPM、RPH、RPD、TPM、TPD、IPM、IPD)中达峰而触发,取决于哪个先发生。 例如,在 RPM 限制为 20,TPM 限制为 200K 时,一分钟内,账户向 ChatCompletions 发送了 20 个请求,每个请求有 100 个 Token,限制即触发,即使账户在这些 20 个请求中没有发满 200K 个 Token。
平台依据账户每月消费金额将其划分为不同的用量级别,每个级别有各自的 Rate Limits 标准。月消费达到更高级别标准时,自动升级至相应用量级别。升级立即生效,并提供更宽松的 Rate Limits。
Tier | RPM | TPM |
---|---|---|
L0 | 1,000 | 40,000 |
L1 | 1,200 | 60,000 |
L2 | 2,000 | 80,000 |
L3 | 4,000 | 160,000 |
L4 | 8,000 | 500,000 |
L5 | 10,000 | 2,000,000 |
平台目前提供文本生成、图像生成、向量化、重排序和语音五大类,具体模型的 Rate Limits 指标在 模型广场 中查看。
deepseek-ai/DeepSeek-R1
和 deepseek-ai/DeepSeek-V3
Rate Limits 具体规则::新增 RPH 限制(Requests Per Hour,每小时请求数)
新增 RPD 限制(Requests Per Day,每日请求数)
随着流量和负载变化,策略可能会不定时调整,SiliconFlow 保留解释权。
如果超出 Rate Limits 调用限制,用户的 API 请求将会因为超过 Rate Limits 而失败。用户需要等待一段时间待满足 Rate Limits 条件后方能再次调用。对应的 HTTP 错误信息为: