AI Model Pricing & Plans | CLōD AI Control Platform

Available Models

Llama

Llama 3.2 3B
Llama 4 Maverick
Llama 4 Maverick 17B
Llama 4 Scout
Llama 4 Scout 17B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Llama

Llama 3 70B Reference
Llama 3 8B Lite
Llama 3.1 405B
Llama 3.1 8B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Deepseek

Deepseek R1
Deepseek V3

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Claude

Claude Opus 4
Claude Opus 4.5
Claude Sonnet 4
Claude Sonnet 4.5

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

GPT

GPT 5
GPT 5 Mini
GPT 5 Nano
GPT 5.2

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

GPT

GPT 4 Turbo
GPT 4.1
GPT 4o
GPT 4o Mini
GPT OSS 120B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Gemini

Gemini 2.5 Flash
Gemini 2.5 Pro

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Grok

Grok 3
Grok 4

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Qwen

Qwen 3 32B
Qwen 2.5 72B
Qwen 2.5 7B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Qwen

Qwen 2.5 VL 72B
Qwen 3 Coder 480B
Qwen Next 80B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Arcee

Arcee Trinity Mini

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Cogito

Cogito V2 109BMOE
Cogito V2 405B
Cogito V2 671B
Cogito V2 70B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Gemma

Gemma 3N E4B

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Kimi

Kimi K2

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Marin

Marin 8B Instruct

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Mistral

Mistral 7B Instruct v0.3

Deployable governance your clients can adopt quickly: enforce rules, block risky outputs, maintain reliability, and provide 360° monitoring to turn policy into practice fast.

Model pricing

Pay-as-you-go, with full control over spend. You only pay for the tokens you use, and you can set routing and inference strategies to hit your target cost, latency, and reliability.

For a limited time, Governance and RAG add-on modules are included at no additional cost, so you can add guardrails and grounding where you need them, while you scale with confidence.
‍

Model	Input (USD / 1M tokens)	Output (USD / 1M tokens)
OpenAI
GPT 4 Turbo	$9	$27
GPT 4.1	$1.8	$7.2
GPT 4o	$2.25	$9
GPT 4o Mini	$0.14	$0.54
GPT 5	$1.13	$9
GPT 5 Mini	$0.25	$2
GPT 5 Nano	$0.05	$0.4
GPT 5.2	$1.5	$10
GPT OSS 120B	$0.14	$0.54
Claude
Claude Haiku 4.5	$0.9	$4.5
Claude Opus 4	$13.5	$67.5
Claude Opus 4.5	$4.5	$22.5
Claude Sonnet 4	$2.7	$13.5
Claude Sonnet 4.5	$1.8	$9
Gemini
Gemini 2.5 Flash	$0.3	$1.2
Gemini 2.5 Pro	$1.25	$5
Gemma 3N E4B	$0.02	$0.08
Llama
Llama 3 70B Reference	$0.9	$0.9
Llama 3 8B Lite	$0.05	$0.05
Llama 3.1 405B	$3	$3
Llama 3.1 8B*	$0.05 - $0.16	$0.07 - $0.18
Llama 3.2 3B	$0.03	$0.03
Llama 3.3 70B*	$0.54 - $0.79	$0.79 - $1.10
Llama 4 Maverick	$0.3	$1.2
Llama 4 Maverick 17B	$0.1	$0.4
Llama 4 Scout	$0.2	$0.8
Llama 4 Scout 17B	$0.08	$0.32
DeepSeek
Deepseek R1*	$0.5 - $2.70	$1.97 - $6.30
Deepseek V3	$0.14	$0.54
Qwen
Qwen 2.5 72B Turbo	$0.3	$1.2
Qwen 2.5 7B Turbo	$0.05	$0.2
Qwen 2.5 VL 72B	$0.35	$1.4
Qwen 3 235B Instruct	$0.9	$3.6
Qwen 3 235B Thinking	$1.2	$4.8
Qwen 3 235B Throughput	$0.4	$1.6
Qwen 3 32B	$0.2	$0.8
Qwen 3 Coder 480B	$0.75	$3
Qwen 3 Next 80B Instruct	$0.35	$1.4
Qwen 3 Next 80B Thinking	$0.5	$2
Grok
Grok 3	$2	$10
Grok 4	$3	$15
Kimi
Kimi K2*	$0.90 - $1.08	$2.70 - $3.60
Arcee
Arcee Trinity Mini	$0.04	$0.14
Cogito
Cogito V2 109B MOE	$0.5	$2
Cogito V2 405B	$1.5	$6
Cogito V2 671B	$2	$8
Cogito V2 70B	$0.3	$1.2
Marin
Marin 8B Instruct	$0.06	$0.24

*Indicates the lowest possible rate, which depends on selected inference strategy. For detailed pricing breakdown, model ID, context size, available locations, please refer to app.clod.io/user/models/explore.

Quick FAQs

How do I integrate CLoD into my workflow (SDKs, APIs)?

You can connect via direct API calls today, use the OpenAI SDK with minimal setup, and soon we’ll release official SDKs and support for open standards like MCP (Model Context Protocol), a new way to plug tools together without extra coding.

How long does setup take?

Setup takes less than 5 minutes. You simply create an account, generate an API key, and drop it into your workflow. From there, you can start making governed AI requests right away after selecting a preset rulset or customizing your own.

Can I run CLōD on my own infrastructure, or only on yours?

Today, CLōD runs as a managed service on our infrastructure. We handle the reliability, monitoring, and updates so you don’t have to. In the future, we plan to offer deployment options that let you run CLōD on your own infrastructure if needed.

What AI models are currently supported?

CLoD currently supports 26 leading models from providers including OpenAI, Anthropic, Google, Fireworks, xAI, Together, Sambanova, Cerebras, and Groq. This includes well-known models like GPT-4.1, Claude Opus 4, Gemini 2.5, Grok 4, and multiple Llama variants. We’re continuously adding new models, so you’ll always have access to the latest and best-performing options.