Skip to main content
IDProviderContextInput $/1MOutput $/1MBest for
anthropic/claude-opus-4-8Anthropic200k$15$75Razonamiento profundo, código complejo
anthropic/claude-sonnet-4-6Anthropic200k$3$15Sweet spot precio/calidad
anthropic/claude-haiku-4-5Anthropic200k$1$5Tareas simples, alto volumen
google/gemini-2.5-proGoogle1M$1.25$5Context largo, multimodal
google/gemini-2.5-flashGoogle1M$0.15$0.60Más barato del catálogo
openai/gpt-5OpenAI400k$1.25$10Razonamiento general
openai/gpt-4.1OpenAI1M$2$8Context largo
openai/gpt-4.1-miniOpenAI1M$0.40$1.60OpenAI barato
openai/o4-miniOpenAI200k$1.10$4.40Razonamiento (CoT)
deepseek/deepseek-chatDeepSeek64k$0.27$1.10Open-weight, muy barato
deepseek/deepseek-reasonerDeepSeek64k$0.55$2.19Razonamiento open-weight
moonshot/kimi-k2Moonshot256k$0.60$2.50Chinese model, fuerte en código
moonshot/moonshot-v1-128kMoonshot128k$1.66$1.66Costo simétrico
xai/grok-4xAI256k$3$15Acceso a X data
xai/grok-3xAI131k$3$15Anterior gen
xai/grok-3-minixAI131k$0.30$0.50xAI barato

Cuándo usar cada uno

Para tareas críticas con presupuesto

Claude Opus 4.8 o GPT-5. Top de su clase en razonamiento.

Para producción a escala

Claude Sonnet 4.6. Balance precio/calidad. Lo elegirías ciegas si no supieras el resto.

Para alto volumen / costo bajo

Gemini 2.5 Flash o DeepSeek Chat. Subdólar por 1M tokens.

Para razonamiento (chain of thought, paso a paso)

DeepSeek Reasoner o o4-mini. Diseñados específicamente para razonamiento estructurado.

Para context muy largo

Gemini 2.5 Pro/Flash (1M tokens) o GPT-4.1 (1M). Procesan documentos enteros.

Para código

Kimi K2 o Claude Sonnet 4.6. Strong code performance.

Failover natural

Como todos los modelos comparten el mismo endpoint y SDK, failover entre providers es trivial:
def call_with_fallback(messages):
    for model in ["anthropic/claude-sonnet-4-6", "openai/gpt-5", "google/gemini-2.5-pro"]:
        try:
            return client.chat.completions.create(model=model, messages=messages)
        except Exception:
            continue
    raise RuntimeError("Todos los providers fallaron")