POST /v1/chat/completions
Chat
POST /v1/chat/completions
Generación de respuestas de chat con cualquier modelo
POST
POST /v1/chat/completions
Request body
El ID namespaced del modelo, ej.
anthropic/claude-sonnet-4-6. Ver Modelos chat.Array de mensajes en la conversación.
Entre 0 y 2. Más alto = más creativo, más bajo = más determinista.
Entre 0 y 1. Nucleus sampling. Alternativa a
temperature.Máximo de tokens a generar. Default varía por modelo.
Si
true, responde con Server-Sent Events. Ver sección Streaming abajo.Sequencias que terminan la generación.
Response (non-streaming)
Tu
request_id (formato req_<24hex>). Útil para tracing.Siempre
"chat.completion".Unix timestamp.
El model id namespaced (e.g.
anthropic/claude-sonnet-4-6).Array con un solo elemento (no soportamos
n > 1 todavía).Tokens consumidos. Se cobran al cierre.
Streaming
Para responses en tiempo real, manda"stream": true. Recibirás Server-Sent Events:
data: es un JSON con un delta.content que es el siguiente fragmento del texto (puede ser una palabra, una sílaba, hasta un solo caracter).
Parser TypeScript
Ejemplos por proveedor
Errores comunes
Ver Errores para el catálogo completo. Los más frecuentes en chat:400 invalid_request_error— body mal formado (Zod te dice el campo enmessage)402 insufficient_balance— sin saldo404 model_not_found— model id inválido (probablemente le faltó namespace)502 provider_unavailable— el provider rebotó (a veces es prompt rechazado)