/dashboard/guardrails o desde la API REST.
Componentes
- Presupuesto — límite USD por periodo (diario/semanal/mensual). Cuando se alcanza, el guardrail bloquea hasta el siguiente reset.
- Modelos permitidos — lista blanca por
model id. Vacío = todos. - Providers permitidos — lista blanca por provider id (
openai,anthropic, …). - ZDR por grupo — toggle independiente por grupo. Mismo concepto que el setting del org pero aplicado por guardrail.
- Prompt injection detection — regex de patrones comunes (
ignore previous instructions,reveal system prompt). - PII detection —
off/redact/block. Detecta email, teléfono, RFC, CURP, tarjetas, IPv4. - Custom patterns — array de
{ name, pattern, action }. Regex case-insensitive, actionredactoblock.
Combinación de varios guardrails
Cuando aplican varios al mismo request:| Dimensión | Regla | Ejemplo |
|---|---|---|
| Modelos permitidos | INTERSECCIÓN | A=[gpt5,sonnet], B=[sonnet,opus] → [sonnet] |
| Providers permitidos | INTERSECCIÓN | A=[openai,anthropic], B=[anthropic,google] → [anthropic] |
| ZDR (por grupo) | UNIÓN | Si A exige ZDR para openai, todas las requests a openai lo exigen |
| Presupuesto | INDEPENDIENTE | Cualquier guardrail con budget al límite bloquea |
| Custom patterns + PII | UNIÓN; block > redact | A=redact email, B=block email → block |
| Prompt injection | OR | Si cualquiera lo activa, on |
Forma del bloqueo
El mensaje describe el motivo de alto nivel; no expone la configuración interna ni los nombres de guardrails individuales (evita doxing de política a usuarios sin permiso admin).