Skip to main content

format: md

Models API

Endpoints para descoberta de modelos disponíveis. Implementação NATIVO no LiteLLM Gateway (roteamento direto).


format: md

GET /v1/models

GET /v1/models

Lista todos os modelos disponíveis.

Headers

HeaderValorObrigatório
AuthorizationBearer <token>Sim

Query Parameters

ParâmetroTipoDescrição
afterstringCursor para paginação
limitnumberMáximo de itens por página
betasstringLista de betas separados por vírgula

Response

{
data: Array<{
id: string; // "claude-sonnet-4-20250514"
type: "model";
created: number; // Unix timestamp
owned_by: string; // "anthropic"
// Campos adicionais podem existir no response expandido
}>;
has_more?: boolean;
}

Exemplo curl

curl http://localhost:4000/v1/models \
-H "Authorization: Bearer $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01"

Resposta de Exemplo

{
"data": [
{
"id": "claude-sonnet-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
},
{
"id": "claude-haiku-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
},
{
"id": "claude-opus-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
}
],
"has_more": false
}

Códigos de Erro

CódigoSignificado
401Não autorizado
429Rate limit excedido

format: md

GET /v1/models/

GET /v1/models/

Recupera informações detalhadas de um modelo específico.

Parâmetros Path

ParâmetroTipoDescrição
model_idstringID do modelo (ex: claude-sonnet-4-20250514)

Response

{
id: string;
type: "model";
created: number;
owned_by: string;
// ... campos adicionais por modelo
}

Exemplo curl

curl http://localhost:4000/v1/models/claude-sonnet-4-20250514 \
-H "Authorization: Bearer $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01"

Códigos de Erro

CódigoSignificado
401Não autorizado
404Modelo não encontrado

format: md

Modelos Suportados (LiteLLM Gateway)

Model IDTierProvider
claude-haiku-4-5HaikuMiMo auto / MiMo v2.5 / DeepSeek V4 Flash
claude-sonnet-4-6SonnetMiMo v2.5 / DeepSeek V4 Flash
claude-opus-4-8OpusMiMo v2.5 Pro / DeepSeek V4 Pro

O gateway detecta o modelo pelo prefixo do nome e roteia para o backend apropriado baseado no tier e effort (budget_tokens).