format: md
Models API
Endpoints para descoberta de modelos disponíveis. Implementação NATIVO no LiteLLM Gateway (roteamento direto).
format: md
GET /v1/models
GET /v1/models
Lista todos os modelos disponíveis.
Headers
| Header | Valor | Obrigatório |
|---|---|---|
Authorization | Bearer <token> | Sim |
Query Parameters
| Parâmetro | Tipo | Descrição |
|---|---|---|
after | string | Cursor para paginação |
limit | number | Máximo de itens por página |
betas | string | Lista de betas separados por vírgula |
Response
{
data: Array<{
id: string; // "claude-sonnet-4-20250514"
type: "model";
created: number; // Unix timestamp
owned_by: string; // "anthropic"
// Campos adicionais podem existir no response expandido
}>;
has_more?: boolean;
}
Exemplo curl
curl http://localhost:4000/v1/models \
-H "Authorization: Bearer $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01"
Resposta de Exemplo
{
"data": [
{
"id": "claude-sonnet-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
},
{
"id": "claude-haiku-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
},
{
"id": "claude-opus-4-20250514",
"type": "model",
"created": 1747209600,
"owned_by": "anthropic"
}
],
"has_more": false
}
Códigos de Erro
| Código | Significado |
|---|---|
401 | Não autorizado |
429 | Rate limit excedido |
format: md
GET /v1/models/
GET /v1/models/
Recupera informações detalhadas de um modelo específico.
Parâmetros Path
| Parâmetro | Tipo | Descrição |
|---|---|---|
model_id | string | ID do modelo (ex: claude-sonnet-4-20250514) |
Response
{
id: string;
type: "model";
created: number;
owned_by: string;
// ... campos adicionais por modelo
}
Exemplo curl
curl http://localhost:4000/v1/models/claude-sonnet-4-20250514 \
-H "Authorization: Bearer $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01"
Códigos de Erro
| Código | Significado |
|---|---|
401 | Não autorizado |
404 | Modelo não encontrado |
format: md
Modelos Suportados (LiteLLM Gateway)
| Model ID | Tier | Provider |
|---|---|---|
claude-haiku-4-5 | Haiku | MiMo auto / MiMo v2.5 / DeepSeek V4 Flash |
claude-sonnet-4-6 | Sonnet | MiMo v2.5 / DeepSeek V4 Flash |
claude-opus-4-8 | Opus | MiMo v2.5 Pro / DeepSeek V4 Pro |
O gateway detecta o modelo pelo prefixo do nome e roteia para o backend apropriado baseado no tier e effort (budget_tokens).