Claude Code官方文档LLM 网关LiteLLM

Claude Code LLM 网关配置 - LiteLLM 等网关方案

配置 Claude Code 通过 LLM 网关代理，实现集中身份验证、使用情况跟踪、成本控制和模型路由。

发布于 2025年5月1日 · 阅读约 10 分钟

LLM gateway 配置

了解如何配置 Claude Code 以使用 LLM gateway 解决方案。涵盖网关要求、身份验证配置、模型选择和特定提供商的端点设置。

LLM gateway 提供了 Claude Code 和模型提供商之间的集中代理层，通常提供以下功能：

集中身份验证 - API 密钥管理的单一入口
使用情况跟踪 - 监控团队和项目的使用情况
成本控制 - 实施预算和速率限制
审计日志 - 跟踪所有模型交互以实现合规性
模型路由 - 无需更改代码即可在提供商之间切换

网关要求

为了使 LLM gateway 与 Claude Code 配合使用，它必须满足以下要求：

API 格式

网关必须向客户端公开以下至少一种 API 格式：

Anthropic Messages: /v1/messages, /v1/messages/count_tokens
- 必须转发请求头：anthropic-beta、anthropic-version
Bedrock InvokeModel: /invoke, /invoke-with-response-stream
- 必须保留请求体字段：anthropic_beta、anthropic_version
Vertex rawPredict: :rawPredict、:streamRawPredict、/count-tokens:rawPredict
- 必须转发请求头：anthropic-beta、anthropic-version

未能转发请求头或保留请求体字段可能导致功能减少或无法使用 Claude Code 功能。

ℹ️ Claude Code 根据 API 格式确定要启用的功能。当使用 Bedrock 或 Vertex 的 Anthropic Messages 格式时，您可能需要设置环境变量 CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1。

请求头

Claude Code 在每个 API 请求上包含以下请求头：

请求头	描述
`X-Claude-Code-Session-Id`	当前 Claude Code 会话的唯一标识符。代理可以使用此标识符来聚合来自单个会话的所有 API 请求，而无需解析请求体。

Claude Code 还会在系统提示前面添加一个简短的归属块，其中包含客户端版本和从对话派生的指纹。Anthropic API 在处理前会删除此块，因此不会影响第一方提示缓存。如果您的网关实现了自己的提示缓存（以完整请求体为键），请设置 CLAUDE_CODE_ATTRIBUTION_HEADER=0 以省略它。

配置

模型选择

默认情况下，Claude Code 使用所选 API 格式的标准模型名称。

当 ANTHROPIC_BASE_URL 指向一个公开 Anthropic Messages 格式的网关时，Claude Code 在启动时可以查询网关的 /v1/models 端点，并将返回的模型添加到 /model 选择器中。设置 CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 来启用此功能。默认情况下发现功能是关闭的，以便由共享 API 密钥支持的网关不会向每个用户显示该密钥可以访问的每个模型。每个发现的条目都标记为”From gateway”，并在响应中提供 display_name 字段时使用该字段。这需要 Claude Code v2.1.129 或更高版本。

发现功能仅适用于 Anthropic Messages 格式。它不会对 Bedrock 或 Vertex 直通端点运行，也不会在 ANTHROPIC_BASE_URL 未设置或指向 api.anthropic.com 时运行。

发现请求的身份验证方式与推理请求相同：它将 ANTHROPIC_AUTH_TOKEN 作为 bearer 令牌发送，或在未设置身份验证令牌时将 ANTHROPIC_API_KEY 作为 x-api-key 标头发送，以及来自 ANTHROPIC_CUSTOM_HEADERS 的任何标头。只有 ID 以 claude 或 anthropic 开头的模型才会被添加到选择器中。结果被缓存到 ~/.claude/cache/gateway-models.json，并在每次启动时刷新。如果请求失败或网关未实现 /v1/models，选择器将回退到上一次启动时的缓存列表或内置模型列表。

如果您的网关使用与发现过滤器不匹配的模型名称，请使用模型配置中记录的环境变量来手动添加它们。

LiteLLM 配置

⚠️ LiteLLM PyPI 版本 1.82.7 和 1.82.8 被恶意软件感染，存在凭证窃取风险。请勿安装这些版本。如果您已经安装了它们：

删除该软件包

轮换受影响系统上的所有凭证

按照 BerriAI/litellm#24518 中的补救步骤进行操作

LiteLLM 是第三方代理服务。Anthropic 不认可、维护或审计 LiteLLM 的安全性或功能。本指南仅供参考，可能会过时。请自行判断使用。

前置条件

Claude Code 更新到最新版本
LiteLLM Proxy Server 已部署且可访问
通过您选择的提供商访问 Claude 模型

基本 LiteLLM 设置

配置 Claude Code：

身份验证方法

静态 API 密钥

使用固定 API 密钥的最简单方法：

# 在环境中设置
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# 或在 Claude Code 设置中
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}

此值将作为 Authorization 请求头发送。

使用辅助程序的动态 API 密钥

用于轮换密钥或按用户身份验证：

创建 API 密钥辅助程序脚本：

#!/bin/bash
# ~/bin/get-litellm-key.sh

# 示例：从保险库获取密钥
vault kv get -field=api_key secret/litellm/claude-code

# 示例：生成 JWT 令牌
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'

配置 Claude Code 设置以使用辅助程序：

{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}

设置令牌刷新间隔：

# 每小时刷新一次（3600000 毫秒）
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000

此值将作为 Authorization 和 X-Api-Key 请求头发送。apiKeyHelper 的优先级低于 ANTHROPIC_AUTH_TOKEN 或 ANTHROPIC_API_KEY。

统一端点（推荐）

使用 LiteLLM 的 Anthropic 格式端点：

export ANTHROPIC_BASE_URL=https://litellm-server:4000

统一端点相对于直通端点的优势：

负载均衡
故障转移
对成本跟踪和最终用户跟踪的一致支持

特定提供商的直通端点（替代方案）

通过 LiteLLM 的 Claude API

使用直通端点：

export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic

通过 LiteLLM 的 Amazon Bedrock

使用直通端点：

export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1

通过 LiteLLM 的 Google Vertex AI

使用直通端点：

export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5

有关更多详细信息，请参阅 LiteLLM 文档。

其他资源

本文翻译自 Anthropic Claude Code 官方文档，最近一次同步：2025-05-01。