部署
Google Vertex AI
Google Vertex AI 这一页讲的,就是 Google Vertex AI 这件事在 Claude Code 里到底怎么用。
页面信息
这页不是官方原文,而是顺着官方文档结构做的中文解释版。命令、参数、配置名这些硬东西尽量保留,解释部分则尽量讲成人能照着做的话。
如果你碰到特别敏感的配置、权限或企业环境差异,最好顺手点上面的“查看原始文档”再核一遍。
这一页先讲明白
这页讲通过 Google Vertex AI 接 Claude Code。
适合 GCP 体系团队。
如果你们家本来所有机器、权限和账单都在 Google 云上,那直接走 Vertex 会省很多折腾。
本质上还是“借现有大路走”,而不是另修一条小路。
重点先看项目、区域、权限和计费配置。
和其他云接法一样,先把基础设施层打通,再往上跑 Claude Code。
Documentation Index
这里不是让你背"Documentation Index"这个词,而是让你看它真干活时怎么使。
Prerequisites
这一块主要是在说"Prerequisites"真到手上该怎么用,哪里最容易踩坑。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
Sign in with Vertex AI
这一段更像在讲判断条件,什么时候该上,什么时候先别急。把触发条件看清,比背标题更重要。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
Region configuration
这一段主要是在把"Region configuration"讲实,不是只摆个标题给你看。
Set up manually
这段就是开工前的准备清单,先把地基打好。
如果你看到环境变量或 settings.json,意思通常都是:这不是会话里临时喊一声就行,而是要把开关真正写进环境或配置。
1. Enable Vertex AI API
这一段主要是在把"1. Enable Vertex AI API"讲实,不是只摆个标题给你看。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
1. Enable Vertex AI API
先别急着往下翻,下面这条命令跑完,心里才有底。
# Set your project ID
gcloud config set project YOUR-PROJECT-ID
# Enable Vertex AI API
gcloud services enable aiplatform.googleapis.com 2. Request model access
这一段主要是在把"2. Request model access"讲实,不是只摆个标题给你看。
3. Configure GCP credentials
看到这里,就把"3. Configure GCP credentials"当成一件真要上手的活来看。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
3. Configure GCP credentials
这一段说完,最后还得写到配置里才算真的生效。
{
"gcpAuthRefresh": "gcloud auth application-default login",
"env": {
"ANTHROPIC_VERTEX_PROJECT_ID": "your-project-id"
}
} 4. Configure Claude Code
这一块主要是在说"4. Configure Claude Code"真到手上该怎么用,哪里最容易踩坑。
看这段时要特别盯工具和权限边界,别为了省事一把全开。
4. Configure Claude Code
看到这里,别光点头,下面这条命令先跑起来再说。
# Enable Vertex AI integration
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID
# Optional: Override the Vertex endpoint URL for custom endpoints or gateways
# export ANTHROPIC_VERTEX_BASE_URL=https://aiplatform.googleapis.com
# Optional: Disable prompt caching if needed
export DISABLE_PROMPT_CACHING=1
# Optional: Request 1-hour prompt cache TTL instead of the 5-minute default
export ENABLE_PROMPT_CACHING_1H=1
# When CLOUD_ML_REGION=global, override region for models that don't support global endpoints
export VERTEX_REGION_CLAUDE_HAIKU_4_5=us-east5
export VERTEX_REGION_CLAUDE_4_6_SONNET=europe-west1 5. Pin model versions
这一段主要是在把"5. Pin model versions"讲实,不是只摆个标题给你看。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
5. Pin model versions 1
先别急着往下翻,下面这条命令跑完,心里才有底。
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'
export ANTHROPIC_DEFAULT_SONNET_MODEL='claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001' 5. Pin model versions 2
先别急着往下翻,下面这条命令跑完,心里才有底。
export ANTHROPIC_MODEL='claude-opus-4-7'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001' Startup model checks
这一段更像在讲判断条件,什么时候该上,什么时候先别急。把触发条件看清,比背标题更重要。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
IAM configuration
看到这里,就把"IAM configuration"当成一件真要上手的活来看。
这里还牵扯作用域,意思就是这条规则到底管当前项目、你个人,还是只管这一趟会话。
1M token context window
这一段主要是在把"1M token context window"讲实,不是只摆个标题给你看。
Troubleshooting
这里讲的是怎么找毛病,先查明白哪一步出错,再决定怎么修。
如果你看到环境变量或 settings.json,意思通常都是:这不是会话里临时喊一声就行,而是要把开关真正写进环境或配置。
Additional resources
这一段主要是在把"Additional resources"讲实,不是只摆个标题给你看。
照着做一遍
这页属于“Google Vertex AI”这类活,最稳的办法还是一小步一小步来。
下面这三步不一定华丽,但通常最不容易绕晕。
第 1 步:先起步
重点先看项目、区域、权限和计费配置。
第 2 步:边做边看
和其他云接法一样,先把基础设施层打通,再往上跑 Claude Code。
一眼看懂这一页
这页的作用,就是把原本偏专业的话题,拆成能直接照着走的明白话。
Google Vertex AI
|
v
Google Vertex AI 这一页讲的,就是 Google Vertex AI 这件事在 Claude Code 里到底怎么用。
|
v
照着步骤去做 文末提醒
这站会按官方 docs 的导航和内容变化继续重生成,原站加页、删页、改页时,这里会跟着更新。
人话解释会尽量顺着原页往下讲,但命令、参数名、配置名这些硬东西还是保留原样,免得你抄过去跑不起来。