Claude Code บน Google Vertex AI
เรียนรู้การกำหนดค่า Claude Code ผ่าน Google Vertex AI รวมถึงการตั้งค่า การกำหนดค่า IAM และการแก้ปัญหา
ข้อกำหนดเบื้องต้น
ก่อนกำหนดค่า Claude Code กับ Vertex AI ให้แน่ใจว่ามี:
- บัญชี Google Cloud Platform (GCP) ที่เปิดใช้งานการเรียกเก็บเงิน
- GCP project ที่เปิดใช้ Vertex AI API
- สิทธิ์เข้าถึง Claude model ที่ต้องการ (เช่น Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) ที่ติดตั้งและกำหนดค่าแล้ว - Quota ที่จัดสรรในภูมิภาค GCP ที่ต้องการ
เข้าสู่ระบบด้วย Vertex AI
ถ้าคุณมี Google Cloud credentials และต้องการเริ่มใช้ Claude Code ผ่าน Vertex AI ให้ใช้ wizard การเข้าสู่ระบบ
หมายเหตุ: Vertex AI setup wizard ต้องการ Claude Code v2.1.98 หรือใหม่กว่า รัน
claude --versionเพื่อตรวจสอบ
-
เปิดใช้ Claude models ในโปรเจกต์ GCP ของคุณ: เปิดใช้ Vertex AI API แล้วขอเข้าถึง Claude models ใน Vertex AI Model Garden
-
เริ่ม Claude Code และเลือก Vertex AI: รัน
claudeที่ login prompt เลือก 3rd-party platform แล้วเลือก Google Vertex AI -
ทำตามคำแนะนำ wizard: เลือกวิธียืนยันตัวตนใน Google Cloud
หลังจากเข้าสู่ระบบแล้ว รัน /setup-vertex เมื่อไรก็ได้เพื่อเปิด wizard และเปลี่ยน credentials, project, region หรือ model pin
การกำหนดค่า Region
Claude Code รองรับ Vertex AI global, multi-region และ regional endpoint ตั้งค่า CLOUD_ML_REGION เป็น global, multi-region location เช่น eu หรือ us, หรือภูมิภาคเฉพาะเช่น us-east5
การตั้งค่าด้วยตนเอง
1. เปิดใช้ Vertex AI API
# ตั้งค่า project ID ของคุณ
gcloud config set project YOUR-PROJECT-ID
# เปิดใช้ Vertex AI API
gcloud services enable aiplatform.googleapis.com
2. ขอสิทธิ์เข้าถึง Model
- ไปที่ Vertex AI Model Garden
- ค้นหา Claude models
- ขอสิทธิ์เข้าถึง Claude models ที่ต้องการ (อาจใช้เวลา 24-48 ชั่วโมง)
3. กำหนดค่า GCP Credentials
Claude Code ใช้การยืนยันตัวตนมาตรฐานของ Google Cloud ดูเพิ่มเติมที่ Google Cloud authentication documentation
การกำหนดค่า credentials ขั้นสูง
Claude Code รองรับการรีเฟรช credentials GCP อัตโนมัติผ่านการตั้งค่า gcpAuthRefresh:
{
"gcpAuthRefresh": "gcloud auth application-default login",
"env": {
"ANTHROPIC_VERTEX_PROJECT_ID": "your-project-id"
}
}
4. กำหนดค่า Claude Code
ตั้งค่าตัวแปรสภาพแวดล้อมเหล่านี้:
# เปิดใช้ Vertex AI integration
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID
# ตัวเลือก: ปิดใช้งาน prompt caching ถ้าจำเป็น
export DISABLE_PROMPT_CACHING=1
# ตัวเลือก: ขอ 1-hour prompt cache TTL แทนค่าเริ่มต้น 5 นาที
export ENABLE_PROMPT_CACHING_1H=1
# เมื่อ CLOUD_ML_REGION=global override ภูมิภาคสำหรับ model ที่ไม่รองรับ global endpoint
export VERTEX_REGION_CLAUDE_HAIKU_4_5=us-east5
export VERTEX_REGION_CLAUDE_4_6_SONNET=europe-west1
5. Pin เวอร์ชัน Model
คำเตือน: Pin เวอร์ชัน model เฉพาะเมื่อ deploy ให้ผู้ใช้หลายคน โดยไม่มี pinning alias เช่น
sonnetและopusจะ resolve ไปยัง Claude Code default ในตัวสำหรับ Vertex AI
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
export ANTHROPIC_DEFAULT_SONNET_MODEL='claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001'
Claude Code ใช้ model เริ่มต้นเหล่านี้เมื่อไม่มีการ pin:
| ประเภท Model | ค่าเริ่มต้น |
|---|---|
| Primary model | claude-sonnet-4-5@20250929 |
| Small/fast model | เหมือนกับ primary model |
การตรวจสอบ Model ตอนเริ่มต้น
เมื่อ Claude Code เริ่มพร้อม Vertex AI ที่กำหนดค่า มันจะตรวจสอบว่า model ที่ตั้งใจใช้สามารถเข้าถึงได้ในโปรเจกต์ของคุณ การตรวจสอบนี้ต้องการ Claude Code v2.1.98 หรือใหม่กว่า
การกำหนดค่า IAM
กำหนดสิทธิ์ IAM ที่จำเป็น:
Role roles/aiplatform.user รวมสิทธิ์ที่จำเป็น:
aiplatform.endpoints.predict— จำเป็นสำหรับการเรียกใช้ model และการนับ token
Context Window 1M Token
Claude Opus 4.6 และใหม่กว่า และ Sonnet 4.6 รองรับ 1M token context window บน Vertex AI Claude Code เปิดใช้งาน extended context window โดยอัตโนมัติเมื่อคุณเลือก 1M model variant
การแก้ปัญหา
"Could not load the default credentials": รัน gcloud auth application-default login เพื่อตั้งค่า Application Default Credentials
ปัญหา quota: ตรวจสอบ quota ปัจจุบันหรือขอเพิ่ม quota ผ่าน Cloud Console
"model not found" 404 errors: ยืนยันว่า model เปิดใช้งานใน Model Garden และตรวจสอบว่า model พร้อมใช้งานในตำแหน่งที่คุณระบุ
429 errors: สำหรับ regional endpoint ให้แน่ใจว่า primary model และ small/fast model รองรับใน region ที่เลือก พิจารณาสลับไปใช้ CLOUD_ML_REGION=global