Skip to main content

Claude Code บน Google Vertex AI

เรียนรู้การกำหนดค่า Claude Code ผ่าน Google Vertex AI รวมถึงการตั้งค่า การกำหนดค่า IAM และการแก้ปัญหา

ข้อกำหนดเบื้องต้น

ก่อนกำหนดค่า Claude Code กับ Vertex AI ให้แน่ใจว่ามี:

  • บัญชี Google Cloud Platform (GCP) ที่เปิดใช้งานการเรียกเก็บเงิน
  • GCP project ที่เปิดใช้ Vertex AI API
  • สิทธิ์เข้าถึง Claude model ที่ต้องการ (เช่น Claude Sonnet 4.6)
  • Google Cloud SDK (gcloud) ที่ติดตั้งและกำหนดค่าแล้ว
  • Quota ที่จัดสรรในภูมิภาค GCP ที่ต้องการ

เข้าสู่ระบบด้วย Vertex AI

ถ้าคุณมี Google Cloud credentials และต้องการเริ่มใช้ Claude Code ผ่าน Vertex AI ให้ใช้ wizard การเข้าสู่ระบบ

หมายเหตุ: Vertex AI setup wizard ต้องการ Claude Code v2.1.98 หรือใหม่กว่า รัน claude --version เพื่อตรวจสอบ

  1. เปิดใช้ Claude models ในโปรเจกต์ GCP ของคุณ: เปิดใช้ Vertex AI API แล้วขอเข้าถึง Claude models ใน Vertex AI Model Garden

  2. เริ่ม Claude Code และเลือก Vertex AI: รัน claude ที่ login prompt เลือก 3rd-party platform แล้วเลือก Google Vertex AI

  3. ทำตามคำแนะนำ wizard: เลือกวิธียืนยันตัวตนใน Google Cloud

หลังจากเข้าสู่ระบบแล้ว รัน /setup-vertex เมื่อไรก็ได้เพื่อเปิด wizard และเปลี่ยน credentials, project, region หรือ model pin

การกำหนดค่า Region

Claude Code รองรับ Vertex AI global, multi-region และ regional endpoint ตั้งค่า CLOUD_ML_REGION เป็น global, multi-region location เช่น eu หรือ us, หรือภูมิภาคเฉพาะเช่น us-east5

การตั้งค่าด้วยตนเอง

1. เปิดใช้ Vertex AI API

# ตั้งค่า project ID ของคุณ
gcloud config set project YOUR-PROJECT-ID

# เปิดใช้ Vertex AI API
gcloud services enable aiplatform.googleapis.com

2. ขอสิทธิ์เข้าถึง Model

  1. ไปที่ Vertex AI Model Garden
  2. ค้นหา Claude models
  3. ขอสิทธิ์เข้าถึง Claude models ที่ต้องการ (อาจใช้เวลา 24-48 ชั่วโมง)

3. กำหนดค่า GCP Credentials

Claude Code ใช้การยืนยันตัวตนมาตรฐานของ Google Cloud ดูเพิ่มเติมที่ Google Cloud authentication documentation

การกำหนดค่า credentials ขั้นสูง

Claude Code รองรับการรีเฟรช credentials GCP อัตโนมัติผ่านการตั้งค่า gcpAuthRefresh:

{
"gcpAuthRefresh": "gcloud auth application-default login",
"env": {
"ANTHROPIC_VERTEX_PROJECT_ID": "your-project-id"
}
}

4. กำหนดค่า Claude Code

ตั้งค่าตัวแปรสภาพแวดล้อมเหล่านี้:

# เปิดใช้ Vertex AI integration
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

# ตัวเลือก: ปิดใช้งาน prompt caching ถ้าจำเป็น
export DISABLE_PROMPT_CACHING=1

# ตัวเลือก: ขอ 1-hour prompt cache TTL แทนค่าเริ่มต้น 5 นาที
export ENABLE_PROMPT_CACHING_1H=1

# เมื่อ CLOUD_ML_REGION=global override ภูมิภาคสำหรับ model ที่ไม่รองรับ global endpoint
export VERTEX_REGION_CLAUDE_HAIKU_4_5=us-east5
export VERTEX_REGION_CLAUDE_4_6_SONNET=europe-west1

5. Pin เวอร์ชัน Model

คำเตือน: Pin เวอร์ชัน model เฉพาะเมื่อ deploy ให้ผู้ใช้หลายคน โดยไม่มี pinning alias เช่น sonnet และ opus จะ resolve ไปยัง Claude Code default ในตัวสำหรับ Vertex AI

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
export ANTHROPIC_DEFAULT_SONNET_MODEL='claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001'

Claude Code ใช้ model เริ่มต้นเหล่านี้เมื่อไม่มีการ pin:

ประเภท Modelค่าเริ่มต้น
Primary modelclaude-sonnet-4-5@20250929
Small/fast modelเหมือนกับ primary model

การตรวจสอบ Model ตอนเริ่มต้น

เมื่อ Claude Code เริ่มพร้อม Vertex AI ที่กำหนดค่า มันจะตรวจสอบว่า model ที่ตั้งใจใช้สามารถเข้าถึงได้ในโปรเจกต์ของคุณ การตรวจสอบนี้ต้องการ Claude Code v2.1.98 หรือใหม่กว่า

การกำหนดค่า IAM

กำหนดสิทธิ์ IAM ที่จำเป็น:

Role roles/aiplatform.user รวมสิทธิ์ที่จำเป็น:

  • aiplatform.endpoints.predict — จำเป็นสำหรับการเรียกใช้ model และการนับ token

Context Window 1M Token

Claude Opus 4.6 และใหม่กว่า และ Sonnet 4.6 รองรับ 1M token context window บน Vertex AI Claude Code เปิดใช้งาน extended context window โดยอัตโนมัติเมื่อคุณเลือก 1M model variant

การแก้ปัญหา

"Could not load the default credentials": รัน gcloud auth application-default login เพื่อตั้งค่า Application Default Credentials

ปัญหา quota: ตรวจสอบ quota ปัจจุบันหรือขอเพิ่ม quota ผ่าน Cloud Console

"model not found" 404 errors: ยืนยันว่า model เปิดใช้งานใน Model Garden และตรวจสอบว่า model พร้อมใช้งานในตำแหน่งที่คุณระบุ

429 errors: สำหรับ regional endpoint ให้แน่ใจว่า primary model และ small/fast model รองรับใน region ที่เลือก พิจารณาสลับไปใช้ CLOUD_ML_REGION=global

ทรัพยากรเพิ่มเติม