เพิ่มความเร็วการตอบสนองด้วย Fast Mode

รับการตอบสนอง Opus ที่เร็วขึ้นใน Claude Code โดยเปิด fast mode

note

Fast mode อยู่ใน research preview ฟีเจอร์ pricing และความพร้อมใช้งานอาจเปลี่ยนแปลงตาม feedback

Fast mode คือ high-speed configuration สำหรับ Claude Opus ทำให้โมเดลเร็วขึ้นสูงสุด 2.5x ในราคาต่อ token ที่สูงขึ้น เปิดใช้งานด้วย /fast เมื่อคุณต้องการความเร็วสำหรับงานแบบ interactive เช่น rapid iteration หรือ live debugging และปิดใช้งานเมื่อต้นทุนสำคัญกว่า latency

Fast mode ไม่ใช่โมเดลที่แตกต่างกัน มันใช้ Claude Opus พร้อม API configuration ที่แตกต่างซึ่งให้ความสำคัญกับความเร็วมากกว่า cost efficiency คุณได้รับคุณภาพและความสามารถเดียวกันพร้อมการตอบสนองที่เร็วขึ้น Fast mode รองรับ Opus 4.8, Opus 4.7 และ Opus 4.6

warning

Fast mode สำหรับ Opus 4.6 deprecated และจะถูกลบออกประมาณ 30 วันหลัง Opus 4.8 launch หลังจากลบออก fast mode บน Opus 4.6 จะ fallback เป็น standard speed ที่ standard pricing ย้ายไปใช้ Opus 4.8 หรือ Opus 4.7 เพื่อคง speedup

note

Fast mode ต้องใช้ Claude Code v2.1.36 ขึ้นไป ตรวจสอบเวอร์ชันด้วย claude --version

Toggle fast mode

เปิดหรือปิด fast mode ด้วย:

พิมพ์ /fast และกด Tab เพื่อ toggle
ตั้ง "fastMode": true ใน user settings file

ตามค่าเริ่มต้น fast mode คงอยู่ข้าม sessions

เมื่อคุณเปิด fast mode:

หากคุณใช้โมเดลอื่น Claude Code สลับไปยัง Opus อัตโนมัติ
คุณจะเห็น confirmation message: "Fast mode ON"
ไอคอน ↯ ขนาดเล็กปรากฏข้าง prompt ขณะที่ fast mode active
รัน /fast อีกครั้งเพื่อตรวจสอบว่า fast mode on หรือ off

เมื่อปิด fast mode ด้วย /fast อีกครั้ง คุณยังคงอยู่บน Opus โมเดลไม่ revert ไปยัง model ก่อนหน้า

Opus 4.8 เป็น fast mode default ใน Claude Code v2.1.154 ขึ้นไป

เข้าใจ cost tradeoff

Fast mode มี per-token pricing ที่สูงกว่า standard Opus:

โมเดล	Input (MTok)	Output (MTok)
Opus 4.8	$10	$50
Opus 4.7 และ Opus 4.6	$30	$150

Fast mode pricing คงที่ตลอด context window 1M token เต็ม

ครั้งแรกที่คุณเปิด fast mode ในการสนทนา คุณจ่าย fast mode uncached input token price เต็มสำหรับ context การสนทนาทั้งหมด ยิ่งลึกเข้าไปใน conversation ยิ่งมีต้นทุนมากขึ้น ดังนั้นการเปิด fast mode ตั้งแต่ต้นถูกกว่า ต้นทุนนี้ใช้ครั้งเดียวต่อการสนทนา ดังนั้นการ toggle fast mode off และ on อีกครั้งในภายหลังไม่ซ้ำ

ตัดสินใจว่าจะใช้ fast mode เมื่อไหร่

Fast mode เหมาะสมที่สุดสำหรับงาน interactive ที่ response latency สำคัญกว่าต้นทุน:

Rapid iteration บนการเปลี่ยนแปลง code
Live debugging sessions
งานที่มี deadlines แน่น

Standard mode ดีกว่าสำหรับ:

Long autonomous tasks ที่ความเร็วสำคัญน้อยกว่า
Batch processing หรือ CI/CD pipelines
Workloads ที่ sensitive ต่อต้นทุน

Fast mode เทียบกับ effort level

Setting	ผล
Fast mode	คุณภาพโมเดลเดียวกัน latency ต่ำกว่า ต้นทุนสูงกว่า
Lower effort level	เวลา thinking น้อยลง การตอบสนองเร็วขึ้น คุณภาพอาจต่ำกว่าสำหรับ complex tasks

คุณสามารถรวมทั้งสอง: ใช้ fast mode พร้อม lower effort level เพื่อความเร็วสูงสุดสำหรับ straightforward tasks

ข้อกำหนด

Fast mode ต้องการทั้งหมดต่อไปนี้:

Anthropic API หรือ subscription เท่านั้น: ไม่รองรับ Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry หรือ Claude Platform on AWS
Usage credits เปิดใช้งาน: account ต้องมี usage credits เปิดใช้งาน

note

Fast mode usage ดึงจาก usage credits โดยตรงแม้ว่าคุณจะมี usage ที่เหลือใน plan ของคุณ

Admin enablement สำหรับ Team และ Enterprise: fast mode ปิดใช้งานตามค่าเริ่มต้นสำหรับ Team และ Enterprise organizations

เปิดใช้งาน fast mode สำหรับองค์กร

Admin สามารถเปิดใช้งาน fast mode ได้ที่:

Console (API customers): Claude Code preferences
Claude AI (Team และ Enterprise): Admin Settings > Claude Code

ตั้ง CLAUDE_CODE_DISABLE_FAST_MODE=1 เพื่อปิดใช้งาน fast mode ทั้งหมด

ต้องการ per-session opt-in

Admin บน Team หรือ Enterprise plans สามารถป้องกัน persistence โดยตั้ง fastModePerSessionOptIn เป็น true ใน managed settings:

{
  "fastModePerSessionOptIn": true
}

ทำให้แต่ละ session เริ่มต้นด้วย fast mode off

จัดการ rate limits

Fast mode มี rate limits แยกจาก standard Opus เมื่อคุณถึง fast mode rate limit หรือหมด usage credits:

Fast mode fallback อัตโนมัติเป็น standard speed
ไอคอน ↯ เปลี่ยนเป็นสีเทาเพื่อบ่งชี้ cooldown
คุณทำงานต่อด้วย standard speed และ pricing
เมื่อ cooldown หมด fast mode เปิดใช้งานใหม่อัตโนมัติ

ในการปิด fast mode ด้วยตนเองแทนที่จะรอ cooldown รัน /fast อีกครั้ง

Research preview

Fast mode เป็น research preview feature:

ฟีเจอร์อาจเปลี่ยนแปลงตาม feedback
ความพร้อมใช้งานและ pricing อาจเปลี่ยนแปลง
API configuration ที่อยู่เบื้องหลังอาจ evolve

รายงานปัญหาหรือ feedback ผ่าน Anthropic support channels ปกติของคุณ

ดูเพิ่มเติม

Model configuration: สลับโมเดลและปรับ effort levels
จัดการต้นทุนอย่างมีประสิทธิภาพ: ติดตาม token usage และลดต้นทุน
Status line configuration: แสดงข้อมูลโมเดลและ context

Toggle fast mode​

เข้าใจ cost tradeoff​

ตัดสินใจว่าจะใช้ fast mode เมื่อไหร่​

Fast mode เทียบกับ effort level​

ข้อกำหนด​

เปิดใช้งาน fast mode สำหรับองค์กร​

ต้องการ per-session opt-in​

จัดการ rate limits​

Research preview​

ดูเพิ่มเติม​

Toggle fast mode

เข้าใจ cost tradeoff

ตัดสินใจว่าจะใช้ fast mode เมื่อไหร่

Fast mode เทียบกับ effort level

ข้อกำหนด

เปิดใช้งาน fast mode สำหรับองค์กร

ต้องการ per-session opt-in

จัดการ rate limits

Research preview

ดูเพิ่มเติม