เพิ่มความเร็วการตอบสนองด้วย Fast Mode
รับการตอบสนอง Opus ที่เร็วขึ้นใน Claude Code โดยเปิด fast mode
Fast mode อยู่ใน research preview ฟีเจอร์ pricing และความพร้อมใช้งานอาจเปลี่ยนแปลงตาม feedback
Fast mode คือ high-speed configuration สำหรับ Claude Opus ทำให้โมเดลเร็วขึ้นสูงสุด 2.5x ในราคาต่อ token ที่สูงขึ้น เปิดใช้งานด้วย /fast เมื่อคุณต้องการความเร็วสำหรับงานแบบ interactive เช่น rapid iteration หรือ live debugging และปิดใช้งานเมื่อต้นทุนสำคัญกว่า latency
Fast mode ไม่ใช่โมเดลที่แตกต่างกัน มันใช้ Claude Opus พร้อม API configuration ที่แตกต่างซึ่งให้ความสำคัญกับความเร็วมากกว่า cost efficiency คุณได้รับคุณภาพและความสามารถเดียวกันพร้อมการตอบสนองที่เร็วขึ้น Fast mode รองรับ Opus 4.8, Opus 4.7 และ Opus 4.6
Fast mode สำหรับ Opus 4.6 deprecated และจะถูกลบออกประมาณ 30 วันหลัง Opus 4.8 launch หลังจากลบออก fast mode บน Opus 4.6 จะ fallback เป็น standard speed ที่ standard pricing ย้ายไปใช้ Opus 4.8 หรือ Opus 4.7 เพื่อคง speedup
Fast mode ต้องใช้ Claude Code v2.1.36 ขึ้นไป ตรวจสอบเวอร์ชันด้วย claude --version
Toggle fast mode
เปิดหรือปิด fast mode ด้วย:
- พิมพ์
/fastและกด Tab เพื่อ toggle - ตั้ง
"fastMode": trueใน user settings file
ตามค่าเริ่มต้น fast mode คงอยู่ข้าม sessions
เมื่อคุณเปิด fast mode:
- หากคุณใช้โมเดลอื่น Claude Code สลับไปยัง Opus อัตโนมัติ
- คุณจะเห็น confirmation message: "Fast mode ON"
- ไอคอน
↯ขนาดเล็กปรากฏข้าง prompt ขณะที่ fast mode active - รัน
/fastอีกครั้งเพื่อตรวจสอบว่า fast mode on หรือ off
เมื่อปิด fast mode ด้วย /fast อีกครั้ง คุณยังคงอยู่บน Opus โมเดลไม่ revert ไปยัง model ก่อนหน้า
Opus 4.8 เป็น fast mode default ใน Claude Code v2.1.154 ขึ้นไป
เข้าใจ cost tradeoff
Fast mode มี per-token pricing ที่สูงกว่า standard Opus:
| โมเดล | Input (MTok) | Output (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 และ Opus 4.6 | $30 | $150 |
Fast mode pricing คงที่ตลอด context window 1M token เต็ม
ครั้งแรกที่คุณเปิด fast mode ในการสนทนา คุณจ่าย fast mode uncached input token price เต็มสำหรับ context การสนทนาทั้งหมด ยิ่งลึกเข้าไปใน conversation ยิ่งมีต้นทุนมากขึ้น ดังนั้นการเปิด fast mode ตั้งแต่ต้นถูกกว่า ต้นทุนนี้ใช้ครั้งเดียวต่อการสนทนา ดังนั้นการ toggle fast mode off และ on อีกครั้งในภายหลังไม่ซ้ำ
ตัดสินใจว่าจะใช้ fast mode เมื่อไหร่
Fast mode เหมาะสมที่สุดสำหรับงาน interactive ที่ response latency สำคัญกว่าต้นทุน:
- Rapid iteration บนการเปลี่ยนแปลง code
- Live debugging sessions
- งานที่มี deadlines แน่น
Standard mode ดีกว่าสำหรับ:
- Long autonomous tasks ที่ความเร็วสำคัญน้อยกว่า
- Batch processing หรือ CI/CD pipelines
- Workloads ที่ sensitive ต่อต้นทุน
Fast mode เทียบกับ effort level
| Setting | ผล |
|---|---|
| Fast mode | คุณภาพโมเดลเดียวกัน latency ต่ำกว่า ต้นทุนสูงกว่า |
| Lower effort level | เวลา thinking น้อยลง การตอบสนองเร็วขึ้น คุณภาพอาจต่ำกว่าสำหรับ complex tasks |
คุณสามารถรวมทั้งสอง: ใช้ fast mode พร้อม lower effort level เพื่อความเร็วสูงสุดสำหรับ straightforward tasks
ข้อกำหนด
Fast mode ต้องการทั้งหมดต่อไปนี้:
- Anthropic API หรือ subscription เท่านั้น: ไม่รองรับ Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry หรือ Claude Platform on AWS
- Usage credits เปิดใช้งาน: account ต้องมี usage credits เปิดใช้งาน
Fast mode usage ดึงจาก usage credits โดยตรงแม้ว่าคุณจะมี usage ที่เหลือใน plan ของคุณ
- Admin enablement สำหรับ Team และ Enterprise: fast mode ปิดใช้งานตามค่าเริ่มต้นสำหรับ Team และ Enterprise organizations
เปิดใช้งาน fast mode สำหรับองค์กร
Admin สามารถเปิดใช้งาน fast mode ได้ที่:
- Console (API customers): Claude Code preferences
- Claude AI (Team และ Enterprise): Admin Settings > Claude Code
ตั้ง CLAUDE_CODE_DISABLE_FAST_MODE=1 เพื่อปิดใช้งาน fast mode ทั้งหมด
ต้องการ per-session opt-in
Admin บน Team หรือ Enterprise plans สามารถป้องกัน persistence โดยตั้ง fastModePerSessionOptIn เป็น true ใน managed settings:
{
"fastModePerSessionOptIn": true
}
ทำให้แต่ละ session เริ่มต้นด้วย fast mode off
จัดการ rate limits
Fast mode มี rate limits แยกจาก standard Opus เมื่อคุณถึง fast mode rate limit หรือหมด usage credits:
- Fast mode fallback อัตโนมัติเป็น standard speed
- ไอคอน
↯เปลี่ยนเป็นสีเทาเพื่อบ่งชี้ cooldown - คุณทำงานต่อด้วย standard speed และ pricing
- เมื่อ cooldown หมด fast mode เปิดใช้งานใหม่อัตโนมัติ
ในการปิด fast mode ด้วยตนเองแทนที่จะรอ cooldown รัน /fast อีกครั้ง
Research preview
Fast mode เป็น research preview feature:
- ฟีเจอร์อาจเปลี่ยนแปลงตาม feedback
- ความพร้อมใช้งานและ pricing อาจเปลี่ยนแปลง
- API configuration ที่อยู่เบื้องหลังอาจ evolve
รายงานปัญหาหรือ feedback ผ่าน Anthropic support channels ปกติของคุณ
ดูเพิ่มเติม
- Model configuration: สลับโมเดลและปรับ effort levels
- จัดการต้นทุนอย่างมีประสิทธิภาพ: ติดตาม token usage และลดต้นทุน
- Status line configuration: แสดงข้อมูลโมเดลและ context