Voice Dictation
พูด prompts ของคุณใน Claude Code CLI ด้วย hold-to-record หรือ tap-to-record voice dictation
พูด prompts แทนการพิมพ์ใน Claude Code CLI คำพูดของคุณจะถูก transcribed แบบ live เข้าสู่ prompt input ดังนั้นคุณสามารถผสมระหว่างเสียงและการพิมพ์ใน message เดียวกันได้ เปิดใช้งาน dictation ด้วย /voice จากนั้นกดปุ่มค้างขณะพูดหรือแตะครั้งหนึ่งเพื่อเริ่มและแตะอีกครั้งเพื่อส่ง
Voice dictation ต้องการ Claude Code v2.1.69 หรือใหม่กว่า Tap mode ต้องการ v2.1.116 หรือใหม่กว่า ตรวจสอบเวอร์ชันของคุณด้วย claude --version
ข้อกำหนด
Voice dictation stream audio ที่บันทึกของคุณไปยัง Anthropic servers สำหรับ transcription audio ไม่ได้ประมวลผลในท้องถิ่น
บริการ speech-to-text พร้อมใช้งานเมื่อ:
- Authenticate ด้วยบัญชี Claude.ai เท่านั้น
- ไม่พร้อมใช้งาน เมื่อ Claude Code ตั้งค่าให้ใช้ Anthropic API key โดยตรง, Amazon Bedrock, Google Vertex AI, หรือ Microsoft Foundry
- ไม่พร้อมใช้งาน เมื่อองค์กรของคุณเปิดใช้ HIPAA compliance
Voice dictation ยังต้องการ microphone access ในท้องถิ่น ดังนั้นไม่ทำงานใน remote environments เช่น Claude Code บนเว็บหรือ SSH sessions
เปิดใช้งาน Voice Dictation
รัน /voice เพื่อเปิดใช้งาน dictation ครั้งแรกที่เปิดใช้งาน Claude Code จะรัน microphone check
คำสั่ง /voice รับ argument เสริม:
| คำสั่ง | ผล |
|---|---|
/voice | Toggle เปิดหรือปิด รักษา mode ปัจจุบัน |
/voice hold | เปิดใช้งานใน hold mode |
/voice tap | เปิดใช้งานใน tap mode |
/voice off | ปิดใช้งาน |
ตั้งค่าตรงๆ ใน user settings file:
{
"voice": {
"enabled": true,
"mode": "tap"
}
}
Hold to Record
Hold mode คือ push-to-talk: การบันทึกทำงานขณะที่คุณกดปุ่มค้างและหยุดเมื่อคุณปล่อย นี่คือ mode เริ่มต้น
กด Space ค้างเพื่อเริ่มบันทึก footer แสดง keep holding… ระหว่างช่วง warmup จากนั้นสลับเป็น live waveform เมื่อการบันทึกทำงาน
เพื่อข้าม warmup สลับไปยัง tap mode ด้วย /voice tap หรือ rebind เป็น modifier combination เช่น meta+k Modifier combos เริ่มบันทึกทันทีในการกดครั้งแรก
คำพูดของคุณปรากฏใน prompt ขณะพูด หมองจนกว่า transcript จะ finalized ปล่อย Space เพื่อหยุดบันทึกและ finalize ข้อความ
โดยค่าเริ่มต้น การปล่อยปุ่มจะ insert transcript และรอให้คุณกด Enter ตั้ง "autoSubmit": true ใน voice settings เพื่อส่ง prompt โดยอัตโนมัติเมื่อคุณปล่อยปุ่ม
Tap to Record and Send
Tap mode toggle การบันทึกด้วยการกดปุ่มครั้งเดียว: แตะครั้งหนึ่งเพื่อเริ่ม พูด แล้วแตะอีกครั้งเพื่อส่ง
เปิดใช้งาน tap mode ด้วย /voice tap
Claude Code insert transcript และ submit prompt โดยอัตโนมัติเมื่อ transcript มีอย่างน้อย 3 คำ transcript ที่สั้นกว่าจะถูก insert แต่ไม่ submit
เปลี่ยนภาษาการพูด
Voice dictation ใช้ language setting เดียวกันที่ควบคุมภาษาตอบสนองของ Claude หาก setting นั้นว่างเปล่า dictation ค่าเริ่มต้นเป็นภาษาอังกฤษ
ภาษาที่รองรับสำหรับ dictation:
| ภาษา | Code |
|---|---|
| Czech | cs |
| Danish | da |
| Dutch | nl |
| English | en |
| French | fr |
| German | de |
| Greek | el |
| Hindi | hi |
| Indonesian | id |
| Italian | it |
| Japanese | ja |
| Korean | ko |
| Norwegian | no |
| Polish | pl |
| Portuguese | pt |
| Russian | ru |
| Spanish | es |
| Swedish | sv |
| Turkish | tr |
| Ukrainian | uk |
ตั้งภาษาใน settings:
{
"language": "japanese"
}
Rebind Dictation Key
Dictation key ผูกกับ voice:pushToTalk ใน Chat context และค่าเริ่มต้นเป็น Space Rebind ใน ~/.claude/keybindings.json:
{
"bindings": [
{
"context": "Chat",
"bindings": {
"meta+k": "voice:pushToTalk",
"space": null
}
}
]
}
การแก้ไขปัญหา
Voice mode requires a Claude.ai account: คุณ authenticate ด้วย API key หรือ third-party provider รัน/loginเพื่อล็อกอินด้วยบัญชี Claude.aiMicrophone access is denied: ให้สิทธิ์ microphone แก่ terminal ของคุณใน system settings- macOS: System Settings → Privacy & Security → Microphone
- Windows: Settings → Privacy & security → Microphone
No audio recording tool foundบน Linux: Native audio module ไม่สามารถโหลดได้ ติดตั้ง SoX:sudo apt-get install sox- ไม่มีอะไรเกิดขึ้นเมื่อกด
Spaceค้างใน hold mode: ดู prompt input ขณะกด หาก spaces สะสมอยู่ voice dictation อาจปิดอยู่ รัน/voice hold No audio detected from microphone: การบันทึกเริ่มต้นแต่ capture silence ยืนยัน input device ที่ถูกต้องถูกตั้งเป็น system defaultNo speech detected: audio ถึง transcription service แต่ไม่มีคำถูกจดจำ พูดให้ใกล้ microphone มากขึ้น, ลดเสียง background noise, และยืนยัน dictation language
ดูเพิ่มเติม
- Customize keyboard shortcuts: rebind
voice:pushToTalkและ keyboard actions อื่นๆ - Configure settings: อ้างอิงสำหรับ
voice,language, และ settings keys อื่นๆ - Interactive mode: keyboard shortcuts, input modes, และ session controls
- Commands: อ้างอิงสำหรับ
/voice,/config, และคำสั่งอื่นๆ ทั้งหมด