Skip to main content

Voice Dictation

พูด prompts ของคุณใน Claude Code CLI ด้วย hold-to-record หรือ tap-to-record voice dictation

พูด prompts แทนการพิมพ์ใน Claude Code CLI คำพูดของคุณจะถูก transcribed แบบ live เข้าสู่ prompt input ดังนั้นคุณสามารถผสมระหว่างเสียงและการพิมพ์ใน message เดียวกันได้ เปิดใช้งาน dictation ด้วย /voice จากนั้นกดปุ่มค้างขณะพูดหรือแตะครั้งหนึ่งเพื่อเริ่มและแตะอีกครั้งเพื่อส่ง

note

Voice dictation ต้องการ Claude Code v2.1.69 หรือใหม่กว่า Tap mode ต้องการ v2.1.116 หรือใหม่กว่า ตรวจสอบเวอร์ชันของคุณด้วย claude --version

ข้อกำหนด

Voice dictation stream audio ที่บันทึกของคุณไปยัง Anthropic servers สำหรับ transcription audio ไม่ได้ประมวลผลในท้องถิ่น

บริการ speech-to-text พร้อมใช้งานเมื่อ:

  • Authenticate ด้วยบัญชี Claude.ai เท่านั้น
  • ไม่พร้อมใช้งาน เมื่อ Claude Code ตั้งค่าให้ใช้ Anthropic API key โดยตรง, Amazon Bedrock, Google Vertex AI, หรือ Microsoft Foundry
  • ไม่พร้อมใช้งาน เมื่อองค์กรของคุณเปิดใช้ HIPAA compliance

Voice dictation ยังต้องการ microphone access ในท้องถิ่น ดังนั้นไม่ทำงานใน remote environments เช่น Claude Code บนเว็บหรือ SSH sessions

เปิดใช้งาน Voice Dictation

รัน /voice เพื่อเปิดใช้งาน dictation ครั้งแรกที่เปิดใช้งาน Claude Code จะรัน microphone check

คำสั่ง /voice รับ argument เสริม:

คำสั่งผล
/voiceToggle เปิดหรือปิด รักษา mode ปัจจุบัน
/voice holdเปิดใช้งานใน hold mode
/voice tapเปิดใช้งานใน tap mode
/voice offปิดใช้งาน

ตั้งค่าตรงๆ ใน user settings file:

{
"voice": {
"enabled": true,
"mode": "tap"
}
}

Hold to Record

Hold mode คือ push-to-talk: การบันทึกทำงานขณะที่คุณกดปุ่มค้างและหยุดเมื่อคุณปล่อย นี่คือ mode เริ่มต้น

กด Space ค้างเพื่อเริ่มบันทึก footer แสดง keep holding… ระหว่างช่วง warmup จากนั้นสลับเป็น live waveform เมื่อการบันทึกทำงาน

tip

เพื่อข้าม warmup สลับไปยัง tap mode ด้วย /voice tap หรือ rebind เป็น modifier combination เช่น meta+k Modifier combos เริ่มบันทึกทันทีในการกดครั้งแรก

คำพูดของคุณปรากฏใน prompt ขณะพูด หมองจนกว่า transcript จะ finalized ปล่อย Space เพื่อหยุดบันทึกและ finalize ข้อความ

โดยค่าเริ่มต้น การปล่อยปุ่มจะ insert transcript และรอให้คุณกด Enter ตั้ง "autoSubmit": true ใน voice settings เพื่อส่ง prompt โดยอัตโนมัติเมื่อคุณปล่อยปุ่ม

Tap to Record and Send

Tap mode toggle การบันทึกด้วยการกดปุ่มครั้งเดียว: แตะครั้งหนึ่งเพื่อเริ่ม พูด แล้วแตะอีกครั้งเพื่อส่ง

เปิดใช้งาน tap mode ด้วย /voice tap

Claude Code insert transcript และ submit prompt โดยอัตโนมัติเมื่อ transcript มีอย่างน้อย 3 คำ transcript ที่สั้นกว่าจะถูก insert แต่ไม่ submit

เปลี่ยนภาษาการพูด

Voice dictation ใช้ language setting เดียวกันที่ควบคุมภาษาตอบสนองของ Claude หาก setting นั้นว่างเปล่า dictation ค่าเริ่มต้นเป็นภาษาอังกฤษ

ภาษาที่รองรับสำหรับ dictation:

ภาษาCode
Czechcs
Danishda
Dutchnl
Englishen
Frenchfr
Germande
Greekel
Hindihi
Indonesianid
Italianit
Japaneseja
Koreanko
Norwegianno
Polishpl
Portuguesept
Russianru
Spanishes
Swedishsv
Turkishtr
Ukrainianuk

ตั้งภาษาใน settings:

{
"language": "japanese"
}

Rebind Dictation Key

Dictation key ผูกกับ voice:pushToTalk ใน Chat context และค่าเริ่มต้นเป็น Space Rebind ใน ~/.claude/keybindings.json:

{
"bindings": [
{
"context": "Chat",
"bindings": {
"meta+k": "voice:pushToTalk",
"space": null
}
}
]
}

การแก้ไขปัญหา

  • Voice mode requires a Claude.ai account: คุณ authenticate ด้วย API key หรือ third-party provider รัน /login เพื่อล็อกอินด้วยบัญชี Claude.ai
  • Microphone access is denied: ให้สิทธิ์ microphone แก่ terminal ของคุณใน system settings
    • macOS: System Settings → Privacy & Security → Microphone
    • Windows: Settings → Privacy & security → Microphone
  • No audio recording tool found บน Linux: Native audio module ไม่สามารถโหลดได้ ติดตั้ง SoX: sudo apt-get install sox
  • ไม่มีอะไรเกิดขึ้นเมื่อกด Space ค้างใน hold mode: ดู prompt input ขณะกด หาก spaces สะสมอยู่ voice dictation อาจปิดอยู่ รัน /voice hold
  • No audio detected from microphone: การบันทึกเริ่มต้นแต่ capture silence ยืนยัน input device ที่ถูกต้องถูกตั้งเป็น system default
  • No speech detected: audio ถึง transcription service แต่ไม่มีคำถูกจดจำ พูดให้ใกล้ microphone มากขึ้น, ลดเสียง background noise, และยืนยัน dictation language

ดูเพิ่มเติม

  • Customize keyboard shortcuts: rebind voice:pushToTalk และ keyboard actions อื่นๆ
  • Configure settings: อ้างอิงสำหรับ voice, language, และ settings keys อื่นๆ
  • Interactive mode: keyboard shortcuts, input modes, และ session controls
  • Commands: อ้างอิงสำหรับ /voice, /config, และคำสั่งอื่นๆ ทั้งหมด