Cyber Safety ใน Codex
OpenAI จัดประเภท GPT-5.3-Codex ว่ามี "High cybersecurity capability" ภายใต้ Preparedness Framework ซึ่งต้องการมาตรการป้องกันที่เข้มแข็งขึ้น โดย model มี safety training เพื่อปฏิเสธ request ที่เป็นอันตรายอย่างชัดเจน และระบบ monitoring อัตโนมัติ
มาตรการป้องกันหลัก
Model Protection
ระบบใช้ "automated classifier-based monitors" ที่ตรวจจับสัญญาณของ suspicious cyber activity และส่ง high-risk traffic ไปยัง model ที่มีความสามารถด้าน cyber น้อยกว่า (GPT-5.2)
ผลกระทบที่คาดหวัง
OpenAI คาดว่าจะมีผลกระทบเล็กน้อย กระทบเฉพาะ traffic ที่ถูกต้องส่วนน้อย ขณะที่ป้องกันการใช้งานในทางที่ผิด
เหตุผลด้านนโยบาย
ความสามารถด้าน cybersecurity เป็น dual-use technology — มีประโยชน์สำหรับงาน defensive เช่น penetration testing และ vulnerability research แต่อาจเป็นอันตรายหากใช้ผิดวัตถุประสงค์ OpenAI ยอมรับความสมดุลนี้และมุ่งเปิดให้ security professional ที่ถูกกฎหมายใช้งานได้ ขณะที่ป้องกันการใช้งานในทางที่ผิด
Trusted Access Program
นักพัฒนาและ security researcher สามารถรักษา full access ได้โดย:
- ยืนยันตัวตนที่
chatgpt.com/cyber - Enterprise team ขอ trusted access ผ่านตัวแทน OpenAI
- นักวิจัยระดับสูงสมัครเข้า invite-only program เพื่อความสามารถเพิ่มเติม
ผู้ใช้ทุกคนต้องปฏิบัติตาม Usage Policies และ Terms of Use ของ OpenAI โดยไม่คำนึงถึง access tier
การจัดการ False Positives
กิจกรรมที่ถูกต้องอาจถูก reroute โดยไม่ตั้งใจในบางครั้ง ผู้ใช้สามารถรายงาน false positive ผ่านคำสั่ง /feedback เพื่อช่วย OpenAI ปรับปรุงระบบตรวจจับ