Cyber Safety ใน Codex

OpenAI จัดประเภท GPT-5.3-Codex ว่ามี "High cybersecurity capability" ภายใต้ Preparedness Framework ซึ่งต้องการมาตรการป้องกันที่เข้มแข็งขึ้น โดย model มี safety training เพื่อปฏิเสธ request ที่เป็นอันตรายอย่างชัดเจน และระบบ monitoring อัตโนมัติ

มาตรการป้องกันหลัก

Model Protection

ระบบใช้ "automated classifier-based monitors" ที่ตรวจจับสัญญาณของ suspicious cyber activity และส่ง high-risk traffic ไปยัง model ที่มีความสามารถด้าน cyber น้อยกว่า (GPT-5.2)

ผลกระทบที่คาดหวัง

OpenAI คาดว่าจะมีผลกระทบเล็กน้อย กระทบเฉพาะ traffic ที่ถูกต้องส่วนน้อย ขณะที่ป้องกันการใช้งานในทางที่ผิด

เหตุผลด้านนโยบาย

ความสามารถด้าน cybersecurity เป็น dual-use technology — มีประโยชน์สำหรับงาน defensive เช่น penetration testing และ vulnerability research แต่อาจเป็นอันตรายหากใช้ผิดวัตถุประสงค์ OpenAI ยอมรับความสมดุลนี้และมุ่งเปิดให้ security professional ที่ถูกกฎหมายใช้งานได้ ขณะที่ป้องกันการใช้งานในทางที่ผิด

Trusted Access Program

นักพัฒนาและ security researcher สามารถรักษา full access ได้โดย:

ยืนยันตัวตนที่ chatgpt.com/cyber
Enterprise team ขอ trusted access ผ่านตัวแทน OpenAI
นักวิจัยระดับสูงสมัครเข้า invite-only program เพื่อความสามารถเพิ่มเติม

ผู้ใช้ทุกคนต้องปฏิบัติตาม Usage Policies และ Terms of Use ของ OpenAI โดยไม่คำนึงถึง access tier

การจัดการ False Positives

กิจกรรมที่ถูกต้องอาจถูก reroute โดยไม่ตั้งใจในบางครั้ง ผู้ใช้สามารถรายงาน false positive ผ่านคำสั่ง /feedback เพื่อช่วย OpenAI ปรับปรุงระบบตรวจจับ

มาตรการป้องกันหลัก​

Model Protection​

ผลกระทบที่คาดหวัง​

เหตุผลด้านนโยบาย​

Trusted Access Program​

การจัดการ False Positives​