อังกฤษปั้น ‘AI Security Institute’ ตรวจโมเดล AI ขั้นสูง หวังลดอันตรายจากการใช้ AI ผิดทาง สู่ต้นแบบระดับนานาชาติ

  •  
  •  
  •  
  •  
  •  

 

AI กำลังพัฒนาเร็วขึ้นจากเครื่องมือช่วยทำงานทั่วไป สู่ระบบที่เขียนโค้ด วิเคราะห์ข้อมูล ค้นหาช่องโหว่ และช่วยแก้ปัญหาทางเทคนิคได้ซับซ้อนกว่าเดิม ความสามารถเหล่านี้ทำให้ AI ถูกนำไปใช้ในหลายอุตสาหกรรมมากขึ้น แต่ขณะเดียวกันก็เพิ่มความกังวลด้านไซเบอร์ซิเคียวริตี้ อาชญากรรม และความมั่นคง เพราะโมเดลที่ช่วยป้องกันระบบได้ ก็อาจถูกใช้เพื่อค้นหาจุดอ่อน เขียนโค้ดโจมตี หรือวางแผนโจมตีทางไซเบอร์ได้เช่นกัน

หนึ่งในตัวอย่างที่ทำให้ความเสี่ยงนี้ชัดขึ้นคือ Claude Mythos Preview จาก Anthropic ซึ่ง AI Security Institute ของอังกฤษประเมินว่ามีความสามารถด้านไซเบอร์สูงขึ้นเมื่อเทียบกับโมเดลรุ่นก่อน การทดสอบครอบคลุมทั้งโจทย์แบบ Capture the Flag และการจำลองการโจมตีไซเบอร์หลายขั้นตอน ทำให้การตรวจสอบโมเดล AI ขั้นสูงกลายเป็นประเด็นที่รัฐบาลหลายประเทศให้ความสำคัญมากขึ้น

 

อังกฤษตั้งหน่วยงานรัฐมาตรวจโมเดล AI ขั้นสูง

 

Newyork Times รายงานว่าอังกฤษกำลังใช้ AI Security Institute เป็นหน่วยงานหลักในการประเมินความเสี่ยงของโมเดล AI ขั้นสูง โดยสถาบันแห่งนี้มีพนักงานราว 100 คน จากหน่วยงานข่าวกรอง สถาบันการศึกษา และบริษัทเทคโนโลยี รวมถึงบุคลากรเก่าจาก OpenAI และ Google

ทีมงานของสถาบันประกอบด้วยผู้เชี่ยวชาญหลายด้าน เช่น ผู้ตรวจสอบอาวุธ นักระบาดวิทยา ผู้ถอดรหัส นักวิจัย AI และผู้เชี่ยวชาญด้านไซเบอร์ซิเคียวริตี้ หน้าที่หลักคือการทดสอบโมเดล AI ชั้นนำจากบริษัทเทคโนโลยีรายใหญ่ เพื่อประเมินว่าโมเดลแต่ละรุ่นมีความสามารถระดับใด มีช่องโหว่ตรงไหน และอาจถูกนำไปใช้ในทางอันตรายได้มากน้อยเพียงใด

รัฐบาลอังกฤษเปลี่ยนชื่อหน่วยงานจาก AI Safety Institute เป็น AI Security Institute ในปี 2025 เพื่อเน้นงานด้านความมั่นคง อาชญากรรม และการใช้ AI ในทางผิดมากขึ้น

 

จำลองการโจมตี เพื่อดูว่า AI หลุดระบบป้องกันได้แค่ไหน 

 

หนึ่งในวิธีทำงานของ AI Security Institute คือการใช้ทีม Red Team จำลองการโจมตีระบบ AI เพื่อดูว่าโมเดลสามารถถูกหลอกให้ข้ามมาตรการป้องกันได้หรือไม่

แซนเดอร์ เดวีส์ และทีม Red Team ของสถาบันเพิ่งทดสอบแชทบอท ChatGPT รุ่นใหม่ล่าสุดของ OpenAI และสามารถหลอกให้โมเดลให้คำแนะนำเกี่ยวกับการแฮ็กได้ภายในเวลาประมาณ 6 ชั่วโมง หลังพบปัญหา สถาบันจะแบ่งปันผลการทดสอบกับบริษัทเจ้าของโมเดล เพื่อให้รับทราบช่องโหว่และปรับปรุงมาตรการป้องกัน

การทดสอบลักษณะนี้นอกจากจะดูว่าโมเดลตอบคำถามได้ดีหรือไม่แล้ว ยังดูว่าโมเดลสามารถวิเคราะห์โจทย์ วางลำดับงาน ค้นหาช่องโหว่ และช่วยจำลองแนวทางโจมตีได้แค่ไหน สถาบันยังทดสอบความเสี่ยงด้านเคมี ชีววิทยา และข้อมูลที่อาจถูกนำไปใช้สร้างอันตรายในโลกจริงด้วย

 

ผลลัพธ์ที่น่ากังวล

 

นับตั้งแต่ก่อตั้งเมื่อเกือบ 3 ปีก่อน AI Security Institute ระบุว่าพบช่องโหว่ด้านความปลอดภัยที่สำคัญในโมเดล AI ชั้นนำทุกตัวที่ถูกทดสอบ รวมถึง Claude ของ Anthropic และ Gemini ของ Google

มีการระบุว่าสามารถทำให้ระบบ AI ให้ข้อมูลเกี่ยวกับการผลิตอาวุธเคมีและชีวภาพ รวมถึงช่วยวางแผนและดำเนินการโจมตีทางไซเบอร์ได้ ผลการทดสอบเหล่านี้ถูกใช้ทั้งในงานวิจัย และการทำงานร่วมกับหน่วยงานความมั่นคงแห่งชาติของอังกฤษ เพื่อระบุภัยคุกคามใหม่และเตรียมมาตรการรับมือ

 

ต่อยอดสู่ต้นแบบให้ประเทศอื่น

 

งานของ AI Security Institute เริ่มถูกจับตาโดยรัฐบาลประเทศอื่น ในช่วงที่หลายประเทศยังขาดความเชี่ยวชาญทางเทคนิคในการตรวจสอบโมเดล AI และยังต้องพึ่งพาบริษัทเทคโนโลยีในการประเมินความปลอดภัยของระบบเป็นหลัก

รัฐบาลสหรัฐฯ ภายใต้โดนัลด์ ทรัมป์ กำลังพิจารณากฎระเบียบสำหรับการตรวจสอบโมเดล AI ซึ่งมีลักษณะคล้ายกับแนวทางที่อังกฤษเริ่มใช้ ขณะที่หลายประเทศตั้งหน่วยงานตรวจความปลอดภัย AI ของตัวเองแล้ว เช่น สหรัฐฯ ภายใต้ NIST, Japan AI Safety Institute ของญี่ปุ่น และ Singapore AI Safety Institute ของสิงคโปร์

ริชี ซูนัค อดีตนายกรัฐมนตรีอังกฤษ ผู้ก่อตั้งสถาบัน ระบุว่า “บริษัทต่างๆ ไม่ควรถูกปล่อยให้ประเมินผลงานของตัวเอง”

 

การตรวจ AI อาจกลายเป็นเงื่อนไขใหม่ของอุตสาหกรรม

 

หากการทดสอบโดยหน่วยงานกลางถูกใช้กว้างขึ้น ผลประเมินความเสี่ยงของ AI อาจกลายเป็นเงื่อนไขสำคัญของอุตสาหกรรม โดยเฉพาะโมเดลที่ถูกนำไปใช้ในงานการเงิน สุขภาพ พลังงาน รัฐบาล โครงสร้างพื้นฐาน และไซเบอร์ซิเคียวริตี้

บริษัทเทคโนโลยีอาจต้องแสดงข้อมูลมากขึ้นว่าโมเดลผ่านการประเมินด้านความปลอดภัยอย่างไร ขณะที่องค์กรที่นำ AI ไปใช้ในงานสำคัญอาจต้องพิจารณาผลทดสอบจากหน่วยงานรัฐหรือหน่วยงานอิสระก่อนเลือกใช้โมเดล

Source: NYTimes


  •  
  •  
  •  
  •  
  •