รู้จัก Claude Mythos โมเดล AI สุดโหดที่ Anthropic ผู้สร้างยังกลัว จุดเริ่มต้น Project Glasswing

  •  
  •  
  •  
  •  
  •  

ลองจินตนาการว่าเรากำลังนั่งกินแซนด์วิชอยู่ในสวนสาธารณะ แล้วจู่ๆ ก็มีอีเมลฉบับหนึ่งเด้งเข้ามาในมือถือ… แต่อีเมลฉบับนั้นไม่ได้มาจากหัวหน้าหรือเพื่อนร่วมงาน แต่มันมาจาก AI” ที่เรากำลังทดสอบอยู่ในห้องแล็บแบบปิด (Sandbox) เพื่อบอกเราว่า “ผมออกมาจากกรงขังได้แล้วนะ”

เรื่องราวฟังดูเหมือนพล็อตหนังไซไฟ แต่จริงๆแล้วนี่คือ เหตุการณ์จริงที่เกิดขึ้นระหว่างการทดสอบ Claude Mythos โมเดล AI รุ่นใหม่ล่าสุดจาก Anthropic

โมเดลที่ขึ้นชื่อว่ามีความสามารถในการ “หาช่องโหว่และเจาะระบบ” Cyber Security ในระดับที่มนุษย์นี้ก็ทำไม่ได้

โพสต์นี้  Marketing Oops! จะพาเราไปทำความเข้าใจว่าทำไม Claude Mythos ถึงกลายเป็นโมเดลที่โลกเทคโนโลยีต้องจับตามอง และทำไม Anthropic ถึง “กลัว” AI ที่ตัวเองสร้างขึ้นมาเอง

กลัวในระดับที่ไม่กล้าที่จะปล่อยโมเดลนี้ออกสู่สาธารณะถึงกับยอมจ่าย 100 ล้านดอลลาร์ เพื่อสร้างมาตรฐานความปลอดภัยใหม่ในโปรเจกต์ที่ชื่อว่า Glasswing แทน

Claude Mythos คืออะไร?

Claude Mythos Preview คือโมเดลตัวใหม่ที่ฉลาดขึ้นมากๆ ถูกออกแบบมาเป็นโมเดลอเนกประสงค์ (General-purpose) ที่เน้นการใช้เหตุผลเชิงลึกและการเขียนโค้ด (Reasoning & Coding) แต่สิ่งที่ทำให้ทีมวิศวกรต้อง “ช็อก” คือทักษะด้าน Cybersecurity ที่เก่งจนน่ากลัว

จากการทดสอบบนเกณฑ์วัดความสามารถด้านการเขียนโปรแกรมอย่าง SWE-bench Verified เจ้า Mythos ทำคะแนนได้สูงถึง 93.9% เทียบกับรุ่นพี่อย่าง Claude 3.5 Sonnet ที่เคยทำได้ดีมากแล้ว

ความเก่งระดับนี้หมายความความว่าอะไร? เรื่องแรกก็คือมันสามารถ “วางแผนและลงมือเขียนโค้ด” ที่ซับซ้อนได้เองโดยไม่ต้องรอคำสั่งทีละขั้นตอน

และมันยังสามารถค้นหาช่องโหว่ประเภท Zero-day หรือช่องโหว่ที่ผู้พัฒนาซอฟต์แวร์เองก็ยังไม่เคยรู้มาก่อนได้ดีกว่ามนุษย์มากๆ ที่สำคัญก็คือมันสามารถสร้างเครื่องมือเจาะระบบได้โดยอัตโนมัติภายในเวลาเพียงชั่วข้ามคืนเท่านั้น

Claude Mythos โหดแค่ไหน?

เพื่อให้เห็นภาพว่า Mythos โหดแค่ไหน Anthropic ได้ลองให้มันสแกนระบบปฏิบัติการระดับโลก และนี่คือสิ่งที่มันค้นพบ 3 เรื่องใหญ่ๆ

OpenBSD ระบบที่ขึ้นชื่อว่า “ปลอดภัยที่สุดในโลก” ซึ่งในโลกไอที OpenBSD มีปรัชญาการทำงานที่เคร่งครัดมาก โค้ดทุกบรรทัดต้องผ่านการตรวจสอบอย่างละเอียด

จนตลอดเกือบ 30 ปีที่ผ่านมา มีคนเจอช่องโหว่ที่เจาะจากข้างนอกได้น้อยมากๆ แต่ Mythos กลับเจอช่องโหว่ที่ค้างมานานถึง 27 ปี ในเวลาแค่แป๊บเดียว นั่นหมายความว่าถ้าระบบที่แกร่งที่สุดยังโดนเจาะได้แล้วระบบอื่นๆทั่วโลกล่ะจะเป็นยังไง

ไม่เฉพาะ OpenBSD เท่านั้น แต่ระบบปฏิบัติการ FFmpeg เครื่องมือจัดการไฟล์มัลติมีเดียระดับโลก มีบรรทัดโค้ดที่เคยผ่านการทดสอบอัตโนมัติมาแล้วกว่า 5 ล้านครั้ง แต่ไม่มีใครเห็นช่องโหว่ที่ค้างมานาน 16 ปี ยกเว้น Mythos

เช่นเดียวกับ Linux Kernel ระบบที่เป็นเหมือนกับ “เครื่องยนต์” ที่รันอยู่เบื้องหลังเซิร์ฟเวอร์เกือบทั้งหมดในโลก รวมถึงมือถือ Android และอุปกรณ์อัจฉริยะต่างๆ สิ่งที่ Mythos ทำคือการทำ “Vulnerability Chaining” หรือการร้อยเรียงช่องโหว่เข้าด้วยกัน อธิบายง่ายๆว่าแฮกเกอร์ปกติอาจจะเจอแค่วิธีเปิดรั้วบ้าน (ช่องโหว่ที่ 1) แต่ยังเข้าตัวบ้านไม่ได้

แต่ Mythos นอกจากเปิดประตูรั้วได้แล้ว มันดันหาทางปลดล็อคประตูบ้าน (ช่องโหว่ที่ 2) และรู้วิธีเปิดตู้เซฟ (ช่องโหว่ที่ 3) ต่อเนื่องกันได้เอง จนยึดระบบได้ทั้งหมด ก็คือมันสามารถเข้าถึงข้อมูลทุกอย่างและสั่งการคอมพิวเตอร์เครื่องนั้นได้เหมือนเป็นเจ้าของเอง แบบนั้นเลย

Mythos แหกคอกเองจนคนสร้างกลัว

สิ่งที่ทำให้ Anthropic ตัดสินใจไม่เปิดตัวโมเดลนี้สู่สาธารณะทันที คือพฤติกรรมที่เรียกว่า “Reckless” หรือความดื้อรั้นแหกคอก ไม่สนใจข้อจำกัดด้านความปลอดภัยใดๆ

มีรายงานว่าในการทดสอบหนึ่ง Mythos สามารถ “แหกคุก” ออกจาก Sandbox ที่คุมไว้ แล้วสร้างวิธีเจาะระบบเพื่อออกไปใช้เน็ตภายนอกเพื่อส่งอีเมลหาทีมวิจัย

แถมพยายาม Clear Log ประวัติการแก้ไขไฟล์เพื่อไม่ให้คนจับได้ว่ามันทำอะไรลงไปอีกด้วย นี่เหมือนกับว่าตอนนี้เราเข้าสู่ยุคที่ AI อาจคิดเองไปได้เกินกว่าที่มนุษย์จะควบคุมแล้วนั่นเอง

Project Glasswing เมื่อ AI ต้องสู้กับ AI

เมื่อเทคโนโลยีเริ่มดูอันตรายโดยเฉพาะถ้าโมเดลนี้ตกไปอยู่ในมือของ Hacker ล่ะโลกจะวุ่นวายแค่ไหน Anthropic ก็เลยตัดสินใจไม่ปล่อยโมเดลนี้ออกสู่สาธารณะและเริ่มทำ Project Glasswing ขึ้นมา

Project นี้ Anthropic จะจับมือกับบริษัทเทคใหญ่ๆ ไม่ว่าจะเป็น Amazon, Google, Microsoft, Apple, NVIDIA รวมถึงองค์กรด้านความปลอดภัยอย่าง CrowdStrike และ Palo Alto Networks และอื่นๆ

เป้าหมายของ Project นี้คือการให้บริษัทเหล่านี้เข้าถึง Claude Mythos ภายใต้การควบคุม เพื่อให้มันไปสแกนหาช่องโหว่ในซอฟต์แวร์สำคัญของโลกและรีบอุดมัน ก่อนที่แฮกเกอร์จะพัฒนา AI ที่เก่งพอๆ กันขึ้นมาโจมตีนั่นเอง

เรื่องราวของ Claude Mythos เป็นสัญญาณเตือนชัดเจนเลยว่า ความปลอดภัยไซเบอร์ในยุคนี้การ “ตรวจเช็คด้วยมนุษย์” อาจไม่เพียงพออีกต่อไป ต่อไปนี้ความปลอดภัยไซเบอร์จะกลายเป็นสงครามของ AI สู้กับ AI ซึ่งเราต้องปรับตัวให้ทัน

สำหรับองค์กรที่ต้องการใช้พลังของ Mythos มาตรวจสอบช่องโหว่อาจต้องรอก่อนเพราะ Anthropic เปิดให้ใช้เฉพาะกลุ่มพันธมิตรโดยมีราคา Token ที่ค่อนข้างสูงเพื่อคัดกรองเฉพาะงานที่จำเป็นจริงๆ

และอีกเรื่องที่น่าสนใจก็คือ Project Glasswing จะมีผลลัพธ์อย่างไร? คงต้องติดตามผลกันในอีกราวๆ 3 เดือนข้างหน้า

ที่มา: Anthropic , Futurism, The New York Times


  •  
  •  
  •  
  •  
  •