เมื่อ AI กลายเป็นช่องโหว่ใหม่: เจาะลึกภัยคุกคามในซอฟต์แวร์ซัพพลายเชนยุคใหม่

โลกของซอฟต์แวร์กำลังเปลี่ยนแปลงไปอย่างรวดเร็ว โดยมี ปัญญาประดิษฐ์ (AI) และ การเรียนรู้ของเครื่อง (ML) เข้ามามีบทบาทสำคัญมากขึ้นทุกวัน

แต่ความก้าวหน้าเหล่านี้ก็มาพร้อมกับความท้าทายด้านความปลอดภัยใหม่ๆ ที่ไม่เหมือนเดิม เพราะศัตรูไม่ได้มุ่งเป้าแค่โค้ดดิ้งอีกต่อไป แต่พวกเขาสามารถซ่อนภัยคุกคามไว้ใน โมเดล AI ที่คุณกำลังใช้งานอยู่ได้เลย

นี่คือการเปลี่ยนแปลงครั้งใหญ่ใน ภูมิทัศน์การโจมตีซอฟต์แวร์ซัพพลายเชน ที่ทุกคนควรตระหนักถึง

Slop-squatting: การปลอมแปลงในโลก AI

ลองนึกภาพการโจมตีแบบ Typosquatting ที่แฮกเกอร์สร้างเว็บไซต์ปลอมโดยใช้ชื่อคล้ายกับเว็บจริงเพื่อหลอกให้คนเข้าใจผิด

ในโลกของ AI เรากำลังเผชิญกับสิ่งที่เรียกว่า Slop-squatting แทนที่จะเป็นโดเมน แฮกเกอร์จะสร้าง ชุดข้อมูล (datasets) หรือ โมเดล AI สำเร็จรูป (pre-trained models) ปลอมที่ดูเหมือนของจริง หรือเป็นเวอร์ชันที่ถูกดัดแปลงอย่างมีเจตนาแอบแฝง

เมื่อนักพัฒนาหรือองค์กรดาวน์โหลดและนำไปใช้โดยไม่ตรวจสอบอย่างละเอียด ก็เท่ากับเปิดประตูให้ โค้ดอันตราย หรือ ข้อมูลที่บิดเบือน เข้าสู่ระบบได้โดยไม่รู้ตัว

ผลลัพธ์อาจเป็นข้อมูลรั่วไหล การประมวลผลที่ไม่ถูกต้อง หรือแม้แต่การเปิดช่องทางให้แฮกเกอร์เข้าควบคุมระบบได้ในภายหลัง

อันตรายจากการทำ Serialization โมเดล (Pickle)

การเก็บรักษาและเรียกใช้โมเดล AI มักจะทำผ่านกระบวนการที่เรียกว่า Serialization ซึ่งเป็นการแปลงวัตถุในหน่วยความจำให้เป็นข้อมูลที่สามารถจัดเก็บหรือส่งผ่านได้

หนึ่งในวิธีที่นิยมใช้คือ Python’s pickle ซึ่งเป็นเครื่องมือที่ทรงพลัง แต่ก็อันตรายในเวลาเดียวกัน

ไฟล์ที่ถูก pickle สามารถเก็บ โค้ด Python ที่สามารถรันได้ เมื่อถูกโหลดกลับ (deserialization) หากโมเดล AI ที่คุณกำลังจะใช้นั้นถูกสร้างหรือถูกแก้ไขโดยผู้ไม่หวังดี พวกเขาสามารถฝังโค้ดอันตรายไว้ในไฟล์ pickle ได้เลย

เมื่อคุณโหลดโมเดลนั้น โค้ดที่ซ่อนอยู่ก็จะทำงานโดยอัตโนมัติ ทำให้เกิดช่องโหว่ร้ายแรงที่สามารถนำไปสู่การควบคุมระบบได้อย่างสมบูรณ์

SBOM แบบเดิมไม่เพียงพอสำหรับ AI อีกต่อไป

ปัจจุบัน หลายองค์กรใช้ Software Bill of Materials (SBOM) เพื่อบันทึกส่วนประกอบทั้งหมดของซอฟต์แวร์ เช่น ไลบรารี และโค้ด เพื่อช่วยในการตรวจสอบความปลอดภัย

อย่างไรก็ตาม SBOM แบบเดิมๆ มักจะมองข้ามส่วนประกอบสำคัญของ AI ไปอย่างสิ้นเชิง

มันไม่ได้ระบุถึง ชุดข้อมูลที่ใช้ในการฝึก (training data provenance) เวอร์ชันของโมเดล หรือแม้กระทั่ง เฟรมเวิร์ก ML ที่ใช้สร้างโมเดลนั้นๆ

นี่หมายความว่า แม้จะมี SBOM แต่คุณก็ยังไม่รู้ว่าโมเดล AI ที่ใช้อยู่นั้นมาจากไหน ได้รับการฝึกด้วยข้อมูลอะไร หรือมีความเสี่ยงแอบแฝงอยู่หรือไม่

ถึงเวลาแล้วที่เราต้องคิดถึง Model Bill of Materials (MBOM) หรือ SBOM ที่ครอบคลุมมิติของ AI มากขึ้น เพื่อสร้างความมั่นใจและลดความเสี่ยง

ปกป้องระบบ AI ของคุณ: แนวทางที่สำคัญ

การรับมือกับภัยคุกคามเหล่านี้ต้องใช้ความระมัดระวังอย่างมาก

สิ่งแรกคือ ตรวจสอบแหล่งที่มา ของโมเดลและชุดข้อมูล AI ทุกครั้งอย่างละเอียด ไม่ว่าจะดาวน์โหลดจากที่ไหนก็ตาม เหมือนกับการที่คุณตรวจสอบไลบรารีโค้ดปกติ

นอกจากนี้ ควรหลีกเลี่ยงการใช้ serialization formats ที่ไม่ปลอดภัย เช่น pickle เมื่อเป็นไปได้ และพิจารณาใช้ทางเลือกที่ปลอดภัยกว่า หรืออย่างน้อยที่สุด ก็ควร แยกสภาพแวดล้อม (isolated environment) สำหรับการโหลดและรันโมเดล AI ที่มาจากภายนอก

การลงทุนในการพัฒนา เครื่องมือตรวจสอบเชิงลึก สำหรับส่วนประกอบ AI ก็เป็นสิ่งจำเป็น เพื่อช่วยให้เห็นถึงความผิดปกติหรือโค้ดที่แอบแฝงอยู่

โลกของ AI กำลังขยายตัว การทำความเข้าใจและเตรียมรับมือกับภัยคุกคามใหม่ๆ จึงเป็นสิ่งที่ไม่ควรมองข้าม เพื่อให้เราสามารถใช้ประโยชน์จาก AI ได้อย่างเต็มที่และปลอดภัย