ทดสอบพลัง AMD สำหรับงาน AI: ทางเลือกที่น่าจับตาในโลก LLM

ในยุคที่ปัญญาประดิษฐ์ โดยเฉพาะโมเดลภาษาขนาดใหญ่ หรือ LLM กำลังพลิกโฉมโลก เทคโนโลยีที่ขับเคลื่อนเบื้องหลังก็ยิ่งทวีความสำคัญขึ้นเรื่อยๆ ที่ผ่านมาหลายคนอาจคุ้นเคยกับแบรนด์ NVIDIA ที่ครองตลาด AI อย่างไรก็ตาม บทความนี้จะพาไปเจาะลึกการทดสอบระบบที่ใช้ หน่วยประมวลผล AMD R9 ตัวท็อป และ การ์ดจอ AMD Radeon RX 7900 XTX ที่มี VRAM สูงถึง 24GB เพื่อสำรวจศักยภาพในการประมวลผล AI โดยเฉพาะอย่างยิ่งกับการรัน LLM บนเครื่องส่วนตัว

เป้าหมายคือการดูว่าแพลตฟอร์ม AMD สามารถทัดเทียมหรือเป็นทางเลือกที่คุ้มค่าได้แค่ไหน เมื่อเทียบกับสิ่งที่ผู้ใช้งานคุ้นเคย และความท้าทายที่อาจพบเจอในการตั้งค่าและใช้งานจะเป็นอย่างไร

เตรียมพร้อมสำหรับสนามรบ AI ด้วย AMD

การเริ่มต้นใช้งาน AI บนแพลตฟอร์ม AMD ต้องอาศัยการเตรียมตัวด้านซอฟต์แวร์ที่สำคัญ หัวใจหลักคือ ROCm (Radeon Open Compute platform) ซึ่งเป็นแพลตฟอร์มแบบเปิดจาก AMD ที่ออกแบบมาเพื่อการประมวลผลประสิทธิภาพสูง รวมถึงงานด้าน AI และ Machine Learning โดยเฉพาะ

การติดตั้ง ROCm อาจดูซับซ้อนในตอนแรก แต่การใช้ Docker เข้ามาช่วยจะทำให้กระบวนการราบรื่นขึ้นมาก ช่วยให้สามารถตั้งค่าสภาพแวดล้อมที่จำเป็น เช่น PyTorch ที่รองรับ ROCm backend ได้อย่างรวดเร็วและเป็นระเบียบ ทำให้พร้อมสำหรับการทดลองกับโมเดล AI ต่างๆ ได้ทันที

เผชิญหน้ากับความท้าทายและค้นพบศักยภาพ

จากการทดสอบ พบว่าหนึ่งในอุปสรรคสำคัญที่แพลตฟอร์ม AMD ยังต้องก้าวข้ามคือเรื่องของไลบรารีและเครื่องมือบางอย่างที่ยังไม่รองรับเต็มที่ ตัวอย่างเช่น BitsAndBytes ซึ่งเป็นไลบรารีสำคัญสำหรับการทำ Quantization หรือการลดขนาดโมเดลเพื่อประหยัดหน่วยความจำและเพิ่มความเร็วในการประมวลผล ปัจจุบันยังคงรองรับเฉพาะการ์ดจอ NVIDIA เท่านั้น

การขาดเครื่องมืออย่าง BitsAndBytes ทำให้การรันโมเดล LLM ขนาดใหญ่บน AMD โดยเฉพาะโมเดล 70B ที่มีการ Quantize แบบ 4-bit ซึ่งสามารถทำได้ง่ายบน RTX 3090 กลายเป็นเรื่องที่ต้องใช้ความพยายามและวิธีแก้ปัญหาที่ซับซ้อนกว่า อย่างไรก็ตาม นั่นไม่ได้หมายความว่า AMD ทำไม่ได้ เพียงแต่ต้องหาวิธีการอื่น

สำหรับโมเดลภาษาขนาดเล็กถึงกลาง การใช้ llama.cpp สามารถทำงานบนซีพียูได้ แต่ประสิทธิภาพจะไม่เทียบเท่าการใช้ GPU ส่วนการใช้ vLLM ที่รองรับ ROCm ก็แสดงให้เห็นถึงศักยภาพที่ดีในการเร่งความเร็วการอนุมาน (Inference) ของ LLM บนการ์ดจอ AMD แม้จะยังต้องใช้การกำหนดค่าที่เฉพาะเจาะจงกว่า

เปรียบเทียบกับ NVIDIA: ความง่ายในการใช้งานคือปัจจัยสำคัญ

เมื่อนำมาเปรียบเทียบกับการ์ดจอ NVIDIA RTX 3090 ที่มี VRAM เท่ากัน (24GB) ในแง่ของพลังประมวลผลดิบอาจไม่ต่างกันมากนัก แต่สิ่งที่ทำให้ NVIDIA ยังคงเป็นตัวเลือกอันดับต้นๆ สำหรับงาน AI คือ Ecosystem หรือระบบนิเวศซอฟต์แวร์ที่สมบูรณ์กว่ามาก

CUDA และไลบรารีที่สนับสนุนอย่างกว้างขวาง ทำให้การตั้งค่าและการใช้งาน AI บน NVIDIA เป็นเรื่องที่ “ง่ายกว่า” อย่างเห็นได้ชัด นักพัฒนาสามารถเข้าถึงเครื่องมือที่จำเป็นได้ทันทีโดยไม่ต้องเผชิญหน้ากับปัญหาความเข้ากันได้หรือการหาวิธีแก้ปัญหาเฉพาะหน้ามากนัก

AMD ก้าวไปข้างหน้า แต่ยังมีเส้นทางที่ต้องพิชิต

แม้ว่า AMD จะยังมีเส้นทางอีกยาวไกลในการทำให้แพลตฟอร์ม AI ของตน “เป็นมิตร” กับผู้ใช้งานเท่า NVIDIA แต่ก็เห็นได้ชัดว่ามีการพัฒนาอย่างต่อเนื่อง การสนับสนุน ROCm ในไลบรารียอดนิยมอย่าง PyTorch และความพยายามในการพัฒนาเครื่องมือใหม่ๆ เช่นการรองรับ vLLM เป็นสัญญาณที่ดี

สำหรับผู้ที่พร้อมจะลงทุนเวลาในการเรียนรู้และแก้ปัญหา แพลตฟอร์ม AMD นำเสนอ ประสิทธิภาพต่อราคาที่น่าสนใจ โดยเฉพาะอย่างยิ่งสำหรับผู้ที่ต้องการรัน LLM บนเครื่องส่วนตัวและต้องการทางเลือกนอกเหนือจาก NVIDIA อนาคตของการประมวลผล AI อาจไม่ได้ผูกขาดอยู่กับแพลตฟอร์มเดียวอีกต่อไป