เรียนรู้แบบมีคนสอน: ไขความลับ Supervised Learning ให้เข้าใจง่ายที่สุด

ลองจินตนาการถึงสถานการณ์ที่กำลังสอนเด็กเล็กให้รู้จักผลไม้สักชนิด การสอนแบบนี้เป็นหัวใจสำคัญของแนวคิดที่เรียกว่า Supervised Learning หรือการเรียนรู้แบบมีผู้สอนในโลกของปัญญาประดิษฐ์ หลักการคือการให้ข้อมูลที่มีเฉลยกำกับแก่ระบบคอมพิวเตอร์ เพื่อให้มันเรียนรู้และสามารถทำนายสิ่งใหม่ ๆ ได้เองในอนาคต

คล้ายกับการสอนให้เด็กรู้จักแอปเปิล ด้วยการชี้ไปที่ภาพแอปเปิลพร้อมกับพูดว่า “นี่คือแอปเปิล” ซ้ำ ๆ กันหลายครั้ง จนในที่สุดเด็กก็สามารถชี้ไปที่แอปเปิลได้อย่างถูกต้องเมื่อเห็นภาพใหม่ที่ไม่เคยเห็นมาก่อน คอมพิวเตอร์ก็เรียนรู้ในลักษณะเดียวกันนี้

หลักการทำงานพื้นฐาน

แนวคิดง่าย ๆ คือระบบปัญญาประดิษฐ์จะได้รับ “ชุดข้อมูลสำหรับฝึกฝน” ที่ประกอบด้วย ข้อมูลนำเข้า (Input Data) และ ป้ายกำกับ (Label) หรือที่เรียกกันว่า “เฉลย”

ยกตัวอย่างเช่น เมื่อต้องการให้คอมพิวเตอร์แยกแยะผลไม้ ก็จะป้อนภาพผลไม้ชนิดต่าง ๆ พร้อมระบุว่าภาพนี้คือแอปเปิล ภาพนั้นคือส้ม ข้อมูลนำเข้าก็คือรูปภาพผลไม้ ส่วนป้ายกำกับก็คือชื่อของผลไม้นั่นเอง

ระบบจะใช้ข้อมูลเหล่านี้เพื่อ “เรียนรู้” รูปแบบความสัมพันธ์ระหว่างภาพกับชื่อ มันจะพยายามทำความเข้าใจว่าอะไรคือลักษณะเฉพาะของแอปเปิล เช่น รูปร่างกลม สีแดง หรือส้มที่มีสีส้ม ผิวขรุขระ กระบวนการนี้เหมือนเด็กที่จดจำลักษณะของผลไม้แต่ละชนิดจากคำบอกของผู้ใหญ่

เป้าหมายคือการสร้าง “แบบจำลอง” ที่สามารถนำไปใช้ทำนายป้ายกำกับได้อย่างถูกต้อง เมื่อมีข้อมูลใหม่ที่ไม่เคยเห็นมาก่อนเข้ามา

การฝึกฝนและการทำนาย

ในช่วง การฝึกฝน (Training) แบบจำลองจะวิเคราะห์ข้อมูลนำเข้าและป้ายกำกับนับพันนับหมื่นรายการ เพื่อค้นหารูปแบบและกฎเกณฑ์ที่ซ่อนอยู่ภายในข้อมูลเหล่านี้

เหมือนนักเรียนที่เรียนรู้จากโจทย์ตัวอย่างพร้อมเฉลยจำนวนมาก จนสามารถทำความเข้าใจหลักการและวิธีการแก้ปัญหาได้เอง

เมื่อแบบจำลองได้รับการฝึกฝนจน “ฉลาด” พอแล้ว ก็จะเข้าสู่ขั้นตอน การทำนาย (Prediction)

ณ จุดนี้ สามารถป้อนข้อมูลใหม่ที่ไม่เคยมีป้ายกำกับมาก่อนเข้าไปให้แบบจำลอง แล้วแบบจำลองก็จะใช้ความรู้ที่ได้เรียนรู้มา ทำนายป้ายกำกับของข้อมูลใหม่นั้นได้อย่างแม่นยำ

ลองนึกภาพว่ามีภาพผลไม้ที่ไม่เคยแสดงให้แบบจำลองเห็นมาก่อน มันจะสามารถบอกได้ว่าภาพนั้นคือแอปเปิลหรือส้ม โดยอาศัยลักษณะที่เคยเรียนรู้มา

เพราะอะไรจึงเรียกว่า “มีผู้สอน”

คำว่า “มีผู้สอน” มาจากการที่กระบวนการเรียนรู้ต้องอาศัยชุดข้อมูลที่มีป้ายกำกับกำกับอยู่แล้ว เปรียบเสมือนมีครูคอยบอกเฉลย ทำให้แบบจำลองรู้ว่าคำตอบที่ควรจะเป็นคืออะไรในแต่ละกรณี

การมีป้ายกำกับนี้เองที่ช่วยนำทางให้แบบจำลองเรียนรู้และปรับปรุงตัวเองได้อย่างถูกต้อง หากไม่มีป้ายกำกับ แบบจำลองก็จะไม่รู้ว่ากำลังเรียนรู้ไปในทิศทางใด หรือคำตอบที่ถูกต้องคืออะไร

ประเภทหลักของ Supervised Learning

Supervised Learning แบ่งออกเป็นสองประเภทหลัก ได้แก่

การจำแนกประเภท (Classification): ใช้สำหรับทำนายผลลัพธ์ที่เป็นหมวดหมู่ หรือจัดกลุ่มข้อมูลออกเป็นประเภทต่าง ๆ เช่น การทำนายว่าอีเมลเป็น สแปม หรือ ไม่เป็นสแปม การจำแนกภาพว่าเป็น หมา หรือ แมว หรือการวินิจฉัยโรคว่า เป็น หรือ ไม่เป็น
การถดถอย (Regression): ใช้สำหรับทำนายผลลัพธ์ที่เป็นค่าตัวเลขต่อเนื่อง เช่น การทำนาย ราคาบ้าน จากขนาดและทำเลที่ตั้ง การทำนาย อุณหภูมิ ในวันพรุ่งนี้ หรือการคาดการณ์ ยอดขายสินค้า

ประโยชน์และการนำไปใช้

Supervised Learning มีบทบาทสำคัญในชีวิตประจำวันอย่างที่เราอาจไม่รู้ตัว มันถูกนำไปใช้ในการตรวจจับสแปมในอีเมล ระบบแนะนำสินค้าบนแพลตฟอร์มอีคอมเมิร์ซ การรู้จำใบหน้าหรือวัตถุในภาพ ระบบวินิจฉัยโรคทางการแพทย์ หรือแม้แต่การคาดการณ์แนวโน้มตลาดหุ้น

ความสามารถในการเรียนรู้จากข้อมูลที่มีป้ายกำกับ ทำให้คอมพิวเตอร์สามารถทำงานที่ซับซ้อนและมีประโยชน์ต่อมนุษย์ได้อย่างมหาศาล ช่วยเพิ่มประสิทธิภาพในหลาย ๆ ด้านของชีวิตและธุรกิจ