ความแตกต่างที่สำคัญ – การเรียนรู้ของเครื่องภายใต้การดูแลเทียบกับการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแล
การเรียนรู้ภายใต้การดูแลและการเรียนรู้แบบไม่มีผู้ดูแลเป็นแนวคิดหลักสองประการของการเรียนรู้ของเครื่อง Supervised Learning เป็นงานการเรียนรู้ของเครื่องในการเรียนรู้ฟังก์ชันที่จับคู่อินพุตกับเอาต์พุตตามตัวอย่างคู่อินพุต-เอาต์พุต Unsupervised Learning คืองาน Machine Learning ในการอนุมานฟังก์ชันเพื่ออธิบายโครงสร้างที่ซ่อนอยู่จากข้อมูลที่ไม่มีป้ายกำกับ ความแตกต่างที่สำคัญระหว่างการเรียนรู้ของเครื่องภายใต้การดูแลและที่ไม่มีผู้ดูแลคือการเรียนรู้ภายใต้การดูแลจะใช้ข้อมูลที่ติดป้ายกำกับ ในขณะที่การเรียนรู้ที่ไม่ได้รับการดูแลจะใช้ข้อมูลที่ไม่มีป้ายกำกับ
การเรียนรู้ของเครื่องเป็นสาขาวิทยาการคอมพิวเตอร์ที่ช่วยให้ระบบคอมพิวเตอร์สามารถเรียนรู้จากข้อมูลได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจนช่วยในการวิเคราะห์ข้อมูลและทำนายรูปแบบในข้อมูล มีการใช้งานแมชชีนเลิร์นนิงมากมาย บางส่วนมีการจดจำใบหน้า การจดจำท่าทาง และการรู้จำคำพูด มีอัลกอริทึมต่างๆ ที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง บางส่วนเป็นการถดถอย การจำแนกประเภท และการจัดกลุ่ม ภาษาโปรแกรมที่ใช้บ่อยที่สุดสำหรับการพัฒนาแอปพลิเคชันที่ใช้การเรียนรู้ของเครื่องคือ R และ Python นอกจากนี้ยังสามารถใช้ภาษาอื่นๆ เช่น Java, C++ และ Matlab ได้อีกด้วย
การเรียนรู้ภายใต้การดูแลคืออะไร
ในระบบที่ใช้แมชชีนเลิร์นนิง โมเดลทำงานตามอัลกอริทึม ในการเรียนรู้ภายใต้การดูแล โมเดลจะถูกควบคุมดูแล ขั้นแรก จำเป็นต้องฝึกโมเดล ด้วยความรู้ที่ได้รับ มันสามารถทำนายคำตอบสำหรับกรณีในอนาคตได้ โมเดลได้รับการฝึกอบรมโดยใช้ชุดข้อมูลที่มีป้ายกำกับ เมื่อข้อมูลตัวอย่างถูกส่งไปยังระบบ ก็สามารถทำนายผลลัพธ์ได้ ต่อไปนี้เป็นข้อมูลบางส่วนจากชุดข้อมูล IRIS ยอดนิยม
ตามตารางด้านบน ความยาว Sepal ความกว้าง Sepal ความยาว Patel ความกว้าง Patel และ Species เรียกว่าแอตทริบิวต์ คอลัมน์เรียกว่าคุณสมบัติ หนึ่งแถวมีข้อมูลสำหรับแอตทริบิวต์ทั้งหมด ดังนั้นหนึ่งแถวจึงเรียกว่าการสังเกต ข้อมูลอาจเป็นตัวเลขหรือหมวดหมู่ก็ได้ แบบจำลองนี้ได้รับการสังเกตโดยมีชื่อสปีชีส์ที่สอดคล้องกันเป็นข้อมูลป้อนเข้า เมื่อมีการสังเกตใหม่ แบบจำลองควรทำนายชนิดของสายพันธุ์ที่เป็นของมัน
ในการเรียนรู้ภายใต้การดูแล มีอัลกอริทึมสำหรับการจัดประเภทและการถดถอย การจัดประเภทเป็นกระบวนการของการจัดประเภทข้อมูลที่ติดฉลาก โมเดลสร้างขอบเขตที่แยกหมวดหมู่ของข้อมูล เมื่อมีการจัดเตรียมข้อมูลใหม่ให้กับโมเดล จะสามารถจัดหมวดหมู่ตามจุดที่มีอยู่ได้K-Nearest Neighbors (KNN) เป็นรูปแบบการจำแนกประเภท ขึ้นอยู่กับค่า k หมวดหมู่จะถูกตัดสิน ตัวอย่างเช่น เมื่อ k เป็น 5 หากจุดข้อมูลใดจุดหนึ่งใกล้กับจุดข้อมูลแปดจุดในหมวด A และหกจุดข้อมูลในหมวด B จุดข้อมูลจะถูกจัดประเภทเป็น A
การถดถอยเป็นกระบวนการทำนายแนวโน้มของข้อมูลก่อนหน้าเพื่อทำนายผลลัพธ์ของข้อมูลใหม่ ในการถดถอย ผลลัพธ์สามารถประกอบด้วยตัวแปรต่อเนื่องตั้งแต่หนึ่งตัวขึ้นไป การทำนายทำได้โดยใช้เส้นที่ครอบคลุมจุดข้อมูลส่วนใหญ่ ตัวแบบการถดถอยที่ง่ายที่สุดคือการถดถอยเชิงเส้น มันรวดเร็วและไม่ต้องการพารามิเตอร์การปรับแต่งเช่นใน KNN หากข้อมูลแสดงแนวโน้มพาราโบลา แสดงว่าโมเดลการถดถอยเชิงเส้นไม่เหมาะสม
นี่คือตัวอย่างบางส่วนของอัลกอริธึมการเรียนรู้ภายใต้การดูแล โดยทั่วไป ผลลัพธ์ที่เกิดจากวิธีการเรียนรู้ภายใต้การดูแลจะแม่นยำและเชื่อถือได้มากกว่า เนื่องจากข้อมูลอินพุตเป็นที่รู้จักและติดป้ายกำกับไว้เป็นอย่างดี ดังนั้นเครื่องจึงต้องวิเคราะห์เฉพาะรูปแบบที่ซ่อนอยู่
Unsupervised Learning คืออะไร
ในการเรียนรู้แบบไม่มีผู้ดูแล โมเดลไม่ได้รับการดูแล โมเดลทำงานด้วยตัวเองเพื่อทำนายผลลัพธ์ ใช้อัลกอริธึมการเรียนรู้ของเครื่องเพื่อสรุปข้อมูลที่ไม่มีป้ายกำกับ โดยทั่วไป อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลจะยากกว่าอัลกอริธึมการเรียนรู้ภายใต้การดูแลเพราะมีข้อมูลน้อย การจัดกลุ่มเป็นประเภทของการเรียนรู้ที่ไม่มีผู้ดูแล สามารถใช้เพื่อจัดกลุ่มข้อมูลที่ไม่รู้จักโดยใช้อัลกอริทึม การทำคลัสเตอร์ตามค่าเฉลี่ย k และความหนาแน่นเป็นอัลกอริธึมการทำคลัสเตอร์สองขั้นตอน
k-mean algorithm วาง k centroid แบบสุ่มสำหรับแต่ละคลัสเตอร์ จากนั้นจุดข้อมูลแต่ละจุดจะถูกกำหนดให้กับเซนทรอยด์ที่ใกล้ที่สุด ระยะทางแบบยุคลิดใช้ในการคำนวณระยะทางจากจุดข้อมูลไปยังเซนทรอยด์ จุดข้อมูลแบ่งออกเป็นกลุ่ม ตำแหน่งสำหรับ k centroids จะถูกคำนวณอีกครั้ง ตำแหน่งเซนทรอยด์ใหม่ถูกกำหนดโดยค่าเฉลี่ยของจุดทั้งหมดในกลุ่ม อีกครั้งแต่ละจุดข้อมูลถูกกำหนดให้กับเซนทรอยด์ที่ใกล้ที่สุดกระบวนการนี้จะทำซ้ำจนกว่าเซนทรอยด์จะไม่เปลี่ยนแปลงอีกต่อไป k-mean เป็นอัลกอริธึมการทำคลัสเตอร์ที่รวดเร็ว แต่ไม่มีการระบุการเริ่มต้นของจุดคลัสเตอร์ นอกจากนี้ยังมีรูปแบบการทำคลัสเตอร์ที่หลากหลายตามการเริ่มต้นจุดคลัสเตอร์
อัลกอริธึมการทำคลัสเตอร์อื่นคือการทำคลัสเตอร์ตามความหนาแน่น เรียกอีกอย่างว่าแอพพลิเคชั่นการจัดคลัสเตอร์เชิงพื้นที่ตามความหนาแน่นพร้อมสัญญาณรบกวน ทำงานโดยกำหนดคลัสเตอร์เป็นชุดจุดเชื่อมต่อที่มีความหนาแน่นสูงสุด เป็นพารามิเตอร์สองตัวที่ใช้สำหรับการจัดกลุ่มตามความหนาแน่น คือ Ɛ (epsilon) และคะแนนขั้นต่ำ Ɛ คือรัศมีสูงสุดของพื้นที่ใกล้เคียง คะแนนขั้นต่ำคือจำนวนคะแนนขั้นต่ำในย่าน Ɛ เพื่อกำหนดคลัสเตอร์ นี่คือตัวอย่างบางส่วนของการจัดกลุ่มที่ตกอยู่ในการเรียนรู้แบบไม่มีผู้ดูแล
โดยทั่วไป ผลลัพธ์ที่สร้างจากอัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลนั้นไม่ถูกต้องและเชื่อถือได้มากนัก เนื่องจากเครื่องต้องกำหนดและติดป้ายกำกับข้อมูลอินพุตก่อนที่จะกำหนดรูปแบบและฟังก์ชันที่ซ่อนอยู่
อะไรคือความคล้ายคลึงกันระหว่างการเรียนรู้ของเครื่องภายใต้การดูแลและไม่ได้รับการดูแล
ทั้งการเรียนรู้ภายใต้การดูแลและไม่ได้ดูแลเป็นประเภทของการเรียนรู้ของเครื่อง
ความแตกต่างระหว่างการเรียนรู้ของเครื่องภายใต้การดูแลและไม่ได้รับการดูแล
แมชชีนเลิร์นนิงภายใต้การดูแลและไม่ได้ดูแล |
|
Supervised Learning คืองานการเรียนรู้ของเครื่องในการเรียนรู้ฟังก์ชันที่จับคู่อินพุตกับเอาต์พุตตามตัวอย่างคู่อินพุต-เอาต์พุต | Unsupervised Learning คืองาน Machine Learning ในการอนุมานฟังก์ชันเพื่ออธิบายโครงสร้างที่ซ่อนอยู่จากข้อมูลที่ไม่มีป้ายกำกับ |
ฟังก์ชั่นหลัก | |
ในการเรียนรู้ภายใต้การดูแล โมเดลคาดการณ์ผลลัพธ์ตามข้อมูลอินพุตที่มีป้ายกำกับ | ในการเรียนรู้แบบ unsupervised ตัวแบบคาดการณ์ผลลัพธ์โดยไม่ต้องระบุข้อมูลด้วยการระบุรูปแบบด้วยตัวมันเอง |
ความแม่นยำของผลลัพธ์ | |
ผลลัพธ์ที่เกิดจากวิธีการเรียนรู้ภายใต้การดูแลนั้นแม่นยำและเชื่อถือได้มากขึ้น | ผลลัพธ์ที่เกิดจากวิธีการเรียนรู้แบบไม่มีผู้ดูแลนั้นไม่ถูกต้องและเชื่อถือได้มากนัก |
อัลกอริทึมหลัก | |
มีอัลกอริทึมสำหรับการถดถอยและการจำแนกประเภทในการเรียนรู้ภายใต้การดูแล | มีอัลกอริทึมสำหรับการจัดกลุ่มในการเรียนรู้แบบไม่มีผู้ดูแล |
สรุป – การเรียนรู้ของเครื่องภายใต้การดูแล vs ที่ไม่มีผู้ดูแล
Supervised Learning และ Unsupervised Learning เป็น Machine Learning สองประเภทSupervised Learning คืองาน Machine Learning ในการเรียนรู้ฟังก์ชันที่จับคู่อินพุตกับเอาต์พุตตามตัวอย่างคู่อินพุต-เอาต์พุต Unsupervised Learning คืองาน Machine Learning ในการอนุมานฟังก์ชันเพื่ออธิบายโครงสร้างที่ซ่อนอยู่จากข้อมูลที่ไม่มีป้ายกำกับ ความแตกต่างระหว่างการเรียนรู้ของเครื่องภายใต้การดูแลและที่ไม่มีผู้ดูแลคือการเรียนรู้ภายใต้การดูแลจะใช้ข้อมูลที่ติดป้ายกำกับ ในขณะที่การเรียนรู้แบบไม่มีผู้ดูแลจะใช้ข้อมูลที่ไม่มีป้ายกำกับ