ความแตกต่างที่สำคัญระหว่างการจัดกลุ่มและการจัดประเภทคือการจัดกลุ่มเป็นเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลซึ่งจัดกลุ่มอินสแตนซ์ที่คล้ายกันตามคุณสมบัติ ในขณะที่การจัดประเภทเป็นเทคนิคการเรียนรู้ภายใต้การดูแลที่กำหนดแท็กที่กำหนดไว้ล่วงหน้าให้กับอินสแตนซ์ตามคุณสมบัติ
แม้ว่าการจัดกลุ่มและการจัดประเภทจะดูเหมือนเป็นกระบวนการที่คล้ายกัน แต่ก็มีความแตกต่างกันตามความหมาย ในโลกของการทำเหมืองข้อมูล การจัดกลุ่มและการจัดหมวดหมู่เป็นวิธีการเรียนรู้สองประเภท วิธีการทั้งสองนี้กำหนดลักษณะของวัตถุออกเป็นกลุ่มตามคุณสมบัติอย่างน้อยหนึ่งอย่าง
การจัดกลุ่มคืออะไร
การจัดกลุ่มเป็นวิธีการจัดกลุ่มวัตถุในลักษณะที่วัตถุที่มีคุณสมบัติคล้ายคลึงกันมารวมกัน และวัตถุที่มีคุณสมบัติต่างกันแยกออกจากกัน เป็นเทคนิคทั่วไปสำหรับการวิเคราะห์ข้อมูลทางสถิติสำหรับการเรียนรู้ของเครื่องและการทำเหมืองข้อมูล การวิเคราะห์ข้อมูลเชิงสำรวจและการวางนัยทั่วไปยังเป็นพื้นที่ที่ใช้การจัดกลุ่ม
รูปที่ 01: การจัดกลุ่ม
การทำคลัสเตอร์เป็นของการทำเหมืองข้อมูลที่ไม่มีผู้ดูแล ไม่ใช่อัลกอริธึมเฉพาะแบบเดียว แต่เป็นวิธีทั่วไปในการแก้ปัญหา ดังนั้นจึงเป็นไปได้ที่จะบรรลุการจัดกลุ่มโดยใช้อัลกอริธึมต่างๆอัลกอริทึมคลัสเตอร์ที่เหมาะสมและการตั้งค่าพารามิเตอร์ขึ้นอยู่กับชุดข้อมูลแต่ละชุด ไม่ใช่งานอัตโนมัติ แต่เป็นกระบวนการค้นหาซ้ำๆ ดังนั้นจึงจำเป็นต้องแก้ไขการประมวลผลข้อมูลและการสร้างแบบจำลองพารามิเตอร์จนกว่าผลลัพธ์จะมีคุณสมบัติตามที่ต้องการ K-means clustering และ Hierarchical clustering เป็นอัลกอริธึมการทำคลัสเตอร์ทั่วไปสองขั้นตอนในการทำเหมืองข้อมูล
การจำแนกคืออะไร
การจำแนกประเภทเป็นกระบวนการจัดหมวดหมู่ที่ใช้ชุดข้อมูลการฝึกอบรมเพื่อจดจำ แยกความแตกต่าง และทำความเข้าใจวัตถุ การจัดประเภทเป็นเทคนิคการเรียนรู้ภายใต้การดูแลซึ่งมีชุดการฝึกและการสังเกตที่กำหนดไว้อย่างถูกต้อง
รูปที่ 02: การจัดประเภท
อัลกอริธึมที่ใช้การจัดหมวดหมู่เป็นตัวแยกประเภทในขณะที่การสังเกตคือตัวอย่าง อัลกอริธึม K-Nearest Neighbor และอัลกอริธึมทรีการตัดสินใจเป็นอัลกอริธึมการจำแนกประเภทที่มีชื่อเสียงที่สุดในการขุดข้อมูล
ความแตกต่างระหว่างการจัดกลุ่มและการจำแนกประเภทคืออะไร
การจัดกลุ่มเป็นการเรียนรู้แบบไม่มีผู้ดูแล ในขณะที่การจัดประเภทเป็นเทคนิคการเรียนรู้ภายใต้การดูแล มันจัดกลุ่มอินสแตนซ์ที่คล้ายกันตามคุณสมบัติ ในขณะที่การจัดประเภทกำหนดแท็กที่กำหนดไว้ล่วงหน้าให้กับอินสแตนซ์ตามคุณสมบัติ การทำคลัสเตอร์จะแบ่งชุดข้อมูลออกเป็นชุดย่อยเพื่อจัดกลุ่มอินสแตนซ์ที่มีคุณสมบัติคล้ายกัน ไม่ใช้ข้อมูลที่มีป้ายกำกับหรือชุดฝึกอบรม ในทางกลับกัน ให้จัดหมวดหมู่ข้อมูลใหม่ตามข้อสังเกตของชุดการฝึก ชุดฝึกมีป้ายกำกับ
เป้าหมายของการจัดกลุ่มคือการจัดกลุ่มชุดของวัตถุเพื่อค้นหาว่ามีความสัมพันธ์ระหว่างวัตถุเหล่านี้หรือไม่ ในขณะที่การจัดประเภทมีจุดมุ่งหมายเพื่อค้นหาว่าวัตถุใหม่เป็นของคลาสใดจากชุดของชั้นเรียนที่กำหนดไว้ล่วงหน้า
สรุป – การจัดกลุ่มเทียบกับการจัดประเภท
การจัดกลุ่มและการจำแนกประเภทอาจดูคล้ายกัน เนื่องจากอัลกอริธึมการขุดข้อมูลทั้งสองแบ่งชุดข้อมูลออกเป็นชุดย่อย แต่เป็นเทคนิคการเรียนรู้สองแบบที่แตกต่างกัน ในการขุดข้อมูลเพื่อรับข้อมูลที่เชื่อถือได้จากการรวบรวมข้อมูลดิบ ความแตกต่างระหว่างการจัดกลุ่มและการจัดประเภทคือการจัดกลุ่มเป็นเทคนิคการเรียนรู้ที่ไม่มีผู้ดูแลซึ่งจัดกลุ่มอินสแตนซ์ที่คล้ายคลึงกันตามคุณสมบัติ ในขณะที่การจัดประเภทเป็นเทคนิคการเรียนรู้ภายใต้การดูแลซึ่งกำหนดแท็กที่กำหนดไว้ล่วงหน้าให้กับอินสแตนซ์ตามคุณสมบัติต่างๆ
เอื้อเฟื้อภาพ:
1”Cluster-2″ by Cluster-2.gif: hellisp derivative work: (Public Domain) via Wikimedia Commons 2.”Magnetism” โดย John Aplessed – งานของตัวเอง (สาธารณสมบัติ) ผ่าน Wikimedia Commons