ความแตกต่างที่สำคัญระหว่างโครงสร้างการจำแนกและการถดถอยคือในการจัดหมวดหมู่ ตัวแปรตามมีการจัดหมวดหมู่และไม่เรียงลำดับ ในขณะที่ในการถดถอย ตัวแปรตามจะต่อเนื่องหรือเรียงลำดับค่าทั้งหมด
การจำแนกและการถดถอยเป็นการเรียนรู้เทคนิคในการสร้างแบบจำลองการทำนายจากข้อมูลที่รวบรวม เทคนิคทั้งสองนี้นำเสนอแบบกราฟิกเป็นแผนผังการจัดหมวดหมู่และการถดถอย หรือแผนผังลำดับงานที่มีการแบ่งข้อมูลหลังจากทุกขั้นตอน หรือให้เรียกว่า "สาขา" ในแผนผัง กระบวนการนี้เรียกว่าการแบ่งพาร์ติชันแบบเรียกซ้ำ เขตข้อมูลเช่นการขุดใช้เทคนิคการเรียนรู้การจำแนกและการถดถอยเหล่านี้บทความนี้เน้นที่โครงสร้างการจำแนกและการถดถอย
การจำแนกคืออะไร
การจำแนกประเภทเป็นเทคนิคที่ใช้ในการสร้างแผนผังที่แสดงการจัดระเบียบข้อมูลที่ขึ้นต้นด้วยตัวแปรตั้งต้น ตัวแปรตามคือสิ่งที่จำแนกข้อมูล
รูปที่ 01: การขุดข้อมูล
แผนผังการจัดหมวดหมู่เริ่มต้นด้วยตัวแปรอิสระ ซึ่งแยกออกเป็นสองกลุ่มตามที่กำหนดโดยตัวแปรตามที่มีอยู่ มีขึ้นเพื่อชี้แจงคำตอบในรูปแบบของการจัดหมวดหมู่ที่เกิดจากตัวแปรตาม
การถดถอยคืออะไร
การถดถอยเป็นวิธีการคาดการณ์ที่อิงตามค่าเอาต์พุตตัวเลขที่สันนิษฐานหรือทราบ ค่าเอาต์พุตนี้เป็นผลมาจากชุดของการแบ่งพาร์ติชันแบบเรียกซ้ำ โดยทุกขั้นตอนมีค่าตัวเลขหนึ่งค่าและตัวแปรตามกลุ่มอื่นที่แยกออกเป็นคู่อื่นเช่นนี้
แผนภูมิการถดถอยเริ่มต้นด้วยตัวแปรตั้งต้นตั้งแต่หนึ่งตัวขึ้นไปและสิ้นสุดด้วยตัวแปรผลลัพธ์สุดท้ายหนึ่งตัว ตัวแปรตามเป็นตัวแปรตัวเลขแบบต่อเนื่องหรือแบบไม่ต่อเนื่อง
ความแตกต่างระหว่างการจำแนกและการถดถอยคืออะไร
การจำแนกประเภทเทียบกับการถดถอย |
|
โมเดลต้นไม้ที่ตัวแปรเป้าหมายสามารถรับชุดค่าที่ไม่ต่อเนื่องได้ | โมเดลต้นไม้ที่ตัวแปรเป้าหมายสามารถรับค่าต่อเนื่องได้โดยทั่วไปแล้วเป็นตัวเลขจริง |
ขึ้นอยู่กับตัวแปร | |
สำหรับโครงสร้างการจำแนกประเภท ตัวแปรตามมีการจัดหมวดหมู่ | สำหรับแผนภูมิการถดถอย ตัวแปรตามเป็นตัวเลข |
ค่า | |
มีการกำหนดจำนวนค่าที่ไม่เรียงลำดับ | มีทั้งค่าที่ไม่ต่อเนื่องแต่เรียงลำดับหรือค่าที่ไม่ต่อเนื่อง |
วัตถุประสงค์ของการก่อสร้าง | |
จุดประสงค์ในการสร้างแผนภูมิการถดถอยคือการปรับระบบการถดถอยให้พอดีกับแต่ละดีเทอร์มีแนนต์แบรนช์เพื่อให้ค่าเอาต์พุตที่คาดหวังปรากฏขึ้น | ต้นไม้การจำแนกประเภทแยกย่อยตามที่กำหนดโดยตัวแปรตามที่ได้รับจากโหนดก่อนหน้า |
สรุป – การจำแนกประเภทเทียบกับการถดถอย
แผนภูมิการถดถอยและการจัดหมวดหมู่เป็นเทคนิคที่เป็นประโยชน์ในการจับคู่กระบวนการที่ชี้ไปยังผลลัพธ์ที่ศึกษา ไม่ว่าจะอยู่ในการจำแนกประเภทหรือค่าตัวเลขเดียว ความแตกต่างระหว่างแผนผังการจัดประเภทและแผนผังการถดถอยคือตัวแปรตาม ต้นไม้การจำแนกประเภทมีตัวแปรตามที่มีการจัดหมวดหมู่และไม่เรียงลำดับ ต้นไม้การถดถอยมีตัวแปรตามที่เป็นค่าต่อเนื่องหรือเรียงค่าทั้งหมด