การถดถอยเชิงเส้นเทียบกับโลจิสติก
ในการวิเคราะห์ทางสถิติ การระบุความสัมพันธ์ระหว่างตัวแปรที่เกี่ยวข้องกับการศึกษาเป็นสิ่งสำคัญ บางครั้งอาจเป็นจุดประสงค์เดียวของการวิเคราะห์เอง เครื่องมือที่แข็งแกร่งอย่างหนึ่งที่ใช้ในการสร้างความสัมพันธ์และระบุความสัมพันธ์คือการวิเคราะห์การถดถอย
รูปแบบการวิเคราะห์การถดถอยที่ง่ายที่สุดคือการถดถอยเชิงเส้น โดยที่ความสัมพันธ์ระหว่างตัวแปรเป็นความสัมพันธ์เชิงเส้น ในแง่สถิติ จะแสดงความสัมพันธ์ระหว่างตัวแปรอธิบายและตัวแปรตอบสนอง ตัวอย่างเช่น การใช้การถดถอย เราสามารถสร้างความสัมพันธ์ระหว่างราคาสินค้าโภคภัณฑ์กับการบริโภคตามข้อมูลที่รวบรวมจากตัวอย่างแบบสุ่มการวิเคราะห์การถดถอยจะสร้างฟังก์ชันการถดถอยของชุดข้อมูล ซึ่งเป็นแบบจำลองทางคณิตศาสตร์ที่เหมาะสมกับข้อมูลที่มีอยู่มากที่สุด สิ่งนี้สามารถแสดงได้อย่างง่ายดายด้วยพล็อตแบบกระจาย การถดถอยแบบกราฟิกเทียบเท่ากับการหาเส้นโค้งที่เหมาะสมที่สุดสำหรับชุดข้อมูลที่กำหนด ฟังก์ชันของเส้นโค้งคือฟังก์ชันการถดถอย การใช้แบบจำลองทางคณิตศาสตร์ทำให้คาดการณ์การใช้สินค้าโภคภัณฑ์ได้ในราคาที่กำหนด
ดังนั้น การวิเคราะห์การถดถอยจึงถูกนำมาใช้กันอย่างแพร่หลายในการทำนายและการพยากรณ์ นอกจากนี้ยังใช้เพื่อสร้างความสัมพันธ์ในข้อมูลการทดลอง ในสาขาฟิสิกส์ เคมี และในสาขาวิทยาศาสตร์ธรรมชาติและวิศวกรรมศาสตร์ ถ้าความสัมพันธ์หรือฟังก์ชันการถดถอยเป็นฟังก์ชันเชิงเส้น กระบวนการนั้นเรียกว่าการถดถอยเชิงเส้น ในแผนภาพกระจายสามารถแสดงเป็นเส้นตรงได้ หากฟังก์ชันไม่ใช่ชุดค่าผสมเชิงเส้นของพารามิเตอร์ การถดถอยจะไม่เป็นเชิงเส้น
การถดถอยโลจิสติกเปรียบได้กับการถดถอยหลายตัวแปร และสร้างแบบจำลองเพื่ออธิบายผลกระทบของตัวทำนายหลายตัวต่อตัวแปรตอบสนองอย่างไรก็ตาม ในการถดถอยลอจิสติกส์ ตัวแปรผลลัพธ์สุดท้ายควรจัดหมวดหมู่ (มักจะถูกแบ่งออก กล่าวคือ ผลลัพธ์ที่บรรลุได้คู่หนึ่ง เช่น ความตายหรือการอยู่รอด แม้ว่าเทคนิคพิเศษจะช่วยให้สามารถจำลองข้อมูลที่จัดหมวดหมู่ได้มากขึ้น) ตัวแปรผลลัพธ์ต่อเนื่องอาจถูกแปลงเป็นตัวแปรเชิงหมวดหมู่เพื่อใช้สำหรับการถดถอยโลจิสติก อย่างไรก็ตาม การยุบตัวแปรต่อเนื่องในลักษณะนี้ส่วนใหญ่ไม่สนับสนุน เนื่องจากจะลดความแม่นยำลง
แตกต่างจากการถดถอยเชิงเส้นตรงที่มีต่อค่าเฉลี่ย ตัวแปรทำนายในการถดถอยโลจิสติกไม่จำเป็นต้องถูกบังคับให้เชื่อมต่อเชิงเส้น กระจายทั่วไป หรือให้มีความแปรปรวนเท่ากันในทุกคลัสเตอร์ ด้วยเหตุนี้ ความสัมพันธ์ระหว่างตัวทำนายและตัวแปรผลลัพธ์จึงไม่น่าจะเป็นฟังก์ชันเชิงเส้น
โลจิสติกกับการถดถอยเชิงเส้นต่างกันอย่างไร
• ในการถดถอยเชิงเส้น ความสัมพันธ์เชิงเส้นระหว่างตัวแปรอธิบายและตัวแปรตอบสนองจะถูกสันนิษฐานและวิเคราะห์หาพารามิเตอร์ที่ตรงตามแบบจำลองโดยการวิเคราะห์ เพื่อให้ได้ความสัมพันธ์ที่แน่นอน
• ใช้การถดถอยเชิงเส้นสำหรับตัวแปรเชิงปริมาณ และฟังก์ชันผลลัพธ์จะเป็นเชิงปริมาณ
• ในการถดถอยโลจิสติก ข้อมูลที่ใช้สามารถเป็นหมวดหมู่หรือเชิงปริมาณก็ได้ แต่ผลลัพธ์จะถูกจัดหมวดหมู่เสมอ