ความแปรปรวนเทียบกับความแปรปรวนร่วม
ความแปรปรวนและความแปรปรวนร่วมเป็นสองการวัดที่ใช้ในสถิติ ความแปรปรวนคือการวัดความกระจัดกระจายของข้อมูล และความแปรปรวนร่วมระบุระดับการเปลี่ยนแปลงของตัวแปรสุ่มสองตัวด้วยกัน ความแปรปรวนค่อนข้างเป็นแนวคิดที่เข้าใจง่าย แต่ความแปรปรวนร่วมถูกกำหนดทางคณิตศาสตร์ในตอนแรกไม่ง่ายขนาดนั้น
เพิ่มเติมเกี่ยวกับความแปรปรวน
ความแปรปรวนคือการวัดการกระจายของข้อมูลจากค่าเฉลี่ยของการแจกแจง มันบอกว่าจุดข้อมูลอยู่ห่างจากค่าเฉลี่ยของการแจกแจงเท่าใด มันเป็นหนึ่งในตัวอธิบายหลักของการแจกแจงความน่าจะเป็นและช่วงเวลาหนึ่งของการกระจายนอกจากนี้ ความแปรปรวนยังเป็นพารามิเตอร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่างจากประชากรทำหน้าที่เป็นตัวประมาณค่าความแปรปรวนของประชากร จากมุมมองหนึ่ง มันถูกกำหนดให้เป็นกำลังสองของค่าเบี่ยงเบนมาตรฐาน
ในภาษาธรรมดา สามารถอธิบายได้ว่าเป็นค่าเฉลี่ยของกำลังสองของระยะห่างระหว่างจุดข้อมูลแต่ละจุดกับค่าเฉลี่ยของการแจกแจง สูตรต่อไปนี้ใช้ในการคำนวณความแปรปรวน
Var(X)=E[(X-µ)2] สำหรับประชากร และ
Var(X)=E[(X-‾x)2] สำหรับตัวอย่าง
มันสามารถทำให้ง่ายขึ้นเพื่อให้ Var(X)=E[X2]-(E[X])2
Variance มีคุณสมบัติที่เป็นเอกลักษณ์ และมักใช้ในสถิติเพื่อทำให้การใช้งานง่ายขึ้น ความแปรปรวนไม่เป็นลบเพราะเป็นกำลังสองของระยะทาง อย่างไรก็ตาม ช่วงของความแปรปรวนไม่ได้ถูกจำกัดและขึ้นอยู่กับการแจกแจงเฉพาะ ความแปรปรวนของตัวแปรสุ่มคงที่คือศูนย์ และความแปรปรวนจะไม่เปลี่ยนแปลงเมื่อเทียบกับพารามิเตอร์ตำแหน่ง
เพิ่มเติมเกี่ยวกับความแปรปรวนร่วม
ในทฤษฎีทางสถิติ ความแปรปรวนร่วมคือการวัดว่าตัวแปรสุ่มสองตัวเปลี่ยนแปลงไปพร้อมกันมากน้อยเพียงใด กล่าวอีกนัยหนึ่ง ความแปรปรวนร่วมคือการวัดความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัว นอกจากนี้ยังถือได้ว่าเป็นแนวคิดทั่วไปของแนวคิดเรื่องความแปรปรวนของตัวแปรสุ่มสองตัว
ความแปรปรวนร่วมของตัวแปรสุ่มสองตัว X และ Y ซึ่งกระจายร่วมกันด้วยโมเมนตัมวินาทีที่จำกัด เรียกว่า σXY=E[(X-E[X])(Y-E[ครับ])]. จากนี้ ความแปรปรวนสามารถเห็นได้ว่าเป็นกรณีพิเศษของความแปรปรวนร่วม โดยที่ตัวแปรสองตัวเหมือนกัน Cov(X, X)=Var(X)
โดยการทำให้ความแปรปรวนร่วมเป็นมาตรฐาน สามารถรับสัมประสิทธิ์สหสัมพันธ์เชิงเส้นหรือสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ซึ่งกำหนดเป็น ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
กราฟิก ความแปรปรวนร่วมระหว่างจุดข้อมูลคู่หนึ่งสามารถเห็นได้เป็นพื้นที่ของสี่เหลี่ยมที่มีจุดข้อมูลที่จุดยอดตรงข้ามสามารถตีความได้ว่าเป็นการวัดขนาดของการแยกระหว่างจุดข้อมูลสองจุด เมื่อพิจารณาจากสี่เหลี่ยมจัตุรัสสำหรับประชากรทั้งหมด การทับซ้อนกันของสี่เหลี่ยมที่สอดคล้องกับจุดข้อมูลทั้งหมดถือได้ว่าเป็นจุดแข็งของการแยก ความแปรปรวนของสองตัวแปร ความแปรปรวนร่วมอยู่ในสองมิติ เนื่องจากตัวแปรสองตัว แต่การทำให้เป็นตัวแปรเดียวทำให้ความแปรปรวนของตัวแปรเดียวเป็นการแยกในมิติเดียว
ความแปรปรวนและความแปรปรวนร่วมต่างกันอย่างไร
• ความแปรปรวนคือการวัดการแพร่กระจาย/การกระจายตัวในประชากร ในขณะที่ความแปรปรวนร่วมถือเป็นการวัดการเปลี่ยนแปลงของตัวแปรสุ่มสองตัวหรือความแรงของสหสัมพันธ์
• ความแปรปรวนถือเป็นกรณีพิเศษของความแปรปรวนร่วม
• ความแปรปรวนและความแปรปรวนร่วมขึ้นอยู่กับขนาดของค่าข้อมูล และไม่สามารถเปรียบเทียบได้ ดังนั้นจึงทำให้เป็นมาตรฐาน ความแปรปรวนร่วมถูกทำให้เป็นมาตรฐานในสัมประสิทธิ์สหสัมพันธ์ (หารด้วยผลคูณของส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มสองตัว) และความแปรปรวนจะถูกทำให้เป็นมาตรฐานในส่วนเบี่ยงเบนมาตรฐาน (โดยการหารากที่สอง)