ค่าเฉลี่ยเทียบกับค่ามัธยฐานเทียบกับโหมด
ค่าเฉลี่ย ค่ามัธยฐาน และโหมด เป็นตัวชี้วัดหลักของแนวโน้มจากส่วนกลางที่ใช้ในสถิติเชิงพรรณนา ต่างกันโดยสิ้นเชิง และกรณีที่ใช้ในการสรุปข้อมูลก็ต่างกัน
ค่าเฉลี่ย
ค่าเฉลี่ยเลขคณิตคือผลรวมของค่าข้อมูลหารด้วยจำนวนค่าข้อมูล เช่น
[ลาเท็กซ์]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
หากข้อมูลมาจากพื้นที่ตัวอย่าง จะเรียกว่าค่าเฉลี่ยตัวอย่าง ([latex]\bar{x} [/latex]) ซึ่งเป็นสถิติเชิงพรรณนาของกลุ่มตัวอย่างแม้ว่าจะเป็นการวัดเชิงพรรณนาที่ใช้กันมากที่สุดสำหรับตัวอย่าง แต่ก็ไม่ใช่สถิติที่แข็งแกร่ง มีความไวต่อค่าผิดปกติและการแกว่งมาก
ตัวอย่างเช่น พิจารณารายได้เฉลี่ยของพลเมืองในเมืองใดเมืองหนึ่ง เนื่องจากค่าข้อมูลทั้งหมดถูกรวมแล้วแบ่งออก รายได้ของบุคคลที่มั่งคั่งอย่างยิ่งจึงส่งผลต่อค่าเฉลี่ยอย่างมาก ดังนั้น ค่าเฉลี่ยจึงไม่ใช่การแสดงข้อมูลที่ดีเสมอไป
ในกรณีของสัญญาณสลับกัน กระแสที่ไหลผ่านองค์ประกอบจะแปรผันเป็นระยะๆ จากทิศทางบวกไปยังทิศทางลบ และในทางกลับกัน หากเราหากระแสเฉลี่ยที่ไหลผ่านองค์ประกอบในช่วงเวลาเดียว มันจะให้ 0 หมายความว่าไม่มีกระแสไหลผ่านองค์ประกอบซึ่งเห็นได้ชัดว่าไม่เป็นความจริง ดังนั้นในกรณีนี้ ค่าเฉลี่ยเลขคณิตก็ไม่ใช่ตัววัดที่ดีเช่นกัน
ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ที่ดีเมื่อข้อมูลมีการกระจายอย่างเท่าเทียมกันสำหรับการแจกแจงแบบปกติ ค่าเฉลี่ยจะเท่ากับโหมดและค่ามัธยฐาน นอกจากนี้ยังมีค่าตกค้างต่ำสุดเมื่อพิจารณาถึงค่าคลาดเคลื่อนของค่าเฉลี่ยรากที่สอง ดังนั้นจึงเป็นการวัดผลที่ดีที่สุดเมื่อจำเป็นต้องแสดงชุดข้อมูลด้วยตัวเลขเดียว
มัธยฐาน
ค่าของจุดข้อมูลตรงกลางหลังจากจัดเรียงค่าข้อมูลทั้งหมดตามลำดับจากน้อยไปมากถูกกำหนดให้เป็นค่ามัธยฐานของชุดข้อมูล ค่ามัธยฐานคือควอร์ไทล์ที่ 2 เดไซล์ที่ 5 และเปอร์เซ็นไทล์ที่ 50
• หากจำนวนการสังเกต (จุดข้อมูล) เป็นเลขคี่ ค่ามัธยฐานจะเป็นค่าการสังเกตที่อยู่ตรงกลางของรายการที่เรียงลำดับพอดี
• หากจำนวนการสังเกต (จุดข้อมูล) เท่ากัน ค่ามัธยฐานคือค่าเฉลี่ยของการสังเกตระดับกลางสองครั้งในรายการที่เรียงลำดับ
มัธยฐานแบ่งการสังเกตออกเป็นสองกลุ่ม กล่าวคือ กลุ่ม (50%) ของค่าที่สูงกว่า และกลุ่ม (50%) ของค่าที่ต่ำกว่าค่ามัธยฐาน ค่ามัธยฐานใช้เฉพาะในการแจกแจงแบบเบ้และแสดงข้อมูลได้ดีกว่าค่าเฉลี่ยเลขคณิตอย่างเป็นธรรม
โหมด
โหมดคือจำนวนที่เกิดขึ้นมากที่สุดในชุดการสังเกต โหมดของชุดข้อมูลคำนวณโดยการหาความถี่ของแต่ละองค์ประกอบภายในชุด
• หากไม่มีค่าใดเกิดขึ้นมากกว่าหนึ่งครั้ง แสดงว่าชุดข้อมูลไม่มีโหมด
• มิฉะนั้น ค่าใดๆ ที่เกิดขึ้นกับความถี่สูงสุดจะเป็นโหมดของชุดข้อมูล
มีโหมดมากกว่า 1 โหมดในชุด; ดังนั้น โหมดจึงไม่ใช่สถิติเฉพาะของชุดข้อมูล ในการกระจายแบบสม่ำเสมอมีโหมดเดียว โหมดของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องคือจุดที่ฟังก์ชันมวลของความน่าจะเป็นถึงจุดสูงสุด จากการตีความข้างต้น เราสามารถพูดได้ว่า global maxima คือ mode
ลองนำการวัดทั้งสามมาใช้กับชุดข้อมูลต่อไปนี้
ข้อมูล: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
ค่าเฉลี่ย=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12
มัธยฐาน=9 (องค์ประกอบที่ 13)
โหมด=9 (ความถี่ 9=5)
ค่าเฉลี่ย ค่ามัธยฐาน และโหมดต่างกันอย่างไร
• ค่าเฉลี่ยเลขคณิตคือผลรวมของค่า (การสังเกต) หารด้วยจำนวนการสังเกต ไม่ใช่สถิติที่แข็งแกร่ง และขึ้นอยู่กับลักษณะการแจกแจงแบบปกติภายในการแจกแจงที่พิจารณาเป็นอย่างมาก ค่าผิดปกติเพียงค่าเดียวอาจทำให้เกิดการเปลี่ยนแปลงอย่างมีนัยสำคัญในค่ากลางที่ให้ค่าที่ค่อนข้างทำให้เข้าใจผิด แนวคิดนี้สามารถขยายไปยังค่าเฉลี่ยเรขาคณิต ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยถ่วงน้ำหนัก และอื่นๆ
• ค่ามัธยฐานคือค่ากลางของชุดการสังเกต และค่อนข้างได้รับผลกระทบจากค่าผิดปกติค่อนข้างน้อย อาจให้ค่าประมาณที่ดีเป็นสถิติสรุปในกรณีที่เบ้สูง
• โหมดคือค่าการสังเกตที่พบบ่อยที่สุดในชุดข้อมูล หากการแจกแจงเป็นบวก โหมดจะอยู่ทางซ้ายที่ค่ามัธยฐาน และหากเบ้ในเชิงลบ โหมดจะอยู่ทางขวาของค่ามัธยฐาน
• หากเบ้ในทางบวก ค่าเฉลี่ยคือค่ามัธยฐานที่ถูกต้อง ถ้าค่าเฉลี่ยเบ้เป็นลบอยู่ทางด้านซ้ายของค่ามัธยฐาน
• ในการแจกแจงแบบปกติ ทั้งสาม ค่าเฉลี่ย โหมดและค่ามัธยฐานจะเท่ากัน