ความแตกต่างระหว่างแนวโน้มส่วนกลางและการกระจาย

ความแตกต่างระหว่างแนวโน้มส่วนกลางและการกระจาย
ความแตกต่างระหว่างแนวโน้มส่วนกลางและการกระจาย

วีดีโอ: ความแตกต่างระหว่างแนวโน้มส่วนกลางและการกระจาย

วีดีโอ: ความแตกต่างระหว่างแนวโน้มส่วนกลางและการกระจาย
วีดีโอ: ความแตกต่างระหว่างกล้องจุลทรรศน์แบบใช้แสง กับกล้องจุลทรรศน์อิเล็กตรอน วิทยาศาสตร์ ม.4-6 (ชีววิทยา) 2024, กรกฎาคม
Anonim

แนวโน้มกลางกับการกระจาย

ในสถิติเชิงพรรณนาและเชิงอนุมาน ดัชนีหลายตัวถูกใช้เพื่ออธิบายชุดข้อมูลที่สอดคล้องกับแนวโน้มศูนย์กลาง การกระจาย และความเบ้: คุณสมบัติที่สำคัญที่สุดสามประการที่กำหนดรูปร่างสัมพัทธ์ของการกระจายชุดข้อมูล

แนวโน้มศูนย์กลางคืออะไร

แนวโน้มศูนย์กลางหมายถึงและกำหนดตำแหน่งศูนย์กลางของการกระจายค่า ค่าเฉลี่ย โหมด และค่ามัธยฐานเป็นดัชนีที่ใช้บ่อยที่สุดในการอธิบายแนวโน้มศูนย์กลางของชุดข้อมูล หากชุดข้อมูลมีความสมมาตร ทั้งค่ามัธยฐานและค่าเฉลี่ยของชุดข้อมูลจะตรงกัน

จากชุดข้อมูล ค่าเฉลี่ยจะคำนวณโดยนำผลรวมของค่าข้อมูลทั้งหมดมาหารด้วยจำนวนข้อมูล ตัวอย่างเช่น น้ำหนัก 10 คน (หน่วยเป็นกิโลกรัม) วัดได้เป็น 70, 62, 65, 72, 80, 70, 63, 72, 77 และ 79 จากนั้นน้ำหนักเฉลี่ยของสิบคน (เป็นกิโลกรัม) ก็จะได้ คำนวณได้ดังนี้ ผลรวมของน้ำหนักคือ 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710 ค่าเฉลี่ย=(ผลรวม) / (จำนวนข้อมูล)=710 / 10=71 (เป็นกิโลกรัม) เป็นที่เข้าใจกันว่าค่าผิดปกติ (จุดที่เบี่ยงเบนไปจากแนวโน้มปกติ) มีแนวโน้มที่จะส่งผลกระทบต่อค่าเฉลี่ย ดังนั้น เมื่อมีค่าผิดปกติ หมายความว่าเพียงอย่างเดียวจะไม่ให้ภาพที่ถูกต้องเกี่ยวกับจุดศูนย์กลางของชุดข้อมูล

ค่ามัธยฐานคือจุดข้อมูลที่พบตรงกลางชุดข้อมูล วิธีหนึ่งในการคำนวณค่ามัธยฐานคือการจัดลำดับจุดข้อมูลในลำดับจากน้อยไปหามาก จากนั้นค้นหาจุดข้อมูลที่อยู่ตรงกลาง ตัวอย่างเช่น หากสั่งซื้อชุดข้อมูลก่อนหน้านี้จะมีลักษณะดังนี้ 62, 63, 65, 70, 70, 72, 72, 77, 79, 80ดังนั้น (70+72)/2=71 อยู่ตรงกลาง จากนี้จะเห็นได้ว่าค่ามัธยฐานไม่จำเป็นต้องอยู่ในชุดข้อมูล ค่ามัธยฐานไม่ได้รับผลกระทบจากการมีอยู่ของค่าผิดปกติ ดังนั้น ค่ามัธยฐานจะเป็นตัววัดแนวโน้มส่วนกลางที่ดีกว่าเมื่อมีค่าผิดปกติ

โหมดคือค่าที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูล ในตัวอย่างก่อนหน้านี้ ค่า 70 และ 72 ทั้งคู่เกิดขึ้นสองครั้ง ดังนั้น ทั้งคู่จึงเป็นโหมด นี่แสดงว่า ในการแจกแจงบางค่า มีค่าโมดอลมากกว่าหนึ่งค่า หากมีเพียงโหมดเดียว ชุดข้อมูลจะเรียกว่ายูนิโมดัล ในกรณีนี้ ชุดข้อมูลเป็นแบบไบโมดอล

การกระจายคืออะไร

Dispersion คือจำนวนการแพร่กระจายของข้อมูลเกี่ยวกับศูนย์กลางของการกระจาย พิสัยและค่าเบี่ยงเบนมาตรฐานเป็นการวัดการกระจายตัวที่ใช้บ่อยที่สุด

ช่วงนี้เป็นเพียงค่าสูงสุดลบค่าต่ำสุด ในตัวอย่างก่อนหน้านี้ ค่าสูงสุดคือ 80 และค่าต่ำสุดคือ 62 ดังนั้นช่วงคือ 80-62=18 แต่ช่วงไม่ได้ให้ภาพที่เพียงพอเกี่ยวกับการกระจาย

ในการคำนวณค่าเบี่ยงเบนมาตรฐาน ขั้นแรกให้คำนวณค่าเบี่ยงเบนของค่าข้อมูลจากค่าเฉลี่ย ค่าเฉลี่ยรากที่สองของการเบี่ยงเบนเรียกว่าค่าเบี่ยงเบนมาตรฐาน ในตัวอย่างก่อนหน้านี้ ส่วนเบี่ยงเบนตามลำดับจากค่าเฉลี่ยคือ (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 และ (79 – 71)=8. ผลรวมของ กำลังสองของส่วนเบี่ยงเบนคือ (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366. ส่วนเบี่ยงเบนมาตรฐานคือ √(366/10)=6.05 (เป็นกิโลกรัม) เว้นเสียแต่ว่าชุดข้อมูลจะเบ้มาก จากสิ่งนี้สามารถสรุปได้ว่าข้อมูลส่วนใหญ่อยู่ในช่วง 71±6.05 และเป็นเช่นนั้นจริงในตัวอย่างนี้

ความแตกต่างระหว่างแนวโน้มศูนย์กลางและการกระจายคืออะไร

• แนวโน้มศูนย์กลางหมายถึงและค้นหาจุดศูนย์กลางของการกระจายค่า

• การกระจายคือปริมาณการแพร่กระจายของข้อมูลเกี่ยวกับศูนย์กลางของชุดข้อมูล