การแจกแจงแบบปกติ คืออะไร
"การแจกแจงแบบปกติ (Normal Distribution)" หรือเรียกอีกชื่อหนึ่งว่า "โค้งปกติ" เป็นการแจกแจงของข้อมูลรูปแบบหนึ่ง ซึ่งเมื่อเราเก็บข้อมูลมาจำนวนหนึ่งแล้วนำข้อมูลนั้นมาแจกแจงความถี่ เราจะพบว่าข้อมูลส่วนใหญ่จะกระจายอยู่รอบๆ ค่าเฉลี่ยหรือตำแหน่งตรงกลาง และข้อมูลที่มีค่าแตกต่างจากค่าเฉลี่ยจะค่อยๆ กระจายลดหลั่นกันไปทางด้านซ้ายและขวาในลักษณะเท่ากันหรือใกล้เคียงกัน เช่น ข้อมูลค่าขนมต่อวันของนักเรียน ป.1 จำนวน 50 คน เรานำมาแจกแจงความถี่ด้วยฮิสโตแกรมจะได้ดังรูปนี้
![]() | |
การแจกแจงค่าขนมของนักเรียนชั้น ป.1 |
จากตัวอย่างค่าขนมของนักเรียนชั้น ป.1 ที่มีค่าขนมเฉลี่ยเท่ากับ 17.5 บาท พบว่านักเรียนส่วนใหญ่จะมีค่าขนมต่อวันอยู่ใกล้กับ 17.5 บาทมากที่สุด ส่วนค่าแตกต่างจาก 17.5 ก็จะค่อยๆ ลดหลั่นกันไปในลักษณะใกล้เคียงกันทั้งทางด้านซ้ายและขวา ซึ่งลักษณะแบบนี้เราจะเรียกว่าข้อมูลมีการแจกแจงแบบปกติ
เมื่อเราทราบรูปแบบการแจกแจงแบบปกติแล้ว ต่อไปก็ควรทราบเกี่ยวกับคุณสมบัติของการแจกแจงแบบนี้ด้วย
นอกจากนี้การแจกแจงแบบนี้จะมีค่าเฉลี่ย ฐานนิยม และมัธยฐานอยู่ตรงตำแหน่งเดียวกัน
2) ส่วนปลายโค้งทั้ง 2 ด้านจะมีค่าเข้าใกล้ 0 และมีค่าเป็นอนันต์ ไม่สามารถบอกได้ว่าจะสัมผัสฐานที่จุดใด
3) พื้นที่ใต้เส้นโค้ง คือ ค่าความน่าจะเป็นที่ข้อมูลมีโอกาสตกอยู่ โดยพื้นที่ใต้เส้นโค้งทั้งหมดมีค่าเท่ากับ 1 หรือ 100% นั่นเอง
นอกจากนี้ข้อมูลที่ถูกนำมาแจกแจงความถี่แล้วมีการแจกแจงแบบปกติจะต้องเป็นข้อมูลวัด
และข้อมูลนั้นส่วนใหญ่จะเกี่ยวข้องกับพฤติกรรมของสิ่งมีชีวิต หรือปรากฎการณ์ตามธรรมชาติ ดังนั้นการแจกแจงแบบนี้จึงเป็นการแจกแจงของข้อมูลที่เกิดขึ้นได้ตามปกติหรือตามธรรมชาตินั่นเอง และการแจกแจงแบบปกติก็ถือว่ามีความสำคัญและถูกนำมาใช้ในทางสถิติมากที่สุด
โดยมักพบว่าการแจกแจงแบบนี้ก็เป็นหนึ่งในข้อตกลงเบื้องต้นทางสถิติด้วย ดังนั้นจึงเป็นสิ่งจำเป็นที่เราจะต้องเข้าใจการแจกแจงแบบปกตินั่นเอง เพราะถือเป็นการแจกแจงที่เป็นพื้นฐานสำคัญในทางสถิติ
เมื่อเราทราบรูปแบบการแจกแจงแบบปกติแล้ว ต่อไปก็ควรทราบเกี่ยวกับคุณสมบัติของการแจกแจงแบบนี้ด้วย
คุณสมบัติของการแจกแจงแบบปกติ
1) รูปทรงของการแจกแจงจะมีลักษณะเป็นรูประฆังคว่ำ มีความสมมาตรกันทั้ง 2 ด้าน ซึ่งมีค่าเฉลี่ยอยู่ในตำแหน่งแกนสมมาตร(ตำแหน่งตรงกลาง) และมีส่วนเบี่ยงเบนมาตรฐานเป็นค่าแสดงการกระจายของข้อมูล และอยู่ที่ตำแหน่งจุดเปลี่ยนแกนของเส้นโค้งนอกจากนี้การแจกแจงแบบนี้จะมีค่าเฉลี่ย ฐานนิยม และมัธยฐานอยู่ตรงตำแหน่งเดียวกัน
2) ส่วนปลายโค้งทั้ง 2 ด้านจะมีค่าเข้าใกล้ 0 และมีค่าเป็นอนันต์ ไม่สามารถบอกได้ว่าจะสัมผัสฐานที่จุดใด
3) พื้นที่ใต้เส้นโค้ง คือ ค่าความน่าจะเป็นที่ข้อมูลมีโอกาสตกอยู่ โดยพื้นที่ใต้เส้นโค้งทั้งหมดมีค่าเท่ากับ 1 หรือ 100% นั่นเอง
ลักษณะการกระจายของข้อมูลสามารถแบ่งออกเป็น 3 ส่วน คือ
ขอบคุณครับ
ตอบลบ