วันอังคารที่ 15 กันยายน พ.ศ. 2558

สิ่งที่ต้องรู้ก่อนเลือกเครื่องมือทางสถิติมาใช้

          เครื่องมือทางสถิติมีมากมายแล้วจะมีวิธีในการเลือกใช้อย่างไร  จะใช้งานถูกต้องหรือไม่ ?     คำถามประเภทนี้คงมีหลายคนสงสัยเหมือนกัน  ซึ่งคำถามเหล่านี้จะหมดไปเพียงแค่เราเข้าใจสิ่งที่เรียกว่า "ข้อตกลงเบื้องต้นทางสถิติ (Assumption)"  เนื่องจากเครื่องมือทางสถิติแต่ละชนิดถูกออกแบบให้มีวัตถุประสงค์และการใช้งานไม่เหมือนกัน  จึงกำหนดข้อตกลงเบื้องต้นสำหรับเครื่องมือสถิติแต่ละตัวขึ้นมา เพื่อใช้เป็นแนวทางสำหรับผู้ใช้งานให้สามารถเลือกใช้เครื่องมือสถิติชนิดนั้นๆ ได้อย่างถูกต้องและเหมาะสม

ข้อตกลงเบื้องต้นทางสถิติ (Assumption)  คืออะไร

          เป็นข้อกำหนดสำหรับเครื่องมือทางสถิติแต่ละชนิดว่าสามารถนำมาใช้ได้กับข้อมูลหรือต้องมีข้อกำหนดอะไรบ้างจึงจะใช้เครื่องมือชนิดนั้นๆ ได้   โดยข้อตกลงเบื้องต้นทางสถิติได้แก่   
 
  • จุดประสงค์ในการวิเคราะห์หรือการใช้งาน

         สิ่งนี้ถือเป็นหัวใจสำคัญเพราะเป็นวัตถุประสงค์ในการวิเคราะห์ข้อมูล  ซึ่งในการเลือกเครื่องมือมาใช้งานเราต้องรู้ก่อนว่าวัตถุประสงค์ของการวิเคราะห์คืออะไร  เช่น  ต้องการหาค่าแนวโน้มเข้าสู่ส่วนกลาง  ต้องการหาความแปรปรวน  หรือต้องการทดสอบค่าเฉลี่ย
  • ประเภทของข้อมูล

          ประเภทของข้อมูลถูกแบ่งออกเป็น 2 ประเภท ตามลักษณะการเก็บข้อมูล  คือ ข้อมูลวัด กับข้อมูลนับ โดยข้อมูลวัดเราได้มาจากการนำเครื่องมือวัด เช่น  ไม้บรรทัด เครื่องชั่ง ไปวัดสิ่งที่เราสนใจ เช่น เราอยากทราบน้ำหนักของนักเรียนในห้องๆ หนึ่ง  เราก็ให้นักเรียนห้องนั้นชั่งน้ำหนักและจดบันทึกน้ำหนักที่ได้ของนักเรียนแต่ละคน  ส่วนข้อมูลนับเราได้ข้อมูลจากวิธีการนับจำนวนสิ่งที่เราสนใจ เช่น เราสนใจนักเรียนที่มีน้ำหนักระหว่าง 50-60 กิโลกรัม  เราก็ทำการนับจำนวนนักเรียนที่มีน้ำหนักอยู่ในช่วงนี้ว่ามีทั้งหมดกี่คน
  • ระดับการวัดของข้อมูล 

        ระดับการวัดหรือเรียกอีกอย่างหนึ่งว่ามาตรวัดของข้อมูล  เป็นการแยกประเภทของข้อมูลออกตามลักษณะข้อมูล  โดยแบ่งเป็น  4  ระดับ คือ

        1.  ระดับนามบัญญัติ (Nominal Data)
             เป็นการกำหนดลักษณะข้อมูลออกเป็นประเภทหรือกลุ่ม  โดยแบ่งลักษณะที่เหมือนกันไว้ด้วยกัน  เช่น  เพศ เชื้อชาติ หรือศาสนา


        2.  ระดับเรียงอันดับ (Ordinal Data)
            เป็นการกำหนดลักษณะข้อมูลออกเป็นกลุ่ม  โดยข้อมูลระดับนี้สามารถบอกความแตกต่างระหว่างกลุ่มว่ามากกว่าหรือน้อยกว่ากันได้  แต่ไม่สามารถบอกได้ว่ามากกว่าหรือน้อยกว่ากันเท่าใด เช่น  ระดับความชอบ  ระดับความพึงพอใจ  ซึ่งข้อมูลระดับนี้เราจะใช้จัดลำดับหรือตำแหน่งสิ่งที่เราสนใจเท่านั้น


        3.  ระดับช่วง (Interval Data)
             เป็นการวัดระดับที่สามารถวัดค่าออกมาเป็นตัวเลขได้  และบอกได้ว่ามากกว่าหรือน้อยกว่ากันเท่าใด  แต่การวัดระดับนี้จะไม่มีค่าศูนย์ที่แท้จริง  เช่น คะแนนสอบวิชาภาษาอังกฤษ  การที่เราได้ 0 คะแนน  ไม่ได้หมายความว่าเราไม่มีความรู้ภาษาอังกฤษเลย  เพียงแต่เราไม่สามารถในการทำคะแนนสอบครั้งนี้ได้เท่านั้น

        4.  ระดับอัตราส่วน (Ratio Data)
             เป็นการวัดระดับที่เหมือนกับระดับช่วง  แต่ต่างกันที่การวัดระดับนี้จะมีค่าศูนย์ที่แท้จริง คือ ถ้าหากค่าที่วัดได้มีค่าเป็น 0  ก็หมายถึงไม่มีค่าเลย  เช่น น้ำหนัก 0 กรัม  หมายถึงไม่มีน้ำหนักเลย

        ดังนั้นการเลือกเครื่องมือทางสถิติมาใช้  เราจะต้องทราบว่าข้อมูลของเราอยู่ในการวัดระดับใดด้วย


  • จำนวนกลุ่มตัวอย่างและตัวแปร

       กลุ่มตัวอย่าง  คือ ส่วนหนึ่งของสิ่งทั้งหมดที่ถูกเลือกมาศึกษา  โดยเราจะเรียกสิ่งทั้งหมดนั้นว่า ประชากร  เหตุผลที่ต้องมีกลุ่มตัวอย่างเพราะบางครั้งการนำสิ่งทั้งหมดมาศึกษาอาจต้องใช้เวลาและเสียค่าใช้จ่ายมาก  ในทางสถิติจึงอาศัยการเลือกกลุ่มตัวอย่างมาเพื่อทำการศึกษาแทน

       ตัวแปร  คือ สิ่งที่เราสนใจศึกษาซึ่งจะอธิบายเกี่ยวกับคุณสมบัติของสิ่งนั้นๆ  และสามารถนำมาวัด หรือนับค่าได้  ค่าที่ได้สามารถเปลี่ยนแปลงได้  เช่น  อายุ เพศ   นอกจากนี้ตัวแปรยังแบ่งออกเป็น 2 ประเภท  คือ  ตัวแปรต้น (ตัวแปรอิสระ)  และตัวแปรตาม  โดยตัวแปรต้น คือ สิ่งที่เป็นสาเหตุให้เกิดผลต่างๆ  ส่วนตัวแปรตาม  คือ  ผลที่เกิดจากตัวแปรต้นนั่นเอง

       ดังนั้นการเลือกเครื่องมือทางสถิติมาใช้  เราจำเป็นต้องทราบว่ามีกลุ่มตัวอย่างกี่กลุ่ม  และมีตัวแปรต้นกี่ตัว เพื่อให้เลือกเครื่องมือมาใช้ได้อย่างถูกต้อง


  • ลักษณะการกระจายตัวของข้อมูล

       การกระจายตัวของข้อมูลคือ  การนำข้อมูลมาแจกแจงความถี่เพื่อดูว่าข้อมูลมีการกระจายหรือแปรผันออกจากค่ากลางของข้อมูลแตกต่างกันมากน้อยเพียงใด
       การเลือกเครื่องมือทางสถิติสำหรับเรื่องการกระจายตัวของข้อมูลจะพิจารณาการกระจายออกเป็น 2 กลุ่ม  คือ มีการกระจายแบบปกติ  หรือมีการกระจายตัวแบบอื่น  ดังนั้นเราจึงจำเป็นต้องรู้รูปแบบลักษณะการกระจายแบบปกติข้อมูลเอาไว้
       ลักษณะการกระจายแบบปกติ  คือ  การนำข้อมูลมาแจกแจงความถี่แล้วจะพบว่าข้อมูลส่วนใหญ่ประมาณ 68.26% จะกระจายตัวอยู่รอบๆ ค่ากลาง คือมีความถี่สูงอยู่ตรงกลาง และลดหลั่นกันไปทั้งทางด้านซ้ายและด้านขวาในลักษณะสมมาตร  ซึ่งมีลักษณะคล้ายรูประฆังคว่ำ  ดังรูป



      
ดังนั้นสรุปได้ว่าเพื่อผลการวิเคราะห์ที่ถูกต้อง แม่นยำ และน่าเชื่อถือ เราจำเป็นต้องพิจารณาเกี่ยวกับข้อตกลงเบื้องต้นของเครื่องมือนั้นๆ ก่อนนำเครื่องมือทางสถิติมาใช้ด้วย


ไม่มีความคิดเห็น:

แสดงความคิดเห็น