การหาความแตกต่างของค่าเฉลี่ยของประชากร แทนที่เราจะใช้ค่าเฉลี่ย และ t-test ในครั้งนี้เราจะวิเคราะห์โดยใช้ความแตกต่างของค่าความแปรปรวน (Variance) นั่นคือความหมายว่า ANOVA คือ อะไรนั่นเองครับ
บทความนี้ผมจะอธิบายวิธีการคำนวณทางสถิติตัวหนึ่งที่ชื่อว่า ANOVA แปลเป็นไทยว่า การวิเคราะห์ความแปรปรวน (Analysis Of Variance) เป็นวิธีการทางสถิติที่พัฒนาขึ้นโดยนักสถิติชื่อว่า R.A. Fisher
หลักการในการวิเคราะห์ คือ แยกความแปรปรวนของข้อมูลออกเป็นส่วนๆ ตามสาเหตุดังนี้
ความแปรปรวนทั้งหลาย = ความแปรผันจาก Treatment + ความแปรผันระหว่างหน่วยทดลอง + ความผิดพลาดจากการทดลอง
หรือเขียนเป็นสมการได้
Total = Treatment + Experiment + Error
สิ่งทดลอง (Treatment) หมายถึง สิ่งที่กระทำให้กับหน่วยทดลองเพื่อวัดผลหรือเปรียบเทียบ เช่น เปรียบเทียบคะแนนนักเรียนที่เรียนวิชาคณิตศาสตร์ระหว่างนักเรียนชายและนักเรียนหญิง ในที่นี้ Treatment คือ เพศของนักเรียน
ข้อตกลงเบื้องต้นของการวิเคราะห์ความแปรปรวน
ก่อนจะวิเคราะห์ความแปรปรวน เราต้องเราต้องตรวจสอบข้อตกลงเบื้องต้นดังนี้
- ตัวอย่างที่เลือกมาแต่ละประชากร ต้อง แจกแจงปกติ สามารถตรวจสอบโดยใช้โปรแกรม SPSS ด้วยโคลโมโกรอฟ-สมินอฟ
- ประชากรต่างๆ ที่นำมาทดสอบต้องมีความแปรปรวนเท่ากันอย่างมีนัยสำคัญ สามารถตรวจสอบได้โดยใช้สถิติทดสอบเอฟสูงสุดของ ฮาร์ทเลย์ (Hartley’s Fmax-test)
กรณีข้อมูลเป็นการแจกแจงปกติ แต่ความแปรปรวนของประชากร ไม่เท่ากัน และขนาดกลุ่มตัวอย่างไม่เท่ากัน การวิเคราะห์ความแปรปรวนอาจให้ค่าคลาดเคลื่อน จึงควรเลือกการทดสอบของ Brown-Forsythe หรือ Welch
ประเภทของการวิเคราะห์ความแปรปรวน
แบ่งออกเป็น 2 ประเภทใหญ่ๆ ดังนี้
การวิเคระห์ความแปรปรวนทางเดียว (One Way ANOVA)
คือ การวิเคราะห์ ข้อมูลเมื่อการทดลองนั้นมีเพียงปัจจัย (Factor) เดียวเท่านั้น ตัวอย่างการวิเคราะห์ความแปรปรวนทางเดียว เช่น
- ต้องการทดสอบความแตกต่างของวิธีการเลี้ยงดูเด็กวัยอ่อน 5 วิธี
- ต้องการทดสอบความแตกต่างของวิธีการสอนนักเรียน 4 วิธี
- ต้องการทดสอบความแตกต่างของระยะทางที่ได้จากความเร็วที่ต่างกัน 5 ระดับ
- ต้องการทดสอบความแตกต่างของการสั่นสะเทือนของ Bearing จาก 5 แบรนด์
จะเห็นว่า วิธีการเลี้ยงเด็ก วิธีการสอน ยี่ห้อหลอดไฟ ระดับความเร็วที่ต่างกัน แบรนด์ของ Bearing 5 แบรนด์ คือ ปัจจัยที่ต้องการศึกษา แต่ละกลุ่มของปัจจัยนั้น เป็นประชากรแต่ละประชากร และผู้วิจัยต้องการทดสอบว่า แต่ละกลุ่มประชากร (ซึ่งมีผลมาจากปัจจัยที่แตกต่างกัน) มีค่าเฉลี่ยแตกต่างกันหรือไม่
การทดสอบสมมติฐาน
สมมติฐานของการวิจัยที่มีการวิเคราะห์ความแปรปรวน สามารถตั้งได้ดังนี้
- กำหนดสมมติฐานในการทดสอบ
: มีอย่างน้อย 1 คู่ที่มีค่าเฉลี่ยไม่เท่ากัน - กำหนดระดับนัยสำคัญ () อาจจะเป็น 0.01, 0.05 เป็นต้น
- สถิติที่ใช้ทดสอบ F-Test
- ค่าสถิติ และเปรียบเทียบค่า sig. กับนัยสำคัญ
จากการทดสอบสมมติฐานด้านบน ถ้า Sig แสดงว่ามีอย่างน้อย 1 คู่ที่แตกต่างกัน เราไม่สามารถรู้ได้ว่าเป็นคู่ไหน จนกว่าจะมีการเปรียบเทียบเชิงซ้อน (Multiple Comparison) ภาษาทางสถิติเราเรียกกันว่า ทำ Post Hoc นั่นเองครับ
ตัวอย่างการคำนวณ One Way ANOVA โดยใช้ SPSS
ต้องการทดสอบความแตกต่างของระยะทางที่ได้จากอัตราเร็วของรถที่ต่างกัน 5 ระดับ จึงทำการวางแผนการทดลองเติมน้ำมันให้รถยี่ห้อเดียวกัน 10 คันให้เต็มถัง และขับไปในทิศทางต่างๆ กันเพื่อให้น้ำมันหมดถังแล้ววัดระยะทางที่ได้โดยใช้อัตราเร็วให้คงที่ที่ระดับต่างๆ 5 ระดับ ดังนี้
เราจะตรวจสอบข้อตกลงเบื้องต้น คือ การแจกแจงปกติของข้อมูลโดยสถิติโคลโมโกรอฟ-สมินอฟ โดยเปิดโปรแกรม SPSS จากนั้นกรอกข้อมูลของตัวแปร โดยให้ตัวแปรอัตราเร็ว 70 km/hr เป็นตัวแปรชื่อ speed และมีค่าเป็น 1 และอัตราเร็ว 80 km/hr เป็นชื่อตัวแปร speed มีค่าเป็น 2 เป็นอย่างนี้ไปเรื่อยๆ จนถึงตัวแปรอัตราเร็ว 120 km/hr เป็น speed และมีค่าเป็น 5
ไปที่ Analze > Descriptive Statistics > Explore…
ลากตัวแปรตาม distancing ลงในช่อง Dependent List และลากตัวแปรอิสระ speed เข้าไปในช่อง Factor List จากนั้นกด Plots…
คลิกเลือก Normality plots with tests จากนั้นกด Continue > OK
หมายเหตุ : ปกติแล้วโปรแกรมจะตั้งค่า แอลฟาไว้ที่ 0.05 แต่ถ้าเราต้องการค่าแอลฟาค่าอื่น ให้ตั้งค่าที่ statistics…
จากผลการทดสอบ Kolmogorov-Smirnov พบว่าตัวแปร 1-5 ค่า sig. มากกว่า 0.05 ทุกค่าแสดงว่าทุกตัวแปร 1-5 เป็นการแจกแจงแบบปกติ
ต่อไปจะวิเคราะห์ค่าสถิติ one way anova พร้อมกับตรวจสอบความแปรปรวนไปด้วย โดยไปที่ Analyze > Compare Means > One-Way ANOVA
นำสองแปรตามใส่ใน Dependent List และตัวแปรอิสระใส่ Factor จากนั้นกด Options… เพื่อเลือกค่าสถิติทดสอบความแปรปรวนว่าเท่ากันทุกกลุ่มหรือไม่
เลือก Homogeneity of variance test จากนั้นคลิก Continue
ถ้าหากเราต้องการทดสอบ Multiple Comparison เลยว่าคู่ไหนที่แตกต่าง เราสามารถตั้งค่าไว้ได้เลยจากตัวเลือก Post Hoc…
ถ้าเราทราบว่าความแปรปรวนเท่ากัน เราสามารถเลือก สถิติที่ต้องการทดสอบได้ เช่น ผมเลือก LSD Scheffe และ Tukey ส่วนช่องล่าง ก็สามารถเลือกได้ เพราะเรายังไม่ได้ทดสอบความแปรปรวน จึงสามารถเลือกสถิติกรณีความแปรปรวนไม่เท่ากันได้ เช่น เลือก Dunnett’s T3 เป็นต้น จากนั้นกด Continue
เรามาดูผลการทดสอบความแปรปรวนกันครับว่าแต่ละกลุ่มเท่ากันหรือไม่ ดูค่า sig ทุกค่า มากกว่า 0.05 แสดงว่า ยอมรับสมมติฐานหลัก สรุปว่า ความแปรปรวนเท่ากันทุกกลุ่มประชากร เป็นไปตามเงื่อนไขข้อตกลงเบื้องต้นทุกประการครับ
ตารางที่สำคัญ คือ ตารางนี้ครับ ตาราง ANOVA ได้ค่า sig เท่ากับ 0.519 มากกว่า 0.05 แสดงว่า ไม่ sig. ถ้ามัน sig มันต้องน้อยกว่าค่าแอลฟา จึงยอมรับสมมติฐานหลัก คือ ค่าเฉลี่ยของแต่ละกลุ่มประชากร ไม่แตกต่างกัน
สังเกตว่า เราไม่จำเป็นต้องทำ Pos Hoc หรือดูตาราง Multiple comparison ต่อครับ เหตุผลเพราะค่าเฉลี่ยของประชากร ไม่แตกต่างกัน ก็ไม่จำเป็นต้องดูเป็นรายคู่ว่าคู่ไหนแตกต่างกัน สังเกตตารางดูก็ได้ว่า ไม่ sig เลย เพราะถ้า sig มันจะมีเครื่องหมายดอกจัน * ที่ตัวเลขในตารางครับ
เพื่อให้เห็นภาพของ Post hoc มากยิ่งขึ้น ผมขอเปลี่ยนแปลงข้อมูลใหม่ โดยตัวแปรที่ 3 ผมเปลี่ยนข้อมูลใหม่ทั้งชุด และทดสอบการแจกแจงปกติผ่านแล้ว ต่อไปจะทดสอบความแปรปรวน และ ANOVA โดยข้อมูลของผมเป็นดังนี้
เมื่อนำไปรันใหม่แล้วจะได้ตารางดังนี้ครับ ตารางทดสอบความแปรปรวนของข้อมูล (ค่า sig ในกรอบเหลี่ยมแดง) พบว่า น้อยกว่า 0.05 แสดงว่า ความแปรปรวนไม่เท่ากัน เราจึงจะใช้ค่าสถิติของ Dunnett’s T3
ขณะเดียวกันพบว่า ตารางสำคัญที่สุดคือ ตาราง ANOVA ให้ค่า sig เท่ากับ 0.015 น้อยกว่า 0.05 ที่ตั้งไว้ ดั้งนั้นก็ sig. เช่นกัน แสดงว่า มีอย่างน้อย 1 คู่ที่ค่าเฉลี่ยแตกต่างกัน เราจึงพิจารณาตาราง Post Hoc ต่อไป
ผมเลือกมาเฉพาะตารางของ Dunnett T3 นะครับ และค่า sig จะมี 4 แถว ดังภาพ หรือสังเกตจากดอกจัน * ของค่า Mean Difference (I-J) เอา i ลบ j ติดลบคือ คู่ 2 กับ 3 แสดงว่า 2 น้อยกว่า 3 หรือหมายถึง ค่าเฉลี่ยของตัวแปร 2 น้อยกว่า ตัวแปร 3 อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05 นั่นเอง
ทำนองเดียวกัน เราพบว่า คู่ 3 และ 5 ก็แตกต่างกัน โดยที่ ค่าเฉลี่ยตัวแปร 5 น้อยกว่า 3 อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
แม้ว่าจะไฮไลท์ไว้ 4 แถว แต่ 2 กับ 3 ก็ซ้ำคู่ 3 กับ 2 นั่นเอง ทำให้สรุปผลความแตกต่างได้ 2 คู่ดังกล่าวครับ และจะพบอีกว่า คู่ 4 กับ 5 ก็เกือบ sig เหมือนกันครับเพราะได้ค่า sig=0.06
เมื่อเราจะสรุปผลจากจากตารางจะได้ว่า
ระยะทางที่ได้จากความเร็วของรถ 5 ระดับดังกล่าวพบว่า ระยะทางที่ได้จากอัตราเร็ว 90 km/hr เป็นอัตราเร็วที่ได้ระยะทางมากที่สุด ซึ่งแตกต่างจากระยะทางที่ได้จากอัตราเร็ว 80 km/hr และ 120 km/hr อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
การวิเคระห์ความแปรปรวนสองทาง (Two-Way ANOVA)
จะต่างจากการวิเคราะห์ความแปรปรวนทางเดียว คือ ตัวแปรอิสระ (Factor) จะมี 2 ตัวแปรครับ สามารถสรุปเป็นตารางดังนี้
ตัวแปรอิสระ (Factor) | ตัวแปรตาม (ค่าต่อเนื่อง) | |
One Way ANOVA | 1 | 1 |
Two Way ANOVA | 2 | 1 |
เมื่อมีตัวแปรอิสระ 2 ตัว เป็นปัจจัย (Factor) ที่ต้องการศึกษา เราจะมีตัวแปรที่เกิดจากสองตัวนี้ เรียกว่า ปฎิสัมพันธ์ (Interaction) ซึ่งโดยทั่วไปการศึกษา Two Way ANOVA มักให้ความสำคัญกับตัวแปรนี้เป็นพิเศษครับ
ตัวอย่างการคำนวณ Two-Way ANOVA โดยใช้ SPSS
เพื่อให้เห็นภาพอย่างชัดเจน เราจะใช้ข้อมูลเดิมของ One Way ANOVA แต่จะเพิ่มอีก 1 ตัวแปรอิสระเข้าไป คือ น้ำหนักของสิ่งของที่บรรทุกในรถที่ขับ โดยเก็บข้อมูลจากรถยี่ห้อเดียวกัน 4 คันโดยแบ่งเป็นกลุ่มไม่บรรทุกสิ่งของ บรรทุกสิ่งของที่มีน้ำหนัก 500 kg และ 800 kg เก็บได้ข้อมูลดังตาราง
ทดสอบเงื่อนไขการแจกแจงปกติ (ทำขั้นตอนเดียวกันกับ One-Way ANOVA) พบว่า มีการแจกแจงปกติทุกตัวแปร ดูจากค่า sig
เราจะตั้งสมมติฐานการทดลองดังนี้
: มีอย่างน้อย 1 คู่ที่มีค่าเฉลี่ยไม่เท่ากัน
ทำการกรอกข้อมูลใน SPSS ได้ดังภาพ จะเห็นว่าตัวแปรอิสระ 2 ตัว คือ Speed และ weight มีการแทนด้วยเลขดังนี้
speed | ค่าตัวแปร |
70 km/hr | 1 |
80 km/hr | 2 |
90 km/hr | 3 |
100 km/hr | 4 |
120 km/hr | 5 |
ตัวแปร weight ก็มีการแทนค่าตัวแปรดังนี้
weight | ค่าตัวแปร |
บรรทุก 0 kg | 1 |
บรรทุก 500 kg | 2 |
บรรทุก 800 kg | 3 |
นำตัวแปรมากรอกค่าใน SPSS ได้ดังตาราง
คำนวนค่าโดยไปที่ Analyze > General Linear Model > Univariate…
นำตัวแปรตามเข้าไปที่ Dependent Variable ส่วนตัวแปรอิสระสองตัว นำเข้าไปที่ Fix Factor (s) จากนั้นคลิก Model
เลือก Build terms จากนั้นคลิกเลือกตัวแปรอิสระสองตัวเข้าไปฝั่งขวามือ และเลือกทั้งสองคลิกพร้อมกันเพื่อสร้างเป็นตัวแปรอิสระอีกตัว คือ ปฎิสัมพันธ์ของตัวแปรอิสระทั้งสองตัว จะเห็นว่า มี speed*weight เกิดขึ้น จากนั้นคลิก continue
คลิกเลือก Post Hoc เพื่อเปรียบเทียบรายคู่ กรณีเกิดการ sig ของตัวแปรอิสระเกิดขึ้น เลือกตัวแปรทั้งสองไว้ฝั่งขวามือ และในที่นี้ผมเลือกเปรียบเทียบรายคู่โดยใช้ LSD แล้วคลิก Continue ตามด้วย OK
การวิเคราะห์ผลของ Two-Way ANOVA จาก SPSS
ผลการวิเคราะห์ออกมาดังภาพ พบว่าตัวแปรที่มีค่า sig คือ weight ส่วนอีกแปร speed ไม่ sig และ ปฎิสัมพันธ์ speed*weight ไม่ sig ด้วยเช่นกัน จึงสรุปตามสมมติฐานว่า น้ำหนักแตกต่างกัน มีผลทำให้ระยะทางที่ได้แตกต่างกันอย่างมีนัยสำคัญที่ระดับ 0.05
ส่วนตาราง Post Hoc จะได้เปรียบเทียบรายคู่ของ ตัวแปร weight พบว่า การบรรทุกน้ำหนัก 500 กับ 800 kg ทำให้ระยะทางไม่แตกต่างกัน ส่วนการไม่บรรทุกน้ำหนัก กับบรรทุก 500 และ 800 ทำให้ระยะทางที่ได้แตกต่างกันอย่างมีนัยสำคัญที่ระดับ 0.05
แหล่งอ้างอิง :
ไพศาล วรคำ. (2559). การวิจัยทางการศึกษา Education Research. มหาสารคาม: ตักศิลาการพิมพ์.
ฉลอง สีแก้วสิ่ว. (ม.ป.ป.). https://sites.google.com/site/mystatistics01/chapter5/anova. เข้าถึงได้จาก https://sites.google.com/site/mystatistics01/home
ประกายรัตน์ สุวรรณ และ อมรวิทย์ วิเศษสงวน. (2555). การวิจัยและวิเคราะห์ข้อมูลด้วยโปรแกรม SPSS เวอร์ชัน 20. กรุงเทพฯ: ซีเอ็ดยูเคชั่น.
สุวิชาน มนแพวงศานนท์. (2543). วิเคราะห์ข้อมูลทางสถิติด้วย SPSS for Windows . กรุงเทพฯ: ซีเอ็ดยูเคชั่น.
รับวิเคราะห์ข้อมูลทางสถิติด้วยโปรแกรม SPSS สนใจติดต่อที่ไลน์ : @krujakkrapong หรืออีเมล mercedesbenz3010@gmail.com ค่าบริการจะประเมินจากความยากง่ายของตัวแปร มีการวิเคราะห์ที่ซับซ้อนมากหรือไม่ โดยสามารถส่ง กรอบแนวคิดการวิจัย หรือจุดประสงค์ สมมติฐานของการวิจัยเข้ามาให้พิจารณาก่อนได้ครับ ราคาเริ่มต้นที่ 500 บาท 😊
Discover more from KruJakkrapong 's Blog
Subscribe to get the latest posts sent to your email.