ANOVA คือ อะไร? พร้อมตัวอย่างการคำนวณ SPSS

การหาความแตกต่างของค่าเฉลี่ยของประชากร แทนที่เราจะใช้ค่าเฉลี่ย และ t-test ในครั้งนี้เราจะวิเคราะห์โดยใช้ความแตกต่างของค่าความแปรปรวน (Variance) นั่นคือความหมายว่า ANOVA คือ อะไรนั่นเองครับ

บทความนี้ผมจะอธิบายวิธีการคำนวณทางสถิติตัวหนึ่งที่ชื่อว่า ANOVA แปลเป็นไทยว่า การวิเคราะห์ความแปรปรวน (Analysis Of Variance) เป็นวิธีการทางสถิติที่พัฒนาขึ้นโดยนักสถิติชื่อว่า R.A. Fisher

หลักการในการวิเคราะห์ คือ แยกความแปรปรวนของข้อมูลออกเป็นส่วนๆ ตามสาเหตุดังนี้

ความแปรปรวนทั้งหลาย = ความแปรผันจาก Treatment + ความแปรผันระหว่างหน่วยทดลอง + ความผิดพลาดจากการทดลอง

หรือเขียนเป็นสมการได้

Total = Treatment + Experiment + Error

สิ่งทดลอง (Treatment) หมายถึง สิ่งที่กระทำให้กับหน่วยทดลองเพื่อวัดผลหรือเปรียบเทียบ เช่น เปรียบเทียบคะแนนนักเรียนที่เรียนวิชาคณิตศาสตร์ระหว่างนักเรียนชายและนักเรียนหญิง ในที่นี้ Treatment คือ เพศของนักเรียน

ข้อตกลงเบื้องต้นของการวิเคราะห์ความแปรปรวน

ก่อนจะวิเคราะห์ความแปรปรวน เราต้องเราต้องตรวจสอบข้อตกลงเบื้องต้นดังนี้

  1. ตัวอย่างที่เลือกมาแต่ละประชากร ต้อง แจกแจงปกติ สามารถตรวจสอบโดยใช้โปรแกรม SPSS ด้วยโคลโมโกรอฟ-สมินอฟ
  2. ประชากรต่างๆ ที่นำมาทดสอบต้องมีความแปรปรวนเท่ากันอย่างมีนัยสำคัญ สามารถตรวจสอบได้โดยใช้สถิติทดสอบเอฟสูงสุดของ ฮาร์ทเลย์ (Hartley’s Fmax-test)

กรณีข้อมูลเป็นการแจกแจงปกติ แต่ความแปรปรวนของประชากร ไม่เท่ากัน และขนาดกลุ่มตัวอย่างไม่เท่ากัน การวิเคราะห์ความแปรปรวนอาจให้ค่าคลาดเคลื่อน จึงควรเลือกการทดสอบของ Brown-Forsythe หรือ Welch

ประเภทของการวิเคราะห์ความแปรปรวน

แบ่งออกเป็น 2 ประเภทใหญ่ๆ ดังนี้

การวิเคระห์ความแปรปรวนทางเดียว (One Way ANOVA)

คือ การวิเคราะห์ ข้อมูลเมื่อการทดลองนั้นมีเพียงปัจจัย (Factor) เดียวเท่านั้น ตัวอย่างการวิเคราะห์ความแปรปรวนทางเดียว เช่น

  1. ต้องการทดสอบความแตกต่างของวิธีการเลี้ยงดูเด็กวัยอ่อน 5 วิธี
  2. ต้องการทดสอบความแตกต่างของวิธีการสอนนักเรียน 4 วิธี
  3. ต้องการทดสอบความแตกต่างของระยะทางที่ได้จากความเร็วที่ต่างกัน 5 ระดับ
  4. ต้องการทดสอบความแตกต่างของการสั่นสะเทือนของ Bearing จาก 5 แบรนด์

จะเห็นว่า วิธีการเลี้ยงเด็ก วิธีการสอน ยี่ห้อหลอดไฟ ระดับความเร็วที่ต่างกัน แบรนด์ของ Bearing 5 แบรนด์ คือ ปัจจัยที่ต้องการศึกษา แต่ละกลุ่มของปัจจัยนั้น เป็นประชากรแต่ละประชากร และผู้วิจัยต้องการทดสอบว่า แต่ละกลุ่มประชากร (ซึ่งมีผลมาจากปัจจัยที่แตกต่างกัน) มีค่าเฉลี่ยแตกต่างกันหรือไม่

การทดสอบสมมติฐาน

สมมติฐานของการวิจัยที่มีการวิเคราะห์ความแปรปรวน สามารถตั้งได้ดังนี้

  1. กำหนดสมมติฐานในการทดสอบ
    H_0 : \mu_1=\mu_2=\mu_3=...=\mu_k
    H_1 : มีอย่างน้อย 1 คู่ที่มีค่าเฉลี่ยไม่เท่ากัน
  2. กำหนดระดับนัยสำคัญ (\alpha) อาจจะเป็น 0.01, 0.05 เป็นต้น
  3. สถิติที่ใช้ทดสอบ F-Test
  4. ค่าสถิติ และเปรียบเทียบค่า sig. กับนัยสำคัญ

จากการทดสอบสมมติฐานด้านบน ถ้า Sig แสดงว่ามีอย่างน้อย 1 คู่ที่แตกต่างกัน เราไม่สามารถรู้ได้ว่าเป็นคู่ไหน จนกว่าจะมีการเปรียบเทียบเชิงซ้อน (Multiple Comparison) ภาษาทางสถิติเราเรียกกันว่า ทำ Post Hoc นั่นเองครับ

ตัวอย่างการคำนวณ One Way ANOVA โดยใช้ SPSS

ต้องการทดสอบความแตกต่างของระยะทางที่ได้จากอัตราเร็วของรถที่ต่างกัน 5 ระดับ จึงทำการวางแผนการทดลองเติมน้ำมันให้รถยี่ห้อเดียวกัน 10 คันให้เต็มถัง และขับไปในทิศทางต่างๆ กันเพื่อให้น้ำมันหมดถังแล้ววัดระยะทางที่ได้โดยใช้อัตราเร็วให้คงที่ที่ระดับต่างๆ 5 ระดับ ดังนี้

ตารางตัวอย่างการคำนวน One way ANOVA

เราจะตรวจสอบข้อตกลงเบื้องต้น คือ การแจกแจงปกติของข้อมูลโดยสถิติโคลโมโกรอฟ-สมินอฟ โดยเปิดโปรแกรม SPSS จากนั้นกรอกข้อมูลของตัวแปร โดยให้ตัวแปรอัตราเร็ว 70 km/hr เป็นตัวแปรชื่อ speed และมีค่าเป็น 1 และอัตราเร็ว 80 km/hr เป็นชื่อตัวแปร speed มีค่าเป็น 2 เป็นอย่างนี้ไปเรื่อยๆ จนถึงตัวแปรอัตราเร็ว 120 km/hr เป็น speed และมีค่าเป็น 5

ANOVA จากโปรแกรม SPSS

ไปที่ Analze > Descriptive Statistics > Explore…

ขั้นตอนการคำนวณ One way ANOVA

ลากตัวแปรตาม distancing ลงในช่อง Dependent List และลากตัวแปรอิสระ speed เข้าไปในช่อง Factor List จากนั้นกด Plots…

ตัวแปรของ anova

คลิกเลือก Normality plots with tests จากนั้นกด Continue > OK

การทดสอบการแจกแจงปกติ

หมายเหตุ : ปกติแล้วโปรแกรมจะตั้งค่า แอลฟาไว้ที่ 0.05 แต่ถ้าเราต้องการค่าแอลฟาค่าอื่น ให้ตั้งค่าที่ statistics…

จากผลการทดสอบ Kolmogorov-Smirnov พบว่าตัวแปร 1-5 ค่า sig. มากกว่า 0.05 ทุกค่าแสดงว่าทุกตัวแปร 1-5 เป็นการแจกแจงแบบปกติ

ผลการทดสอบการแจกแจงปกติ

ต่อไปจะวิเคราะห์ค่าสถิติ one way anova พร้อมกับตรวจสอบความแปรปรวนไปด้วย โดยไปที่ Analyze > Compare Means > One-Way ANOVA

ขั้นตอนคำนวน การวิเคราะห์ความแปรปรวนทางเดียว

นำสองแปรตามใส่ใน Dependent List และตัวแปรอิสระใส่ Factor จากนั้นกด Options… เพื่อเลือกค่าสถิติทดสอบความแปรปรวนว่าเท่ากันทุกกลุ่มหรือไม่

ตัวแปรของการวิเคราะห์ความแปรปรวนทางเดียว

เลือก Homogeneity of variance test จากนั้นคลิก Continue

ทดสอบความแปรปรวนว่าเท่ากันหรือไม่

ถ้าหากเราต้องการทดสอบ Multiple Comparison เลยว่าคู่ไหนที่แตกต่าง เราสามารถตั้งค่าไว้ได้เลยจากตัวเลือก Post Hoc…

การทำ post hoc เปรียบเทียบรายคู่

ถ้าเราทราบว่าความแปรปรวนเท่ากัน เราสามารถเลือก สถิติที่ต้องการทดสอบได้ เช่น ผมเลือก LSD Scheffe และ Tukey ส่วนช่องล่าง ก็สามารถเลือกได้ เพราะเรายังไม่ได้ทดสอบความแปรปรวน จึงสามารถเลือกสถิติกรณีความแปรปรวนไม่เท่ากันได้ เช่น เลือก Dunnett’s T3 เป็นต้น จากนั้นกด Continue

สถิติ one way anova

เรามาดูผลการทดสอบความแปรปรวนกันครับว่าแต่ละกลุ่มเท่ากันหรือไม่ ดูค่า sig ทุกค่า มากกว่า 0.05 แสดงว่า ยอมรับสมมติฐานหลัก สรุปว่า ความแปรปรวนเท่ากันทุกกลุ่มประชากร เป็นไปตามเงื่อนไขข้อตกลงเบื้องต้นทุกประการครับ

ทดสอบ one way anova

ตารางที่สำคัญ คือ ตารางนี้ครับ ตาราง ANOVA ได้ค่า sig เท่ากับ 0.519 มากกว่า 0.05 แสดงว่า ไม่ sig. ถ้ามัน sig มันต้องน้อยกว่าค่าแอลฟา จึงยอมรับสมมติฐานหลัก คือ ค่าเฉลี่ยของแต่ละกลุ่มประชากร ไม่แตกต่างกัน

ตาราง anova

สังเกตว่า เราไม่จำเป็นต้องทำ Pos Hoc หรือดูตาราง Multiple comparison ต่อครับ เหตุผลเพราะค่าเฉลี่ยของประชากร ไม่แตกต่างกัน ก็ไม่จำเป็นต้องดูเป็นรายคู่ว่าคู่ไหนแตกต่างกัน สังเกตตารางดูก็ได้ว่า ไม่ sig เลย เพราะถ้า sig มันจะมีเครื่องหมายดอกจัน * ที่ตัวเลขในตารางครับ

mutiple comparison test

เพื่อให้เห็นภาพของ Post hoc มากยิ่งขึ้น ผมขอเปลี่ยนแปลงข้อมูลใหม่ โดยตัวแปรที่ 3 ผมเปลี่ยนข้อมูลใหม่ทั้งชุด และทดสอบการแจกแจงปกติผ่านแล้ว ต่อไปจะทดสอบความแปรปรวน และ ANOVA โดยข้อมูลของผมเป็นดังนี้

แก้ไขตาราง one way anova

เมื่อนำไปรันใหม่แล้วจะได้ตารางดังนี้ครับ ตารางทดสอบความแปรปรวนของข้อมูล (ค่า sig ในกรอบเหลี่ยมแดง) พบว่า น้อยกว่า 0.05 แสดงว่า ความแปรปรวนไม่เท่ากัน เราจึงจะใช้ค่าสถิติของ Dunnett’s T3

ขณะเดียวกันพบว่า ตารางสำคัญที่สุดคือ ตาราง ANOVA ให้ค่า sig เท่ากับ 0.015 น้อยกว่า 0.05 ที่ตั้งไว้ ดั้งนั้นก็ sig. เช่นกัน แสดงว่า มีอย่างน้อย 1 คู่ที่ค่าเฉลี่ยแตกต่างกัน เราจึงพิจารณาตาราง Post Hoc ต่อไป

ค่า sig ของ one way anova

ผมเลือกมาเฉพาะตารางของ Dunnett T3 นะครับ และค่า sig จะมี 4 แถว ดังภาพ หรือสังเกตจากดอกจัน * ของค่า Mean Difference (I-J) เอา i ลบ j ติดลบคือ คู่ 2 กับ 3 แสดงว่า 2 น้อยกว่า 3 หรือหมายถึง ค่าเฉลี่ยของตัวแปร 2 น้อยกว่า ตัวแปร 3 อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05 นั่นเอง

ทำนองเดียวกัน เราพบว่า คู่ 3 และ 5 ก็แตกต่างกัน โดยที่ ค่าเฉลี่ยตัวแปร 5 น้อยกว่า 3 อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05

แม้ว่าจะไฮไลท์ไว้ 4 แถว แต่ 2 กับ 3 ก็ซ้ำคู่ 3 กับ 2 นั่นเอง ทำให้สรุปผลความแตกต่างได้ 2 คู่ดังกล่าวครับ และจะพบอีกว่า คู่ 4 กับ 5 ก็เกือบ sig เหมือนกันครับเพราะได้ค่า sig=0.06

mutiple comparison ของ one way anova

เมื่อเราจะสรุปผลจากจากตารางจะได้ว่า

ระยะทางที่ได้จากความเร็วของรถ 5 ระดับดังกล่าวพบว่า ระยะทางที่ได้จากอัตราเร็ว 90 km/hr เป็นอัตราเร็วที่ได้ระยะทางมากที่สุด ซึ่งแตกต่างจากระยะทางที่ได้จากอัตราเร็ว 80 km/hr และ 120 km/hr อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05

การวิเคระห์ความแปรปรวนสองทาง (Two-Way ANOVA)

จะต่างจากการวิเคราะห์ความแปรปรวนทางเดียว คือ ตัวแปรอิสระ (Factor) จะมี 2 ตัวแปรครับ สามารถสรุปเป็นตารางดังนี้

ตัวแปรอิสระ (Factor)ตัวแปรตาม (ค่าต่อเนื่อง)
One Way ANOVA11
Two Way ANOVA21

เมื่อมีตัวแปรอิสระ 2 ตัว เป็นปัจจัย (Factor) ที่ต้องการศึกษา เราจะมีตัวแปรที่เกิดจากสองตัวนี้ เรียกว่า ปฎิสัมพันธ์ (Interaction) ซึ่งโดยทั่วไปการศึกษา Two Way ANOVA มักให้ความสำคัญกับตัวแปรนี้เป็นพิเศษครับ

ตัวอย่างการคำนวณ Two-Way ANOVA โดยใช้ SPSS

เพื่อให้เห็นภาพอย่างชัดเจน เราจะใช้ข้อมูลเดิมของ One Way ANOVA แต่จะเพิ่มอีก 1 ตัวแปรอิสระเข้าไป คือ น้ำหนักของสิ่งของที่บรรทุกในรถที่ขับ โดยเก็บข้อมูลจากรถยี่ห้อเดียวกัน 4 คันโดยแบ่งเป็นกลุ่มไม่บรรทุกสิ่งของ บรรทุกสิ่งของที่มีน้ำหนัก 500 kg และ 800 kg เก็บได้ข้อมูลดังตาราง

ข้อมูล two way anova

ทดสอบเงื่อนไขการแจกแจงปกติ (ทำขั้นตอนเดียวกันกับ One-Way ANOVA) พบว่า มีการแจกแจงปกติทุกตัวแปร ดูจากค่า sig

เราจะตั้งสมมติฐานการทดลองดังนี้
H_0 : \mu_1=\mu_2=\mu_3=...=\mu_k
H_1 : มีอย่างน้อย 1 คู่ที่มีค่าเฉลี่ยไม่เท่ากัน

ทำการกรอกข้อมูลใน SPSS ได้ดังภาพ จะเห็นว่าตัวแปรอิสระ 2 ตัว คือ Speed และ weight มีการแทนด้วยเลขดังนี้

speedค่าตัวแปร
70 km/hr1
80 km/hr2
90 km/hr3
100 km/hr4
120 km/hr5

ตัวแปร weight ก็มีการแทนค่าตัวแปรดังนี้

weightค่าตัวแปร
บรรทุก 0 kg1
บรรทุก 500 kg2
บรรทุก 800 kg3

นำตัวแปรมากรอกค่าใน SPSS ได้ดังตาราง

กรอก spss ของ two way anova

คำนวนค่าโดยไปที่ Analyze > General Linear Model > Univariate…

ขั้นตอนคำนวณ two way anova

นำตัวแปรตามเข้าไปที่ Dependent Variable ส่วนตัวแปรอิสระสองตัว นำเข้าไปที่ Fix Factor (s) จากนั้นคลิก Model

ใส่ตัวแปรของ two way anova

เลือก Build terms จากนั้นคลิกเลือกตัวแปรอิสระสองตัวเข้าไปฝั่งขวามือ และเลือกทั้งสองคลิกพร้อมกันเพื่อสร้างเป็นตัวแปรอิสระอีกตัว คือ ปฎิสัมพันธ์ของตัวแปรอิสระทั้งสองตัว จะเห็นว่า มี speed*weight เกิดขึ้น จากนั้นคลิก continue

univariate model ของ two way anova

คลิกเลือก Post Hoc เพื่อเปรียบเทียบรายคู่ กรณีเกิดการ sig ของตัวแปรอิสระเกิดขึ้น เลือกตัวแปรทั้งสองไว้ฝั่งขวามือ และในที่นี้ผมเลือกเปรียบเทียบรายคู่โดยใช้ LSD แล้วคลิก Continue ตามด้วย OK

การวิเคราะห์ผลของ Two-Way ANOVA จาก SPSS

ผลการวิเคราะห์ออกมาดังภาพ พบว่าตัวแปรที่มีค่า sig คือ weight ส่วนอีกแปร speed ไม่ sig และ ปฎิสัมพันธ์ speed*weight ไม่ sig ด้วยเช่นกัน จึงสรุปตามสมมติฐานว่า น้ำหนักแตกต่างกัน มีผลทำให้ระยะทางที่ได้แตกต่างกันอย่างมีนัยสำคัญที่ระดับ 0.05

วิเคราะห์ผลของ two way anova

ส่วนตาราง Post Hoc จะได้เปรียบเทียบรายคู่ของ ตัวแปร weight พบว่า การบรรทุกน้ำหนัก 500 กับ 800 kg ทำให้ระยะทางไม่แตกต่างกัน ส่วนการไม่บรรทุกน้ำหนัก กับบรรทุก 500 และ 800 ทำให้ระยะทางที่ได้แตกต่างกันอย่างมีนัยสำคัญที่ระดับ 0.05

แหล่งอ้างอิง :

ไพศาล วรคำ. (2559). การวิจัยทางการศึกษา Education Research. มหาสารคาม: ตักศิลาการพิมพ์.

ฉลอง สีแก้วสิ่ว. (ม.ป.ป.). https://sites.google.com/site/mystatistics01/chapter5/anova. เข้าถึงได้จาก https://sites.google.com/site/mystatistics01/home: https://sites.google.com/site/mystatistics01/home

ประกายรัตน์ สุวรรณ และ อมรวิทย์ วิเศษสงวน. (2555). การวิจัยและวิเคราะห์ข้อมูลด้วยโปรแกรม SPSS เวอร์ชัน 20. กรุงเทพฯ: ซีเอ็ดยูเคชั่น.

สุวิชาน มนแพวงศานนท์. (2543). วิเคราะห์ข้อมูลทางสถิติด้วย SPSS for Windows . กรุงเทพฯ: ซีเอ็ดยูเคชั่น.


รับปรึกษาและวิเคราะห์ข้อมูลทางสถิติด้วยโปรแกรม SPSS สนใจติดต่อที่ไลน์ : @krujakkrapong หรืออีเมล [email protected]

Leave a Reply