ก่อนจะหาค่าสหสัมพันธ์ของข้อมูลจำเป็นต้องเข้าใจสูตรความแปรปรวนร่วมก่อน ซึ่งสูตรของความแปรปรวนร่วม ถือว่ามีความใกล้เคียงกับสูตรความแปรปรวนข้อมูลมากๆ แต่เพียงมีคำว่าร่วม เพิ่มเข้ามา มันหมายถึงการทำอะไรบางอย่างของสองสิ่ง ทำให้เกิดเป็นคำว่าร่วม นั่นเองครับ ถ้าจะอธิบายให้ง่ายๆขึ้นก็คือ ความแปรปรวนปกติคือการที่เราพิจารณาข้อมูลเพียงตัวแปรเดียว แต่ถ้ามีตัวแปรสองตัว ก็จะพิจารณาความแปรปรวนเป็นความแปรปรวนร่วมนั่นเอง งงมั้ย? ถ้างงๆ ก็ลองมาพิจารณาจากสูตรเพื่อเปรียบเทียบกันครับ
สูตรของความแปรปรวนของตัวอย่างคือ
เมื่อ
- คือ ความแปรปรวนของตัวอย่าง
- คือ ข้อมูลจากตัวอย่างแต่ละตัว
- คือ ค่าเฉลี่ยของตัวอย่าง
- คือ จำนวนของตัวอย่าง
และเรามาดูสูตรของความแปรปรวนร่วมกันครับ
เมื่อ
- คือ ค่าความแปรปรวนของตัวแปร X และ Y
- X คือ ค่าข้อมูลของตัวแปร X
- Y คือ ค่าข้อมูลของตัวแปร Y
- คือ จำนวนของตัวอย่าง (ผลรวมจำนวนตัวแปร X และ Y)
สิ่งที่น่าสนใจคือ
- ถ้าค่า น้อยว่าค่าเฉลี่ยของกลุ่มตัวอย่าง มันจะทำให้ ได้ค่าเป็นลบ (-)
- ถ้า มากว่าค่าเฉลี่ยของกลุ่มตัวอย่าง มันจะทำให้ ได้ค่าเป็นบวก (+)
เมื่อนำสองค่ามาคูณกัน จะเกิดผลลัพธ์จาก 3 กรณี คือ
- – กับ – คูณกันได้ +
- – กับ + คูณกันได้ –
- + กับ + คูณกันได้ +
เมื่อนำผลคูณที่ได้มารวมกันจะได้ผลลัพธ์ออกมาเป็นค่าค่าหนึ่ง ถ้ามีแต่บวกรวมกัน ก็จะได้ค่าบวกมากขึ้นเรื่อยๆ หมายความว่าความแปรปรวนร่วมจะได้ค่าเป็นบวก แต่ถ้ามีค่าลบมารวมกันเยอะก็ได้ค่าความแปรปรวนร่วมเป็นลบเช่นกัน
มาดูตัวอย่างการคำนวณกันดีกว่าครับ
สมมติเรามีคะแนนจากการทดสอบของนักเรียนกลุ่มหนึ่ง จำนวน 30 คน ทดสอบสองวิชาคือ คณิตศาสตร์และวิทยาศาสตร์ โดยมีสมมติฐานว่า นักเรียนที่เก่งคณิตศาสตร์ น่าจะเก่งวิทยาศาสตร์ด้วย โดยมีไฟล์ตัวอย่างดาวน์โหลดไปทำตามดูได้ครับ
เมื่อลองนำค่าตัวแปรของทั้งสองมาพล็อตกราฟ (Scatter plot) จะได้ดังภาพ
จากนั้นเราจะหาค่า เฉลี่ย () และส่วนเบี่ยงเบนมาตรฐาน () แล้วนำมาหาผลต่างของค่าคะแนนกับค่าเฉลี่ยของแต่ละกลุ่ม จากนั้นก็นำมาคูณกันดังนี้
นำมาหาค่า
โดยที่เราได้ค่าความแปรปรวนร่วมออกมาเป็นบวก แสดงว่า ถ้าคะแนนคณิตศาสตร์มาก คะแนนวิทยาศาสตร์จะมากตามไปด้วย และถ้าคะแนนคณิตศาสตร์น้อยคณิตวิทยาศาสตร์จะน้อยตามไปด้วย แต่ความแปรปรวนร่วมนั้นไม่ใช่ค่ามาตรฐาน ทำให้ตีความนำไปเปรียบเทียบกันยังไม่ได้ ซึ่งมีวิธีการแปลงเป็นค่าสหสัมพันธ์กันต่อไป
แหล่งอ้างอิง
พงศ์มนัส บุศยประทีป. (2559). สถิติง่ายๆ ใช้ได้ทุกงาน. นนทบุรี: ธิงค์ บียอนด์ บุ๊คส์
Sebastian Taylor. (2023). Covariance A measure of the relationship between random variables. Retrieved 29 April 2023, from https://corporatefinanceinstitute.com/resources/data-science/covariance/.
Discover more from KruJakkrapong 's Blog
Subscribe to get the latest posts sent to your email.