บทความนี้จะขออธิบายพร้อมยกตัวอย่างทฤษฎีบทหนึ่งที่มีความสำคัญมากกับวงการสถิตินะครับ นั่นคือ ทฤษฎีบท Central Limit Theorem ชื่อภาษาไทยคือ “ทฤษฎีขีดจำกัดกลาง”
ก่อนจะเข้าทำความเข้าใจทฤษฏี เรามาทำความเข้าใจเรื่องการสุ่มออกออกมาเป็นกลุ่มก่อนครับ สมมติมีประชากร 100 คน เราสุ่มตัวอย่าง 1 คนออกมาจะสุ่มได้ทั้งหมดกี่แบบ ?
คำตอบคือ 100 แบบ แล้วถ้าเปลี่ยนคำถามเป็น สุ่มคนออกมาคราวละ 2 คน จะสามารถสุ่มได้ทั้งหมดกี่รูปแบบ ? ในทางคณิตศาสตร์มีสูตรสำหรับคำนวณค่าเหล่านี้ครับ นั่นคือ สูตรการเลือก หรือ combination ดังนี้
โดย n คือจำนวนสิ่งของแตกต่างกัน และ r คือ จำนวนที่ต้องการเลือกออกมา ในที่นี้ จะพบว่า ถ้าประชากร 100 เลือกออกมาคราวละ 2 จะได้สูตร
จะเป็นว่ารูปแบบของการสุ่มคราวละ 2 คนนั้นมีได้มากถึง 2475 รูปแบบ คราวนี้ลองมาดูคราวละ 5 บ้างจะได้เท่าไร
ได้เป็นล้านรูปแบบ! เยอะมากๆ ใช่มั้ยละครับ
ถ้าเพิ่มจำนวนคนในกลุ่มมากยิ่งขึ้นไปเรื่อยๆ เราจะพบว่า เมื่อเพิ่มถึงระดับหนึ่งจำนวนรูปแบบกลับมีน้อยลง เช่น สุมคราวละ 95 (กลุ่มละ 95 คน) เราจะได้รูปแบบทั้งหมดเท่ากับ 75,287,520 รูปแบบ
ตัวเลขที่ยกมานั้น เป็นล้านแต่เราจะไม่ได้มานั่งหาค่าเฉลี่ยทีละกลุ่มจนครบหรอกนะครับ เพราะมันคงเป็นไปไม่ได้ที่จะหาจนครบทุกรูปแบบ
ทุกๆ กลุ่มที่เราสุ่มมาได้จะมีค่าเฉลี่ยของใครของมันใช่ไหมครับ เช่น สุ่มมา 5 คน ได้ 75 ล้านรูปแบบ ในแต่ละรูปแบบจะมีค่าเฉลี่ยแต่กต่างกันไป บางกลุ่มก็จะมีค่าเฉลี่ยเท่ากันไม่เท่ากัน
สิ่งที่น่าสนใจคือ ค่าเฉลี่ยของแต่ละกลุ่มเหล่านั้นมันมีค่าอยู่ประมาณเท่าไร ?
โดย Central Limit Theorem จะบอกเราว่า ค่าเฉลี่ยและการกระจายของค่าเฉลี่ยของกลุ่มตัวอย่างทุกกลุ่ม จะมีความสัมพันธ์บางอย่างกับของประชากร (ข้อมูลทั้งหมด) นั่นเอง สัมพันธ์กันอย่างไร ติดตามได้จากบทความนี้ได้เลยครับ
เพื่อความสะดวกในการยกตัวอย่างให้เห็นภาพ จะขอยกตัวอย่างด้วยประชากรกลุ่มเล็กๆ ดังนี้
ประชากรมีทั้งหมด 5 ตัว นำมาหาค่าเฉลี่ย เท่ากับ 16.4 และมีส่วนเบี่ยงเบนมาตรฐานของประชากร เท่ากับ 5.46
ผมจะแบ่งกลุ่มของประชากรออกเป็นกลุ่มย่อยๆ กลุ่มละ 3 ตัวอย่าง ดังนั้น จะมีกลุ่มตัวอย่างทั้งหมด 10 กลุ่มที่แตกต่างกันและหาค่าเฉลี่ยของแต่ละกลุ่มได้ดังนี้
การที่เรานำกลุ่มตัวอย่างทุกกลุ่มมาแจกแจงแบบนี้ เรียกว่า การแจกแจงของตัวอย่าง หรือ Sampling Distribution ประเด็นที่น่าสนใจคือ ค่าเฉลี่ยของกลุ่มตัวอย่างแต่ละตัวนั้นจะมีแนวโน้มใกล้เคียงกับค่าเฉลี่ยของประชากร และค่าเฉลี่ยของกลุ่มตัวอย่างทั้งหมด (ค่าเฉลี่ยของค่าเฉลี่ยนะหวังว่าคงไม่งง 😦 ) จะมีค่าเท่ากับ ค่าเฉลี่ยของประชากร ครับ
เมื่อเราเอาค่าเฉลี่ยของแต่ละกลุ่มมาทำเป็น Histogram เราจะเห็นภาพว่ามันเป็นโค้งปกติ (Normal) แต่ตัวอย่างนี้อาจไม่ค่อยเห็นภาพเพราะว่ากลุ่มตัวอย่างเราน้อยเกินไปนั่นเองครับ
ค่าเฉลี่ยของประชากร เท่ากับ 14.40 ซึ่งมีค่าเท่ากับค่าเฉลี่ยของค่าเฉลี่ยแต่ละกลุ่มครับ นั่นคือ
ความหมายอีกนัยหนึ่งคือ ยิ่งกลุ่มตัวอย่างขนาดใหญ่ขึ้น ค่าเฉลี่ยของกลุ่มตัวอย่างมันจะใกล้ค่าเฉลี่ยของประชากรมากยิ่งขึ้นเรื่อยๆ จนกระทั้งใช้ค่าเฉลี่ยทั้งหมดของกลุ่มตัวอย่าง มันจะเท่ากับค่าเฉลี่ยของประชากรนั่นเอง สมมติว่า ผมหาค่าเฉลี่ยของกลุ่มตัวอย่าง 5,6,7,8 ตัวดังนี้
สังเกตไหมครับว่า ค่าเฉลี่ยจะค่อยๆ เพิ่มขึ้นใกล้ค่า 14.40 มากขึ้นตามขนาดของกลุ่มตัวอย่างนั่นเอง
ต่อไปเป็นประเด็นของส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างนะครับ เรามาดูกันว่าจะสัมพันธ์กับของประชากรอย่างไร
จากสูตรของส่วนเบี่ยงเบนมาตรฐาน เราจะนำมาหาส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างตามสูตรดังนี้
โดย N คือ จำนวนกลุ่มตัวอย่างทั้งหมด ถ้าไม่ได้เอามาทั้งหมดจะใช้สูตร N-1 แทน ส่วนการคำนวณความแปรปรวนของประชากรก็จะใช้สูตรเดิมแต่มีการยกกำลังสองเข้าไปทำให้เครื่องหมายรูทหายไปนั่นเอง
จากตัวอย่างของเรา จะหาค่าส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างดังนี้
ส่วนความแปรปรวนของค่าเฉลี่ยของกลุ่มตัวอย่างจะได้เท่ากับ
ประเด็นที่น่าสนใจคือ ส่วนเบี่ยงเบนมาตรฐานของประชากร หรือ เมื่อนำมาหารด้วยรากที่สองของขนาดกลุ่มตัวอย่าง จะได้ค่าประมาณของส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง เขียนเป็นสูตรได้ว่า
จากตัวอย่าง ถ้าเรานำมาหารด้วยรากที่สองของขนาดของกลุ่มตัวอย่าง จะได้เท่ากับ
ซึ่งใกล้เคียงกับ
เราสามารถสรุปได้ว่า
1. ค่าเฉลี่ยของกลุ่มตัวอย่างส่วนใหญ่ใกล้กับค่าเฉลี่ยของประชากร และหากนำค่าเฉลี่ยของกลุ่มตัวอย่างทั้งหมดมาวาด Histogram จะได้เส้นโค้งแบบปกติ
2. ยิ่งกลุ่มตัวอย่างมีขนาดใหญ่ขึ้น ค่าเฉลี่ยของกลุ่มตัวอย่างจะใกล้ค่าเฉลี่ยของประชากร
3. ถ้านำค่าเฉลี่ยของกลุ่มตัวอย่างทั้งหมดมาหาค่าเฉลี่ย จะได้เท่ากับค่าเฉลี่ยของประชากรเป๊ะๆ (Grand mean = )
4. ส่วนเบี่ยงเบนมาตรของค่าเฉลี่ยของกลุ่มตัวอย่าง จะมีค่าเท่ากับส่วนเบี่ยงเบนมาตรฐานของประชากรหารด้วยรากที่สองของขนาดของกลุ่มตัวอย่าง หรือ
Discover more from KruJakkrapong 's Blog
Subscribe to get the latest posts sent to your email.