
บทความนี้จะพูดถึงเรื่อง p-value แบบที่กระชับและเข้าใจง่ายที่สุด
หากพูดถึงสถิติสำหรับการวิจัย ก็มักจะพบเจอคำว่า "significant" หรือที่เรียกกันสั้นๆ ว่า "ซิก" ซึ่งมีความหมายที่เข้าใจได้อย่างง่ายๆว่า "ซิกก็คือโอเค" แสดงว่าผลการทดสอบสถิติเป็นไปตามที่ต้องการ
แต่ภายใต้ความหมายนั้น มีเรื่องราวอยู่เล็กน้อย บทความนี้ จะมาเล่าให้ฟัง
outline:
1.ความหมายของ p-value
อย่างที่เกริ่นไปข้างต้นเกี่ยวกับคำว่า significant ซึ่งมีความเกี่ยวโยงมาถึง p-value ว่าง่ายๆ ก็คือ มันคือเรื่องเดียวกัน เรามักจะพูดว่า ผลการทดสอบนี้ ซิก หรือไม่ หากซิก ก็แปลว่าผ่านตามต้องการ ทีนี้ เรามาอธิบายเพิ่มเติมกันหน่อยครับ
ในโปรแกรมยอดฮิตอย่าง SPSS จะใช้คำว่า Sig. และมีตัวเลขแสดงในตาราง ซึ่งค่าที่แสดงเนี่ยแหละคือค่า p-value จากนั้น เราก็จะพิจารณาว่า ค่า p-value ตัวนี้ นั้นผ่านเกณฑ์หรือไม่ โดยเกณฑ์ที่นิยมตั้งไว้ ก็คือ 0.05
หาก p < 0.05 หมายถึง significant หรือ มี นัยสำคัญทางสถิติ (แตกต่างกัน สัมพันธ์กัน)
หาก p > 0.05 หมายถึง non-significant หรือ ไม่มี นัยสำคัญทางสถิติ (ไม่แตกต่างกัน ไม่สัมพันธ์กัน)
2.การนำค่า p-value ไปใช้
ทีนี้เวลาเราจะไปเขียนตาราง ก็จะใช้คำว่า p-value แต่เราจะเอาค่า "Sig." ในโปรแกรมไปใส่ เช่น ในโปรแกรมมีค่า Sig. = 0.045 เราก็จะเอาค่านี้ไปใส่ในตารางเลย ในช่อง p-value

ภาพนี้ เป็นผลจากโปรแกรม จะเห็นว่าในตารางใช้คำว่า Sig. โดยมีค่า 0.000

ภาพนี้เป็นการนำเสนอตาราง โดยนำค่า Sig. = 0.000 มาใส่ในช่อง p-value
นอกจากนี้ เวลาทำตาราง เขียนรายงาน เราจะห้อยข้อความไว้ใต้ตาราง เพื่อกำกับไว้ว่าค่า p-value นั้นอยู่ในระดับใด ซึ่งโดยทั้วไปมีอยู่ 2 ระดับ คือ
นัยสำคัญทางสถิติที่ระดับ 0.05 นิยมเขียนเป็น p<0.05 ไม่ว่าค่า p จะเป็นเท่าไรก็ตาม ถ้ามีค่าน้อยกว่า 0.05 ก็จะเขียนครอบคลุมในระดับนี้
นัยสำคัญทางสถิติที่ระดับ 0.01 นิยมเขียนเป็น p<0.01 ไม่ว่าค่า p จะเป็นเท่าไรก็ตาม ถ้ามีค่าน้อยกว่า 0.01 ก็จะเขียนครอบคลุมในระดับนี้
แต่ก็มีโอกาสที่จะพบว่า มีการเขียนถึงระดับ 0.001 เพื่อระบุลงลึกให้ชัดไปเลยว่ามีนัยสำคัญมากจริงๆ เช่น ค่า p-value = 0.000 ก็มักจะเขียนเป็น p<0.001 เป็นต้น
3.ความเกี่ยวข้องของ p-value กับ t-value
แล้วเจ้า p-value ไปเกี่ยวข้องอะไรกับ t-value ขอเล่าแบบนี้ก่อนว่า ถ้าเราทดสอบด้วยสถิติพื้นฐานทั่วไป เช่น Independent sample t-test (อ่านต่อใน basic series เรื่อง t-test) จะมีค่า t ซึ่งเป็นสูตรในการคำนวณสถิติที่ชื่อ t-test นี้ ดังนั้นในตาราง ก็จะแสดงเป็นค่า t มาให้

ภาพนี้ เป็นผลจากการวิเคราะห์ t-test ก็จะมีค่า t ปรากฏอยู่
โดยหลักการแล้ว ค่า t คือค่าสถิติจากสูตร t โดยค่า t นี้ สามารถพิจารณานัยสำคัญทางสถิติได้ด้วย โดยมีค่าระหว่าง -1.96 ถึง +1.96 (ลบหนึ่งจุดเก้าหก ถึง บวกหนึ่งจุดเก้าหก) หากค่าอยู่ในระหว่างช่วงนี้ จะถือว่า "ไม่มีนัยสำคัญทางสถิติ" ถูกต้องแล้ว ถ้ามีค่าอยู่ในช่วงนี้ เช่น มีค่า 1.053 ก็ตกอยู่ในช่วงนี้ จึงถือว่าไม่มีนัยสำคัญทางสถิติ ลองดูภาพด้านบนประกอบ จะเห็นว่ามีค่า t=1.053 และมีค่า Sig.=0.293 ซึ่งเป็นผลที่สอดคล้องกัน
ตรงนี้ กำลังจะบอกว่า เราสามารถพิจารณาจากค่า t ได้ ว่าผลการทดสอบนั้นมีนัยสำคัญทางสถิติหรือไม่ ซึ่งจริงๆ แล้วเบื้องหลังการออกค่า p-value (Sig.) ก็จะนำค่า t ไปเทียบตาราง t-distribution ด้วย df ที่กำหนด ก็จะพบค่าวิกฤต (critical value) แล้วก็มาเทียบเป็นค่า p-value นั่นเอง

ภาพตาราง t-distribution
ที่มา: https://www.tdistributiontable.com/
มีอะไรให้ลองเล่นๆ กันครับ ลองเข้าเว็บที่เป็น statistic calculator แล้วนำค่า t กับ df ไปใส่ดูแล้วดูว่าได้ค่า p-value เท่าไร ลองเข้าที่เว็บนี้เลย http://www.statdistributions.com/t/
ลองนำค่าในภาพตัวอย่างไปทดสอบดูนะครับ t=1.053, df=609 จะได้ p-value = ???
เพิ่มเติม: หากใช้โปรแกรมอื่นที่ไม่ใช่ spss อาจไม่เจอคำว่า Sig. จะเจอแต่คำว่า p หรือ p-value
4.สรุป
ขอสรุปเป็นความเข้าใจง่ายๆ ดังนี้
Sig. กับ p-value คือตัวเดียวกัน แต่ในตารางนำเสนอควรใช้คำว่า p-value เพราะเป็นภาษาทางสถิติ
Sig. จะมีในโปรแกรม SPSS ในโปรแกรมอื่น จะใช้คำตรงคือ p-value เลย
หากค่า p < 0.05 จะถือว่ามีนัยสำคัญ หรือ "ซิก"
หากค่า t-value อยู่ "นอกช่วง" -1.96 ถึง +1.96 จะถือว่ามีนัยสำคัญ
ร่วมติดตามได้ทุกช่องทาง
follow or subscribe in any channel
tel.086-555-5949
line: @SmartResearchThai
Blockdit: SmartResearchThai
Youtube: SmartResearchThai
Facebook: SmartResearchThai
Kommentare