top of page

Correlation: simple but not easy

Updated: Dec 10, 2021

เคยได้ยินเมื่อสมัยเรียนมาว่า "Correlation does not imply causation" เรื่องนี้ก็เป็นประเด็นนึงที่ต้องเล่าสู่กันฟัง เอาล่ะครับ มาเริ่มกันเลยดีกว่ากับบทความในวันนี้ "Correlation: simple but not easy"


1. Correlation คืออะไร


บางคนคงทราบกันดีกว่า correlation คือ การวิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปร เช่น รายได้กับความพึงพอใจ ซึ่งทั้งสองตัวแปรนั้นต้องเป็นระดับ interval/ ratio หรือเรียกรวมๆ ว่า continuous (อ่านเพิ่มเติมบทความเกี่ยวกับเรื่องระดับตัวแปร)


แต่ correlation นั้น ยังไม่ได้เอาไว้แค่วิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปรเท่านั้น แต่ในหลายๆ กรณี correlation จะถูกนำไปใช้ในการตรวจสอบความสัมพันธ์ต่างๆ ที่มีหลายตัวแปร แม้ว่าจะเป็นผลความสัมพันธ์เพียง 2 ตัวแปรก็ตาม เช่นนี้ เนื่องจากว่า ทำเพื่อดูความสัมพันธ์ในแต่ละคู่ตัวแปร หรือดูความสัมพันธ์ระหว่างตัวแปรอิสระ กับ ตัวแปรตาม แต่นำเสนอให้อยู่ในตารางเดียว ดังภาพตัวอย่าง



correlation

จากภาพจะเห็นได้ว่ามี 4 ตัวแปร ผลของความสัมพันธ์จะแสดงกันเป็นคู่ๆ นับได้ 6 คู่ โดยฝั่งขวาบน กับ ซ้ายล่าง คือผลเดียวกัน จะดูฝั่งไหนก็ได้ และแน่นอนว่า ไม่ใช่ความสัมพันธ์ของทั้งหมดพร้อมกัน แต่มันคือความสัมพันธ์ในแต่ละคู่เท่านั้น ลองดูอีกภาพ เป็นภาพ scatter diagram



scatter diagram correlation

จากภาพ scatter diagram เป็นความอีกหนึ่งความสัมพันธ์ระหว่างตัวแปร แต่แสดงผลแบบกราฟ จากภาพจะเห็นว่าชุดข้อมูลระหว่าง 2 ตัวแปร จะกระจายๆ กันไป แต่ยังสามารถมองทิศทางได้ ว่าไปทางเดียวกัน ก็คือ จากซ้ายล่างขึ้นไปขวาบน แบบนี้ เราเรียกว่า "สัมพันธ์ในทิศทางบวก หรือ positive direction" และแม้ว่ารูปกราฟจะแสดงออกมาหลายคู่ แต่มันก็ยังเป็นความหมายเดิมคือ ความสัมพันธ์ในแต่ละคู่เท่านั้น


สรุปในประเด็นที่ 1 correlation คืออะไร ก็คือความสัมพันธ์ของตัวแปร ซึ่งแสดงผลเป็นคู่ๆ และถ้ามีหลายตัวแปรก็มักจะแสดงผลออกมาในรูปของ matrix


 

2. Correlation does not imply causation


ในประเด็นนี้ สามารถแปลได้ตรงตัวเลย ก็คือ มีความสัมพันธ์กันไม่ได้แปลว่าจะเป็นเหตุเป็นผลกันได้ ที่กล่าวเช่นนี้เพราะว่า เมื่อก่อน มักนำการวิเคราะห์ correlation ไปใช้เพื่อสรุปความเป็นเหตุเป็นผล หรือ causation ซึ่งมันไม่เพียงพอ ไม่ใช่ไม่ถูกต้องนะ แต่มันไม่เพียงพอ เพราะถ้าเราไปดูสถิติที่ใช้สำหรับการวิเคราะห์ความเป็นเหตุเป็นผล อย่าง regression จะพบว่า 1 ในหลายๆ ข้อตกลงเบื้องต้น ก็คือ ตัวแปรอิสระต้องมีความสัมพันธ์กับตัวแปรตาม นั่นก็คือ correlated กันนั่นเอง ดังนั้น

  • มีความสัมพันธ์กัน (correlated กัน) ไม่ได้แปลว่าจะเป็นเหตุเป็นผลกัน

  • จะมีความเป็นเหตุเป็นผลกันได้นั้น จะต้องมีความสัมพันธ์กันด้วย


causation

จากภาพนี้จะเห็นได้ชัดว่า มีความสัมพันธ์กันมากๆ แต่กลับมีผลให้เกิดความเป็นเหตุเป็นผลกันเพียงครึ่งเดียว และเช่นเดียวกัน จะเป็นเหตุเป็นผลกันได้นั้น ก็ต้องมีความสัมพันธ์กันด้วย


สรุปในประเด็นที่ 2 Correlation does not imply causation ต้องไม่เข้าใจผิดว่าหากมีความสัมพันธ์กันแล้วจะสามารถอ้างได้ว่าเป็นเหตุเป็นผลกัน สถิติ correlation ก็คือเน้นเรื่องความสัมพันธ์ หากต้องการทดสอบความเป็นเหตุเป็นผลก็ต้องไปใช้ตระกูล regression


 

3. Correlation สำหรับเรื่องอื่น


ในประเด็นที่ 3 คำว่าสำหรับเรื่องอื่นๆ นั้น ก็ยังเน้นที่ความสัมพันธ์ อย่างที่กล่าวไปข้างต้นว่า correlation มักนำไปใช้ในหลายกรณี ประเด็นนี้จึงมาเล่าเป็นเบื้องต้นว่า ใช้ในกรณีใดบ้าง

  • Multicollinearity

  • Summary data

  • Linearity

  • ความสอดคล้องของข้อมูลในภาพรวม

เหล่านี้เป็นต้น ดังนั้น correlation จะว่าง่ายก็ง่าย จะว่ายากก็ยากได้ แต่ทั้งนี้ทั้งนั้นการวิเคราะห์ correlation นั้นดูเหมือนธรรมดาๆ แต่ก็ไม่ง่ายเลย ที่จะทำความเข้าใจ


 

สนใจเรียนสถิติพื้นฐานสำหรับการวิจัย Basic Statisitc by SPSS หรือสถิติขั้นสูงสมการโครงสร้าง Advanced Statistic SEM ติดต่อสอบถามได้ในทุกช่องทาง


ร่วมติดตามได้ทุกช่องทาง

follow or subscribe in any channel


tel.086-555-5949

line: @SmartResearchThai

Youtube: SmartResearchThai

Facebook: SmartResearchThai

Recent Posts

See All

2 Comments


ยกตัวอย่างเช่น ติดตาม Smart Research Thai บ่อยๆ แล้วจะปลอดภัยจากโควิด 555

Like
Replying to

555 ว้าย ใช่เหรอ

Like
bottom of page