top of page

Correlation: simple but not easy

Updated: Dec 10, 2021

เคยได้ยินเมื่อสมัยเรียนมาว่า "Correlation does not imply causation" เรื่องนี้ก็เป็นประเด็นนึงที่ต้องเล่าสู่กันฟัง เอาล่ะครับ มาเริ่มกันเลยดีกว่ากับบทความในวันนี้ "Correlation: simple but not easy"


1. Correlation คืออะไร


บางคนคงทราบกันดีกว่า correlation คือ การวิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปร เช่น รายได้กับความพึงพอใจ ซึ่งทั้งสองตัวแปรนั้นต้องเป็นระดับ interval/ ratio หรือเรียกรวมๆ ว่า continuous (อ่านเพิ่มเติมบทความเกี่ยวกับเรื่องระดับตัวแปร)


แต่ correlation นั้น ยังไม่ได้เอาไว้แค่วิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปรเท่านั้น แต่ในหลายๆ กรณี correlation จะถูกนำไปใช้ในการตรวจสอบความสัมพันธ์ต่างๆ ที่มีหลายตัวแปร แม้ว่าจะเป็นผลความสัมพันธ์เพียง 2 ตัวแปรก็ตาม เช่นนี้ เนื่องจากว่า ทำเพื่อดูความสัมพันธ์ในแต่ละคู่ตัวแปร หรือดูความสัมพันธ์ระหว่างตัวแปรอิสระ กับ ตัวแปรตาม แต่นำเสนอให้อยู่ในตารางเดียว ดังภาพตัวอย่าง



ree
correlation

จากภาพจะเห็นได้ว่ามี 4 ตัวแปร ผลของความสัมพันธ์จะแสดงกันเป็นคู่ๆ นับได้ 6 คู่ โดยฝั่งขวาบน กับ ซ้ายล่าง คือผลเดียวกัน จะดูฝั่งไหนก็ได้ และแน่นอนว่า ไม่ใช่ความสัมพันธ์ของทั้งหมดพร้อมกัน แต่มันคือความสัมพันธ์ในแต่ละคู่เท่านั้น ลองดูอีกภาพ เป็นภาพ scatter diagram



ree
scatter diagram correlation

จากภาพ scatter diagram เป็นความอีกหนึ่งความสัมพันธ์ระหว่างตัวแปร แต่แสดงผลแบบกราฟ จากภาพจะเห็นว่าชุดข้อมูลระหว่าง 2 ตัวแปร จะกระจายๆ กันไป แต่ยังสามารถมองทิศทางได้ ว่าไปทางเดียวกัน ก็คือ จากซ้ายล่างขึ้นไปขวาบน แบบนี้ เราเรียกว่า "สัมพันธ์ในทิศทางบวก หรือ positive direction" และแม้ว่ารูปกราฟจะแสดงออกมาหลายคู่ แต่มันก็ยังเป็นความหมายเดิมคือ ความสัมพันธ์ในแต่ละคู่เท่านั้น


สรุปในประเด็นที่ 1 correlation คืออะไร ก็คือความสัมพันธ์ของตัวแปร ซึ่งแสดงผลเป็นคู่ๆ และถ้ามีหลายตัวแปรก็มักจะแสดงผลออกมาในรูปของ matrix


2. Correlation does not imply causation


ในประเด็นนี้ สามารถแปลได้ตรงตัวเลย ก็คือ มีความสัมพันธ์กันไม่ได้แปลว่าจะเป็นเหตุเป็นผลกันได้ ที่กล่าวเช่นนี้เพราะว่า เมื่อก่อน มักนำการวิเคราะห์ correlation ไปใช้เพื่อสรุปความเป็นเหตุเป็นผล หรือ causation ซึ่งมันไม่เพียงพอ ไม่ใช่ไม่ถูกต้องนะ แต่มันไม่เพียงพอ เพราะถ้าเราไปดูสถิติที่ใช้สำหรับการวิเคราะห์ความเป็นเหตุเป็นผล อย่าง regression จะพบว่า 1 ในหลายๆ ข้อตกลงเบื้องต้น ก็คือ ตัวแปรอิสระต้องมีความสัมพันธ์กับตัวแปรตาม นั่นก็คือ correlated กันนั่นเอง ดังนั้น

  • มีความสัมพันธ์กัน (correlated กัน) ไม่ได้แปลว่าจะเป็นเหตุเป็นผลกัน

  • จะมีความเป็นเหตุเป็นผลกันได้นั้น จะต้องมีความสัมพันธ์กันด้วย


ree
causation

จากภาพนี้จะเห็นได้ชัดว่า มีความสัมพันธ์กันมากๆ แต่กลับมีผลให้เกิดความเป็นเหตุเป็นผลกันเพียงครึ่งเดียว และเช่นเดียวกัน จะเป็นเหตุเป็นผลกันได้นั้น ก็ต้องมีความสัมพันธ์กันด้วย


สรุปในประเด็นที่ 2 Correlation does not imply causation ต้องไม่เข้าใจผิดว่าหากมีความสัมพันธ์กันแล้วจะสามารถอ้างได้ว่าเป็นเหตุเป็นผลกัน สถิติ correlation ก็คือเน้นเรื่องความสัมพันธ์ หากต้องการทดสอบความเป็นเหตุเป็นผลก็ต้องไปใช้ตระกูล regression


3. Correlation สำหรับเรื่องอื่น


ในประเด็นที่ 3 คำว่าสำหรับเรื่องอื่นๆ นั้น ก็ยังเน้นที่ความสัมพันธ์ อย่างที่กล่าวไปข้างต้นว่า correlation มักนำไปใช้ในหลายกรณี ประเด็นนี้จึงมาเล่าเป็นเบื้องต้นว่า ใช้ในกรณีใดบ้าง

  • Multicollinearity

  • Summary data

  • Linearity

  • ความสอดคล้องของข้อมูลในภาพรวม

เหล่านี้เป็นต้น ดังนั้น correlation จะว่าง่ายก็ง่าย จะว่ายากก็ยากได้ แต่ทั้งนี้ทั้งนั้นการวิเคราะห์ correlation นั้นดูเหมือนธรรมดาๆ แต่ก็ไม่ง่ายเลย ที่จะทำความเข้าใจ


สนใจเรียนสถิติพื้นฐานสำหรับการวิจัย Basic Statisitc by SPSS หรือสถิติขั้นสูงสมการโครงสร้าง Advanced Statistic SEM ติดต่อสอบถามได้ในทุกช่องทาง


ร่วมติดตามได้ทุกช่องทาง

follow or subscribe in any channel


tel.086-555-5949

line: @SmartResearchThai

Youtube: SmartResearchThai

Facebook: SmartResearchThai

2 Comments


kansinee.p
Nov 30, 2021

ยกตัวอย่างเช่น ติดตาม Smart Research Thai บ่อยๆ แล้วจะปลอดภัยจากโควิด 555

Like
Replying to

555 ว้าย ใช่เหรอ

Like

SmartResearchThai Co., Ltd.
Statistic Software Tutor, Statistic Assistant, Statistic Consultant

 "ติดต่อเรา"

Line: @SmartResearchThai 

FB: SmartResearchThai

SmartResearchThai Co., Ltd.

  • Facebook
  • YouTube

©2019 by SmartResearchThai Co., Ltd. Proudly created with Wix.com

 

บริษัท สมาร์ทรีเสิร์ชไทย จำกัด

สำนักงานใหญ่ เลขที่ 45/273 

หมู่5 ตำบลพันท้ายนรสิงห์ อำเภอเมือง จังหวัดสมุทรสาคร 74000

เลขประจำตัวผู้เสียภาษี 0745565000878

#อบรมสถิติ #อบรมSEM #สอนสถิติ #สอนSEM #อบรมAMOS #สถิติAMOS #อบรมLISREL #สถิติLISREL #อบรมMplus #สถิติMplus #อบรมSPSS #สถิติSPSS #จ้างวิเคราะห์สถิติ

bottom of page