Model Identification

Nott Panik Senariddhikrai
Mar 28, 2022
2 min read

"เป็นการตรวจสอบว่าโมเดลที่สร้างขึ้นมานั้น

มี Parameter เพียงพอต่อการคำนวณหรือไม่"

Outline:

Model Identification คืออะไร
การเกิดกรณี Identification
การป้องกันปัญหา Identification
สรุป

ก่อนอื่น ต้องขอทวนกันก่อนว่า model identification นี้ อยู่ในเรื่องการสร้าง หรือพัฒนาโมเดล ไม่ว่าจะเป็นการทดสอบ Confirmatory Factor Analysis(CFA), Path Analysis, หรือ Structural Equation Modeling(SEM) ก็ตาม ล้วนแต่ต้องพิจารณาเรื่อง Model identification กันทั้งสิ้น แล้วเจ้า Model identification นั้น คืออะไร มาหาคำตอบกัน

Model Identification คืออะไร

"Model identification หรืออาจจะเรียกว่า ความเป็นไปได้ค่าเดียว" หมายถึง การคำนวณว่าโมเดลที่เราสร้างขึ้นมานั้นมี parameter เพียงพอต่อการคำนวณหรือไม่ ดังนั้น ก่อนจะทำการวิเคราะห์ใดๆ ก็ตาม ก็ควรมาพิจารณากันเสียก่อนว่าโมเดลที่เราสร้างขึ้นมานั้นมีหน้าตาอย่างไร (Model specification) และมีค่าพารามิเตอร์เพียงพอหรือไม่ (Model identification) ลองดูภาพตัวอย่างนี้ประกอบกัน

การพิจารณา model identification นั้น เราจะดูกัน 2 เรื่อง คือ parameter ของโมเดลที่สร้างขึ้นมานั้นมีกี่ parameter และ parameter ที่เป็นไปได้จากโมเดลที่เราสร้างนั้นมีกี่ parameter

การพิจารณา parameter ของโมเดลที่เราสร้างขึ้นมา

ลองดูจากภาพตัวอย่างด้านบนเป็นตัวอย่างการวิเคราะห์ CFA ที่มี 2 latent กับ 8 observed วิธีการนับง่ายๆ เลยก็คือ มีตัวแปร observed กี่ตัว ในทีนี้มี 8 ก็ให้เราคูณสองเข้าไปเป็น 16 และบวกกับอีก 2 latent รวมเป็น 18 parameter

กาารพิจารณา parameter ที่เป็นไปได้จากโมเดล

วิธีการคือในโมเดลมีจำนวน observed กี่ตัว ให้เราคำนวณตามสูตรนี้

p*(p+1) /2 … [p=number observed variable]

จากสูตรจะได้ว่า p=8 ดังนั้นเมื่อแทนค่าในสูตรแล้วจะได้ 36

ดังนั้นในโมเดลนี้ สามารถเกิด parameter ขึ้นได้ 36 parameter

การเกิดกรณี Identification

การพิจารณา Model identification จะมีอยู่ 3 กรณี ดังนี้

1.under identification คือ กรณีที่ parameter ที่เป็นไปได้ น้อยกว่า parameter ที่เกิดขึ้นจริง (df<0)

2.just identification คือ กรณีที่ parameter ที่เป็นไปได้ เท่ากับ parameter ที่เกิดขึ้นจริง (df=0)

3.over identification คือ กรณีที่ parameter ที่เป็นไปได้ มากกว่า parameter ที่เกิดขึ้นจริง (df>0)

ดังนั้น สิ่งที่ควรเกิดขึ้นคือข้อ 3 over identification ก็คือ parameter ที่เป็นไปได้ ต้องมากกว่า parameter ที่เกิดขึ้นจริง

ชวนคิด "จากภาพตัวอย่าง เป็น model identification ในกรณีใด"

การป้องกันปัญหา Identification

จากปัญหาความกังวลว่าจะเกิด Under-identification ดังกล่าวข้างต้นแล้วนั้น แนวทาง วิธีการที่จะป้องกันไม่ให้เกิด ก็มีอยู่บ้าง ดังนี้

ใน 1 Latent ควรมีอย่างน้อย 3 Observed เพื่อไมให้เกิดกรณี under-identification
ทำการ Mark variable เรียกว่า Marker variable หรือ Reference variable คือการไปกำหนดค่า (FIX) ให้ค่าน้ำหนักของ Observed 1 ตัวมีค่าเป็น 1.00 ก็จะทำให้ parameter นั้นลดลงไป ไม่นำไปคำนวณด้วย เป็นการรักษาให้มี parameter เพียงพอ

ดังนั้น หากใน 1 Latent มีจำนวน Observed ต่างกัน จะเกิดดังนี้

ถ้าใน 1 Latent มี 2 Observed จะทำให้เกิดกรณี Under-identification **ถ้า 2 Latent โดยมี Latent ละ 2 Observed จะยังถือว่าทำงานได้
ถ้าใน 1 Latent มี 3 Observed จะทำให้เกิดกรณี Just-identification
ถ้าใน 1 Latent มี 4 Observed จะทำให้เกิดกรณี Over-identification

**สรุปคือ ใน 1 Latent ควรมีอย่างน้อย 2 Observed แต่ต้องมี 2 Latent ขึ้นไป

ไม่งั้นจะเกิดกรณี Under-identification ได้**

ในการทำงานจริงแต่ละโปรแกรมจะบังคับให้ทำการ Mark variable ไว้เสมอ เพื่อป้องกันการเกิดปัญหกาที่ว่านี้ ดังนั้น หากทำ CFA หรือวิเคราะห์ Path Analysis แล้วค่า df=0 โปรแกรมจะไม่ออกค่าโมเดลฟิตต่างๆ ให้ หรือออกให้เป็น 0 เป็น 1 ซึ่งแปลความไม่ได้

**ในโปรแกรม AMOS กับ Mplus จะบังคับให้ต้องมีการกำหนดค่านี้ โดยที่ Mplus จะทำให้เลย แต่ AMOS ต้องไปใส่ค่าไว้ หากไม่ได้ใส่ไว้จะ error และโปรแกรมจะไม่บอกว่า error เรื่องอะไร เราต้องรู้เอง ในขณะที่ lisrel ไม่ได้บังคับว่าต้องใส่ แต่เท่าที่ทำมาแม้ว่าจะไม่ใส่ผลก็คือไม่ออกค่า SE , t อยู่ดี**

ดูเพิ่มเติมที่ช่อง youtube SmartResearchThai channel เรื่อง Reference Variable

https://youtu.be/KbirszWKaWE

สรุป

เรื่อง Identification เป็นเรื่องที่เข้าใจได้ไม่ยาก แต่ออกจะสับสน งง บ้างเล็กน้อย เนื่องจากเวลาทำงานจริงมักจะลืมขั้นตอนในการคำนวณ parameter ที่เป็นไปได้ แต่ลงมือสร้างโมเดลแล้ววิเคราะห์ผลเลย หรือ ในบางกรณีเมื่อทำการวิเคราะห์แล้ว ทำไมค่าโมเดลฟิตจึงไม่ปรากฏ ก็เนื่องจากเป็นกรณี just-identification จึงเกิดข้อสงสัย

ดังนั้นแล้ว ข้อจำง่ายๆ ในเรื่องนี้ก็คือ ถ้าทำ CFA ใน 1 Latent ควรมีอย่างน้อย 4 Observed เพื่อให้เป็นกรณี over-identification ไปเลย แต่ถ้าในโมเดลที่เราทดสอบนั้นมีหลาย Latent อยู่แล้ว ก็มักจะไม่พบปัญหานี้ จนกว่าจะทำการปรับโมเดลไปเรื่อยๆ จน df = 0

ในขณะเดียวกัน ปัญหานี้จะเกิดขึ้นกับการวิเคราะห์แบบ Path Analysis (ไม่ใช่ Full SEM) เนื่องจากหลายครั้งการวิเคราะห์แบบ Path Analysis จะทำการชี้พยากรณ์ทุกเส้นทางที่มีในโมเดล และเมื่อทำเช่นนั้น ค่า df จะเท่ากับ 0 ทันที เพราะโอกาสที่ parameter จะเกิดขึ้นได้นั้น ถูกนำมาชี้พยากรณ์หมดแล้ว ผลลัพธ์คือค่าโมเดลจะไม่ออก หรือออกเป็น 0 เป็น 1 ซึ่งแปลความไม่ได้

อ้างอิง:

2005. Rex B Kilne. Structural Equation Modeling. The Guilford Press. Second edition. p.170.

สนใจเรียน CFA SEM สามารถสอบถามรายละเอียดได้ในทุกช่องทาง หรือดูรายละเอียดการสอนได้ที่

https://www.smartresearchthai.com/tutor

ร่วมติดตามได้ทุกช่องทาง

follow or subscribe in any channel

tel.086-555-5949

line: @SmartResearchThai

email: contact@SmartResearchThai.com

www.SmartResearchThai.com

Blockdit: SmartResearchThai

Youtube: SmartResearchThai