"เป็นการตรวจสอบว่าโมเดลที่สร้างขึ้นมานั้น
มี Parameter เพียงพอต่อการคำนวณหรือไม่"
Outline:
ก่อนอื่น ต้องขอทวนกันก่อนว่า model identification นี้ อยู่ในเรื่องการสร้าง หรือพัฒนาโมเดล ไม่ว่าจะเป็นการทดสอบ Confirmatory Factor Analysis(CFA), Path Analysis, หรือ Structural Equation Modeling(SEM) ก็ตาม ล้วนแต่ต้องพิจารณาเรื่อง Model identification กันทั้งสิ้น แล้วเจ้า Model identification นั้น คืออะไร มาหาคำตอบกัน
Model Identification คืออะไร
"Model identification หรืออาจจะเรียกว่า ความเป็นไปได้ค่าเดียว" หมายถึง การคำนวณว่าโมเดลที่เราสร้างขึ้นมานั้นมี parameter เพียงพอต่อการคำนวณหรือไม่ ดังนั้น ก่อนจะทำการวิเคราะห์ใดๆ ก็ตาม ก็ควรมาพิจารณากันเสียก่อนว่าโมเดลที่เราสร้างขึ้นมานั้นมีหน้าตาอย่างไร (Model specification) และมีค่าพารามิเตอร์เพียงพอหรือไม่ (Model identification) ลองดูภาพตัวอย่างนี้ประกอบกัน
การพิจารณา model identification นั้น เราจะดูกัน 2 เรื่อง คือ parameter ของโมเดลที่สร้างขึ้นมานั้นมีกี่ parameter และ parameter ที่เป็นไปได้จากโมเดลที่เราสร้างนั้นมีกี่ parameter
การพิจารณา parameter ของโมเดลที่เราสร้างขึ้นมา
ลองดูจากภาพตัวอย่างด้านบนเป็นตัวอย่างการวิเคราะห์ CFA ที่มี 2 latent กับ 8 observed วิธีการนับง่ายๆ เลยก็คือ มีตัวแปร observed กี่ตัว ในทีนี้มี 8 ก็ให้เราคูณสองเข้าไปเป็น 16 และบวกกับอีก 2 latent รวมเป็น 18 parameter
กาารพิจารณา parameter ที่เป็นไปได้จากโมเดล
วิธีการคือในโมเดลมีจำนวน observed กี่ตัว ให้เราคำนวณตามสูตรนี้
p*(p+1) /2 … [p=number observed variable]
จากสูตรจะได้ว่า p=8 ดังนั้นเมื่อแทนค่าในสูตรแล้วจะได้ 36
ดังนั้นในโมเดลนี้ สามารถเกิด parameter ขึ้นได้ 36 parameter
การเกิดกรณี Identification
การพิจารณา Model identification จะมีอยู่ 3 กรณี ดังนี้
1.under identification คือ กรณีที่ parameter ที่เป็นไปได้ น้อยกว่า parameter ที่เกิดขึ้นจริง (df<0)
2.just identification คือ กรณีที่ parameter ที่เป็นไปได้ เท่ากับ parameter ที่เกิดขึ้นจริง (df=0)
3.over identification คือ กรณีที่ parameter ที่เป็นไปได้ มากกว่า parameter ที่เกิดขึ้นจริง (df>0)
ดังนั้น สิ่งที่ควรเกิดขึ้นคือข้อ 3 over identification ก็คือ parameter ที่เป็นไปได้ ต้องมากกว่า parameter ที่เกิดขึ้นจริง
ชวนคิด "จากภาพตัวอย่าง เป็น model identification ในกรณีใด"
การป้องกันปัญหา Identification
จากปัญหาความกังวลว่าจะเกิด Under-identification ดังกล่าวข้างต้นแล้วนั้น แนวทาง วิธีการที่จะป้องกันไม่ให้เกิด ก็มีอยู่บ้าง ดังนี้
ใน 1 Latent ควรมีอย่างน้อย 3 Observed เพื่อไมให้เกิดกรณี under-identification
ทำการ Mark variable เรียกว่า Marker variable หรือ Reference variable คือการไปกำหนดค่า (FIX) ให้ค่าน้ำหนักของ Observed 1 ตัวมีค่าเป็น 1.00 ก็จะทำให้ parameter นั้นลดลงไป ไม่นำไปคำนวณด้วย เป็นการรักษาให้มี parameter เพียงพอ
ดังนั้น หากใน 1 Latent มีจำนวน Observed ต่างกัน จะเกิดดังนี้
ถ้าใน 1 Latent มี 2 Observed จะทำให้เกิดกรณี Under-identification **ถ้า 2 Latent โดยมี Latent ละ 2 Observed จะยังถือว่าทำงานได้
ถ้าใน 1 Latent มี 3 Observed จะทำให้เกิดกรณี Just-identification
ถ้าใน 1 Latent มี 4 Observed จะทำให้เกิดกรณี Over-identification
**สรุปคือ ใน 1 Latent ควรมีอย่างน้อย 2 Observed แต่ต้องมี 2 Latent ขึ้นไป
ไม่งั้นจะเกิดกรณี Under-identification ได้**
ในการทำงานจริงแต่ละโปรแกรมจะบังคับให้ทำการ Mark variable ไว้เสมอ เพื่อป้องกันการเกิดปัญหกาที่ว่านี้ ดังนั้น หากทำ CFA หรือวิเคราะห์ Path Analysis แล้วค่า df=0 โปรแกรมจะไม่ออกค่าโมเดลฟิตต่างๆ ให้ หรือออกให้เป็น 0 เป็น 1 ซึ่งแปลความไม่ได้
**ในโปรแกรม AMOS กับ Mplus จะบังคับให้ต้องมีการกำหนดค่านี้ โดยที่ Mplus จะทำให้เลย แต่ AMOS ต้องไปใส่ค่าไว้ หากไม่ได้ใส่ไว้จะ error และโปรแกรมจะไม่บอกว่า error เรื่องอะไร เราต้องรู้เอง ในขณะที่ lisrel ไม่ได้บังคับว่าต้องใส่ แต่เท่าที่ทำมาแม้ว่าจะไม่ใส่ผลก็คือไม่ออกค่า SE , t อยู่ดี**
ดูเพิ่มเติมที่ช่อง youtube SmartResearchThai channel เรื่อง Reference Variable
สรุป
เรื่อง Identification เป็นเรื่องที่เข้าใจได้ไม่ยาก แต่ออกจะสับสน งง บ้างเล็กน้อย เนื่องจากเวลาทำงานจริงมักจะลืมขั้นตอนในการคำนวณ parameter ที่เป็นไปได้ แต่ลงมือสร้างโมเดลแล้ววิเคราะห์ผลเลย หรือ ในบางกรณีเมื่อทำการวิเคราะห์แล้ว ทำไมค่าโมเดลฟิตจึงไม่ปรากฏ ก็เนื่องจากเป็นกรณี just-identification จึงเกิดข้อสงสัย
ดังนั้นแล้ว ข้อจำง่ายๆ ในเรื่องนี้ก็คือ ถ้าทำ CFA ใน 1 Latent ควรมีอย่างน้อย 4 Observed เพื่อให้เป็นกรณี over-identification ไปเลย แต่ถ้าในโมเดลที่เราทดสอบนั้นมีหลาย Latent อยู่แล้ว ก็มักจะไม่พบปัญหานี้ จนกว่าจะทำการปรับโมเดลไปเรื่อยๆ จน df = 0
ในขณะเดียวกัน ปัญหานี้จะเกิดขึ้นกับการวิเคราะห์แบบ Path Analysis (ไม่ใช่ Full SEM) เนื่องจากหลายครั้งการวิเคราะห์แบบ Path Analysis จะทำการชี้พยากรณ์ทุกเส้นทางที่มีในโมเดล และเมื่อทำเช่นนั้น ค่า df จะเท่ากับ 0 ทันที เพราะโอกาสที่ parameter จะเกิดขึ้นได้นั้น ถูกนำมาชี้พยากรณ์หมดแล้ว ผลลัพธ์คือค่าโมเดลจะไม่ออก หรือออกเป็น 0 เป็น 1 ซึ่งแปลความไม่ได้
อ้างอิง:
2005. Rex B Kilne. Structural Equation Modeling. The Guilford Press. Second edition. p.170.
สนใจเรียน CFA SEM สามารถสอบถามรายละเอียดได้ในทุกช่องทาง หรือดูรายละเอียดการสอนได้ที่
ร่วมติดตามได้ทุกช่องทาง
follow or subscribe in any channel
.
tel.086-555-5949
line: @SmartResearchThai
Blockdit: SmartResearchThai
Youtube: SmartResearchThai
Facebook: SmartResearchThai
Comments