และค่าอื่นๆ ก็แสดงค่าอิทธิพลของแต่ละปัจจัย ตรงนี้จะนำ Odds Ratio มาช่วยในการแปรผล เช่น tumor size มีค่า Odds Ratio = 1.240 ก็แปลความว่า tumor size นั้นจะโตขึ้นตามการลุกลามที่เพิ่มขึ้นในแต่ละปีประมาณ 1.2 เท่า แบบนี้เป็นต้น
วันนี้จะมาเล่าเกี่ยวกับ Ordinal/ Ordered Logistic Regression กัน ติดตามกันได้เลย
เกริ่นเบื้องต้นก่อน ว่า กลุ่มการวิเคราะห์ Regression นั้น ล้วนแล้วแต่มีจุดมุ่งหมายเพื่อพยากรณ์หรือทำนายกันทั้งนั้น ไม่ว่าจะเป็น Linear, Logistic, Multinomial Ordinal ซึ่งก็ยังมี Poisson อีก ถือว่าเป็น กลุ่มสถิติหลักที่ใช้ในการพยากรณ์เลยทีเดียว
ในเว็บของเราเองก็เคยเล่าถึง Linear Regression ไว้หลายบทความด้วยกัน ตัวอย่างเช่น
สำหรับในวันนี้จะขอพูดถึงตัว Ordinal/ Ordered Logistic Regression กันสักหน่อยครับ ตัว Logistic เนี่ยจุดสำคัญก็คือตัวแปรตามเป็นช้อย ซึ่งก็แบ่งเป็น 3 แบบย่อยได้แก่ Binary, Multinomial และ Ordered สามารถแปลได้ตามตัวเลยก็คือ Binary จะมี 2 ช้อย ส่วน Multinomial จะมี 3 =ช้อยขึ้นไป ส่วน Ordered จะเป็นแบบอันดับ ซึ่งเรียกได้ทั้ง Ordered และ Ordinal Regression
หลักกการพื้นฐานของ Ordinal/ Ordered Regression คือ
ผลของ Ordered จะมี Threshold เข้ามาเป็นตัวบอกว่า ในแต่ละระดับที่สูงขึ้นไปนั้น ส่งผลให้เกิดหรือไม่ ตัวอย่างเช่น ระดับความเครียด สมมติว่า มีอยู่ 3 ระดับ คือ เครียดน้อย เครียดปานกลาง เครียดมาก ผลของ threshold จะออกมา 2 ตัว คือบอกว่า ระหว่าง ความเครียดน้อย ไปสู่ ความเครียดปานกลาง นั้น "มีนัยหรือไม่" และอีกตัวคือจากความเครียดปานกลาง ไปสู่ ความเครียดมาก "มีนัยหรือไม่" หากผลออกมาว่าทั้ง 2 threshold นั้น มีนัยสำคัญก็แปลว่าปัจจัยต่างๆที่นำเข้ามานั้น (ตัวแปรอิสระ) มีผลทำให้ระดับความเครียดที่เริ่มจากเครียดน้อยนั้น มีผลต่อระดับความเครียดจริง และมีผลในทุกระดับที่เพิ่มขึ้น
และส่วนตัวแปรอิสระ ก็แปลผลตามหลัก regression ปกติได้เลยครับ
ลองดูภาพผลตัวอย่างประกอบนะครับ จะเห็นว่ามีข้อมูลจาก threshold อยู่ นั่นล่ะ คือส่วนสำคัญของ Ordered Regression
ทีนี้ลองดูงานวิจัยบ้างว่ามีงานไหนที่นำ Ordered Regression นี้มาใช้
งานวิจัยของ มนต์ธิดา อวยพร และคณะ [1] ทำการศึกษาเรื่อง "การค้นหาปัจจัยทำนายการเกิดการลุกลามของโรคมะเร็งเต้านม: ทะเบียนข้อมูลโรคมะเร็ง สถาบันมะเร็งแห่งชาติ" เป็นการศึกษาแบบ Retrospect Cohort คือทำการศึกษาของผลที่เกิดขึ้นมาแล้ว ในปี 2547 มาดูว่าอะไรเป็นปัจจัยที่ทำให้เกิดโรค โดยตัวแปรตามการลุกลามตั้งแต่ระยะเริ่มจนลุกลามปีที่ 1 2 และ 3 ตามลำดับ
ผลพบว่า 1) vascular invasion, 2) estrogen receptor, 3) lymphatic invasion, 4)histologic grade III, 5) tumor size, 6) radiation therapy, และ 7) hormonal therapy เป็นปัจจัยที่ทำให้เกิดการลุกลาม ลองดูผลที่ภาพ
จากตารางที่ 4 ในบทความ แสดงผลลัพธ์ของการวิเคราะห์ด้วย Ordinal/ Ordered Logistic Regression โดยจะเห็นว่ามีตัวแปร Intercept อยู่ 3 ตัว (ในบางโปรแกรมจะใช้คำว่า threshold) เนื่องจากมี 4 ช้อย (ขึ้นกับตัวแปรตามว่ามีกี่ช้อย แสดงผลเป็น K-1 ช้อย) ตรงนี้ เป็นการบอกว่าการลุกลามในแต่ละปีที่เพิ่มขึ้นนั้น ปัจจัยเหล่านี้ทำให้เกิดความแตกต่างหรือความสัมพันธ์กันหรือไม่ (ลองย้อนกลับไปดูคำอธิบายด้านบน ตัวอย่างของความเครียดประกอบ) ก็คือ การลุกลามในแต่ละปีนั้น ลุกลามมากขึ้นๆ จนเห็นได้ชัด จนเกิดเป็นนัยสำคัญหรือไม่
และค่าอื่นๆ ก็แสดงค่าอิทธิพลของแต่ละปัจจัย ตรงนี้จะนำ Odds Ratio มาช่วยในการแปรผล เช่น tumor size มีค่า Odds Ratio = 1.240 ก็แปลความว่า tumor size นั้นจะโตขึ้นตามการลุกลามที่เพิ่มขึ้นในแต่ละปีประมาณ 1.2 เท่า แบบนี้เป็นต้น
ส่วนตัวคิดเห็นว่า Ordinal/ Ordered Logistic Regression นั้นมีความยาก เพราะถ้าศึกษาลงไปจริงๆ จะพบว่ายังมีรายละเอียดอีกมาก เช่น OLM, GOLOGIT, GOLOGIT2 คือเป็นการพิจารณาใช้ Ordered Logistic พื้นฐานหรือจะใช้เป็น Generalized Ordered Logistic ซึ่งว่ากันตรงๆ นั้นก็ไม่ง่าย
อ้างอิง
[1] มนต์ธิดา อวยพร และคณะ [1] ทำการศึกษาเรื่อง "การค้นหาปัจจัยทำนายการเกิดการลุกลามของโรคมะเร็งเต้านม: ทะเบียนข้อมูลโรคมะเร็ง สถาบันมะเร็งแห่งชาติ". วารสารสาธารณสุขศาสตร์ ปีที่ 39 ฉบับที่ 2 พฤษภาคม-สิงหาคม 2552. Retrived from: https://he02.tci-thaijo.org/index.php/jph/article/view/8326/7070
ร่วมติดตามได้ทุกช่องทาง
follow or subscribe in any channel
tel.086-555-5949
line: @SmartResearchThai
Blockdit: SmartResearchThai
Youtube: SmartResearchThai
Facebook: SmartResearchThai
Commentaires