לוג'יט

מתוך testwiki
גרסה מ־04:56, 12 באוקטובר 2022 מאת imported>KotzBot (הוספת שורת קישורים חיצוניים ותחתיה {{תב|ויקישיתוף בשורה}} במידה וחסר (תג))
(הבדל) → הגרסה הקודמת | הגרסה האחרונה (הבדל) | הגרסה הבאה ← (הבדל)
קפיצה לניווט קפיצה לחיפוש
גרף של logit(p) בטווח 0 עד 1, כאשר בסיס הלוגריתם הוא e.

בסטטיסטיקה, לוג'יט או Logit היא פונקציית שברון הקשורה להתפלגות לוגיסטית סטנדרטית. יש לה שימושים רבים בניתוח מידע ולמידת מכונה, ובפרט בטרנספורמציות נתונים.

מבחינה מתמטית, הלוג'יט הוא היפוך של הפונקציה הלוגיסטית הסטנדרטית σ(x)=1/(1+ex), כך שהלוגיט מוגדר כ

logit(p)=σ1(p)=ln(p1p)forp(0,1) .

בגלל זה, הלוג'יט נקרא גם הלוג של הסיכויים (log-odds) מכיוון שהוא שווה ללוגריתם של יחס הסיכויים p1p כאשר תבנית:Mvar הוא הסתברות.[1] לפיכך, הלוג'יט הוא סוג של פונקציה שממפה ערכי הסתברות מהמרחב (0,1) למספרים ממשיים במרחב (,+),[2] בדומה לפונקציית פרוביט.

הגדרה

אם תבנית:Mvar הוא הסתברות, אז תבנית:נוסחה הוא הסיכוי המתאים; לוג'יט של ההסתברות הוא הלוגריתם של הסיכויים, כלומר:

logit(p)=ln(p1p)=ln(p)ln(1p)=ln(1p1).

לבסיס של פונקציית הלוגריתם בשימוש חשיבות מועטה במאמר הנוכחי, כל עוד הוא גדול מ-1, אך הלוגריתם הטבעי עם בסיס e הוא הלוגריתם הנפוץ ביותר. בחירת הבסיס מתאימה לבחירת היחידה הלוגריתמית עבור הערך: בסיס 2 מתאים ל"shannon", בסיס תבנית:Mvar ל"nat", ובסיס 10 לhartley; יחידות אלו משמשות במיוחד בפירושים תאורטיים של מידע. עבור כל בחירה של בסיס, פונקציית לוג'יט לוקחת ערכים בין אינסוף שלילי לחיובי.

הפונקציה ה"לוגיסטית" של כל מספר α ניתן על ידי היפוך-לוג'יט:

logit1(α)=logistic(α)=11+exp(α)=exp(α)exp(α)+1

ההבדל בין לוג'יט של שתי הסתברויות הוא הלוגריתם של יחס הסיכויים (תבנית:Mvar), ובכך מספק קיצור לכתיבת הקומבינציה הנכונה של יחסי סיכויים רק על ידי חיבור והפחתה:

ln(R)=ln(p1/(1p1)p2/(1p2))=ln(p11p1)ln(p21p2)=logit(p1)logit(p2).

היסטוריה

היו מספר מאמצים להתאים שיטות רגרסיה ליניאריות לתחום שבו הפלט הוא ערך הסתברות (0,1), במקום כל מספר ממשי (,+) . במקרים רבים, מאמצים כאלה התמקדו במודלים של בעיה זו על ידי מיפוי הטווח (0,1) ל (,+) ולאחר מכן הפעלת הרגרסיה הליניארית על הערכים שעברו טרנספורמציה אלו. בשנת 1934 השתמש צ'סטר איטנר בליס בפונקציית ההתפלגות הנורמלית המצטברת כדי לבצע מיפוי זה וכינה את המודל שלו probit (קיצור של "probability unit").[3] עם זאת, זה יקר יותר מבחינה חישובית. ב-1944, ג'וזף ברקסון השתמש ביומן הסיכויים וקרא לפונקציה הזו logit, קיצור של "logistic unit" בעקבות האנלוגיה של probit. צ'ארלס סנדרס פרס (סוף המאה ה-19) השתמש בהרחבה בלוגריתם הסיכויים.[4] GA Barnard בשנת 1949 טבע את המונח הנפוץ "log-odds";[5] לוגריתם הסיכויים של אירוע הוא הלוג'יט של ההסתברות לאירוע.[6]

השוואה עם פרוביט

השוואה של פונקציית הלוג'יט עם פרוביט בקנה מידה (כלומר ה-CDF ההפוך של ההתפלגות הנורמלית ), השוואה logit(x) לעומת. Φ1(x)π/8, מה שהופך את השיפועים להיות זהים במקור ה-תבנית:Mvar

קשורים קשר הדוק לפונקציית תבנית:נוסחה (ולמודל ה-logit) הם פונקציית probit ומודל probit. תבנית:נוסחה תבנית:נוסחה הן שתיהן פונקציות סיגמואידיות עם תחום בין 0 ל-1, מה שהופך את שתיהן לפונקציות קוונטיליות - כלומר, הפכים לפונקציית ההתפלגות המצטברת (CDF) של התפלגות הסתברות. למעשה, לוג'יט הוא הפונקציה הקוונטילית של ההתפלגות הלוגיסטית, בעוד תבנית:נוסחה היא הפונקציה הכמותית של ההתפלגות הנורמלית. הפונקציה תבנית:נוסחה Φ1(x), איפה Φ(x) היא ה-CDF של ההתפלגות הנורמלית, כאמור:

Φ(x)=12πxey22dy.

כפי שמוצג בגרף בצד ימין, הלוג'יט והפרוביט דומות מאוד כאשר פרוביט בקנה מידה, כך שהשיפוע שלה ב- תבנית:נוסחה תואם את שיפוע ה- תבנית:נוסחה . כתוצאה מכך, מודלים של פרוביט משמשים לפעמים במקום מודלים של לוגיט, כי עבור יישומים מסוימים (למשל, בסטטיסטיקה בייסיאנית) היישום קל יותר.

לקריאה נוספת

קישורים חיצוניים

תבנית:ויקישיתוף בשורה

הערות שוליים

תבנית:הערות שוליים