לוג'יט

מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף Logit)
קפיצה לניווט קפיצה לחיפוש
גרף של logit(p) בטווח 0 עד 1, כאשר בסיס הלוגריתם הוא e.

בסטטיסטיקה, לוג'יט או Logit היא פונקציית שברון הקשורה להתפלגות לוגיסטית סטנדרטית. יש לה שימושים רבים בניתוח מידע ולמידת מכונה, ובפרט בטרנספורמציות נתונים.

מבחינה מתמטית, הלוג'יט הוא היפוך של הפונקציה הלוגיסטית הסטנדרטית σ(x)=1/(1+ex), כך שהלוגיט מוגדר כ

logit(p)=σ1(p)=ln(p1p)forp(0,1) .

בגלל זה, הלוג'יט נקרא גם הלוג של הסיכויים (log-odds) מכיוון שהוא שווה ללוגריתם של יחס הסיכויים p1p כאשר p הוא הסתברות.[1] לפיכך, הלוג'יט הוא סוג של פונקציה שממפה ערכי הסתברות מהמרחב (0,1) למספרים ממשיים במרחב (,+),[2] בדומה לפונקציית פרוביט.

הגדרה

אם p הוא הסתברות, אז p/(1 − p) הוא הסיכוי המתאים; לוג'יט של ההסתברות הוא הלוגריתם של הסיכויים, כלומר:

logit(p)=ln(p1p)=ln(p)ln(1p)=ln(1p1).

לבסיס של פונקציית הלוגריתם בשימוש חשיבות מועטה במאמר הנוכחי, כל עוד הוא גדול מ-1, אך הלוגריתם הטבעי עם בסיס e הוא הלוגריתם הנפוץ ביותר. בחירת הבסיס מתאימה לבחירת היחידה הלוגריתמית עבור הערך: בסיס 2 מתאים ל"shannon", בסיס e ל"nat", ובסיס 10 לhartley; יחידות אלו משמשות במיוחד בפירושים תאורטיים של מידע. עבור כל בחירה של בסיס, פונקציית לוג'יט לוקחת ערכים בין אינסוף שלילי לחיובי.

הפונקציה ה"לוגיסטית" של כל מספר α ניתן על ידי היפוך-לוג'יט:

logit1(α)=logistic(α)=11+exp(α)=exp(α)exp(α)+1

ההבדל בין לוג'יט של שתי הסתברויות הוא הלוגריתם של יחס הסיכויים (R), ובכך מספק קיצור לכתיבת הקומבינציה הנכונה של יחסי סיכויים רק על ידי חיבור והפחתה:

ln(R)=ln(p1/(1p1)p2/(1p2))=ln(p11p1)ln(p21p2)=logit(p1)logit(p2).

היסטוריה

היו מספר מאמצים להתאים שיטות רגרסיה ליניאריות לתחום שבו הפלט הוא ערך הסתברות (0,1), במקום כל מספר ממשי (,+) . במקרים רבים, מאמצים כאלה התמקדו במודלים של בעיה זו על ידי מיפוי הטווח (0,1) ל (,+) ולאחר מכן הפעלת הרגרסיה הליניארית על הערכים שעברו טרנספורמציה אלו. בשנת 1934 השתמש צ'סטר איטנר בליס בפונקציית ההתפלגות הנורמלית המצטברת כדי לבצע מיפוי זה וכינה את המודל שלו probit (קיצור של "probability unit").[3] עם זאת, זה יקר יותר מבחינה חישובית. ב-1944, ג'וזף ברקסון השתמש ביומן הסיכויים וקרא לפונקציה הזו logit, קיצור של "logistic unit" בעקבות האנלוגיה של probit. צ'ארלס סנדרס פרס (סוף המאה ה-19) השתמש בהרחבה בלוגריתם הסיכויים.[4] GA Barnard בשנת 1949 טבע את המונח הנפוץ "log-odds";[5] לוגריתם הסיכויים של אירוע הוא הלוג'יט של ההסתברות לאירוע.[6]

השוואה עם פרוביט

השוואה של פונקציית הלוג'יט עם פרוביט בקנה מידה (כלומר ה-CDF ההפוך של ההתפלגות הנורמלית ), השוואה logit(x) לעומת. Φ1(x)π/8, מה שהופך את השיפועים להיות זהים במקור ה-y

קשורים קשר הדוק לפונקציית logit (ולמודל ה-logit) הם פונקציית probit ומודל probit. logit probit הן שתיהן פונקציות סיגמואידיות עם תחום בין 0 ל-1, מה שהופך את שתיהן לפונקציות קוונטיליות - כלומר, הפכים לפונקציית ההתפלגות המצטברת (CDF) של התפלגות הסתברות. למעשה, לוג'יט הוא הפונקציה הקוונטילית של ההתפלגות הלוגיסטית, בעוד probit היא הפונקציה הכמותית של ההתפלגות הנורמלית. הפונקציה probit Φ1(x), איפה Φ(x) היא ה-CDF של ההתפלגות הנורמלית, כאמור:

Φ(x)=12πxey22dy.

כפי שמוצג בגרף בצד ימין, הלוג'יט והפרוביט דומות מאוד כאשר פרוביט בקנה מידה, כך שהשיפוע שלה ב- y = 0 תואם את שיפוע ה- logit . כתוצאה מכך, מודלים של פרוביט משמשים לפעמים במקום מודלים של לוגיט, כי עבור יישומים מסוימים (למשל, בסטטיסטיקה בייסיאנית) היישום קל יותר.

לקריאה נוספת

  • בתהליכי בנייה "תבנית:Cite book"

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא לוג'יט בוויקישיתוף   המזהה לא מולא ולא נמצא בוויקינתונים, נא למלא את הפרמטר.

הערות שוליים

  1. ^ בתהליכי בנייה "תבנית:Cite web"
  2. ^ בתהליכי בנייה "תבנית:Cite web"
  3. ^ בתהליכי בנייה "תבנית:Cite web"
  4. ^ בתהליכי בנייה "תבנית:Cite book"
  5. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value)..
  6. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value)..