התפלגות פארטו

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש
התפלגות פארטו סוג I
פונקציית צפיפות ההסתברות
px
px
פונקציית ההסתברות המצטברת
px
px
מאפיינים
פרמטרים xm>0 (ממשי)
α>0 (ממשי)
תומך x[xm,)
פונקציית צפיפות הסתברות
(pdf)
αxmαxα+1
פונקציית ההסתברות המצטברת
(cdf)
1(xmx)α
תוחלת {for α1αxmα1for α>1
חציון xm2α
ערך שכיח xm
שונות {for α2xm2α(α1)2(α2)for α>2
אנטרופיה log((xmα)e1+1α)
צידוד 2(1+α)α3α2α for α>3
גבנוניות 6(α3+α26α2)α(α3)(α4) for α>4

התפלגות פארטו, הנקראת על שם המהנדס האזרחי, הכלכלן והסוציולוג האיטלקי וילפרדו פארטו,[1] היא התפלגות הסתברות המשמשת לתיאור של תופעות מתחומים מגוונים: חברתיות, בקרת איכות, מדעיות, גיאופיזיות, אקטואריות ועוד. העיקרון, שיושם במקור לתיאור של חלוקת העושר בחברה, מתאים לתופעה לפיה חלק גדול מהעושר מוחזק על ידי חלק קטן מהאוכלוסייה.[2][3] עקרון פארטו או "כלל 80-20", הקובע ש-80% מהתוצאות נובעות מ-20% מהסיבות, נקרא על שם פארטו, אך רק התפלגויות פארטו עם פרמטר צורה α שערכו log451.16 ישקפו במדויק את עיקרון פארטו. תצפיות אמפיריות הראו שהתפלגות 80-20 זו מתאימה למגוון רחב של תופעות טבע[4] והתנהגות אנושיות.[5][6]

הגדרות

אם X הוא משתנה מקרי עם התפלגות פארטו (סוג I),[7] אזי ההסתברות ש- X גדול ממספר כלשהו x, כלומר, פונקציית ההישרדות (נקראת גם פונקציית זנב), נתונה על ידי

F(x)=Pr(X>x)={(xmx)αxxm,1x<xm,

כאשר xm הוא הערך המינימלי האפשרי (חיובי בהכרח) של X, ו- α הוא פרמטר חיובי. התפלגות פארטו מסוג I מאופיינת בפרמטר קנה-המידה xm ובפרמטר צורה α, הידוע כמדד הזנב. אם התפלגות זו משמשת למודל של התפלגות העושר, אז הפרמטר α נקרא אינדקס פארטו(אנ').

פונקציית התפלגות מצטברת

מההגדרה, פונקציית ההתפלגות המצטברת של משתנה מקרי שמתפלג פארטו עם הפרמטרים α ו- xm היא

FX(x)={1(xmx)αxxm,0x<xm.

פונקציית צפיפות הסתברות

על ידי גזירה מקבלים שפונקציית צפיפות ההסתברות היא

fX(x)={αxmαxα+1xxm,0x<xm.

כאשר מציירים את ההתפלגות על צירים ליניאריים, ההתפלגות מתוארת על ידי עקומה בצורת האות J, ששואפת אסימפטוטית לשני הצירים. כל מקטעי העקומה דומים לעצמם (עם פרמטרי קנה מידה מתאימים). כאשר משרטטים בדיאגרמה שבה שני הצירים מכויילים לוגריתמית, ההתפלגות מיוצגת על ידי קו ישר.

מאפיינים

מומנטים ופונקציה אופיינית

E(X)={α1,αxmα1α>1.
Var(X)={α(1,2],(xmα1)2αα2α>2.
(עבור α ≤ 1, השונות אינה מוגדרת)
μn={αn,αxmnαnα>n.
M(t;α,xm)=E[etX]=α(xmt)αΓ(α,xmt)
M(0,α,xm)=1.

היות שהתוחלת אינה מתכנסת בקטע הפתוח המכיל את t=0 אנו אומרים שהפונקציה היוצרת אינה מוגדרת.

φ(t;α,xm)=α(ixmt)αΓ(α,ixmt),
כאשרΓ(a,x) היא פונקציית גמא הלא שלמה.

ניתן לחלץ את הפרמטרים באמצעות שיטת המומנטים.[8]

התפלגויות מותנות

התפלגות ההסתברות המותנית של משתנה מקרי המתפלג פארטו, בהינתן המאורע שערכו של המשתנה המקרי גדול או שווה למספר מסוים x1, שגדול מ xm, היא התפלגות פארטו עם אותו אינדקס פארטו α אך עם מינימום x1 בִּמקוֹם xm:

Pr(Xx|Xx1)={(x1x)αxx1,1x<x1.

הביטוי מרמז כל כך שהערך התוחלת המותנית (אם היא סופית, כלומר α>1 ) פרופורציוני ל-x1 :

E(X|Xx1)x1

במקרה של משתנים אקראיים המתארים את משך חייו של אובייקט, המשמעות היא שתוחלת החיים היא פרופורציונלית לגיל, והיא נקראת אפקט לינדי(אנ') או חוק לינדי.[9]

משפט אפיון

נניח כי X1,X2,X3, הם משתנים מקריים בלתי תלויים אשר התפלגות ההסתברות שלהם נתמכת בקטע [xm,) עבור xm>0 כלשהו. נניח שלכל n, שני המשתנים האקראיים min{X1,,Xn} ו (X1++Xn)/min{X1,,Xn} הם בלתי תלויים. אז ההתפלגות המשותפת היא התפלגות פארטו.

ממוצע גאומטרי

הממוצע הגאומטרי (G) הוא[10]

G=xmexp(1α).

ממוצע הרמוני

הממוצע ההרמוני ( H ) הוא[10]

H=xm(1+1α).

ייצוג גרפי

התפלגות ה'זנב הארוך' המעוקל האופיינית, כשהיא משורטטת בסקאלה ליניארית, אינה מגלה את הפשטות הבסיסית של הפונקציה. כשהיא משורטטת על מערכת צירים בסקאלה לוגריתמית-לוגריתמית, היא מתוארת כקו ישר עם שיפוע שלילי, כפי שניתן לראות מהנוסחה עבור פונקציית צפיפות ההסתברות עבור xx m

logfX(x)=log(αxmαxα+1)=log(αxmα)(α+1)logx.

מכיוון ש- α חיובי, השיפוע (α+1) הוא שלילי.

הסקה סטטיסטית

הערכת פרמטרים

פונקציית הנראות של פרמטרי התפלגות פארטו α ו- xm, בהינתן מדגם בלתי תלוי x = (x1x2 , ..., xn), הוא

L(α,xm)=i=1nαxmαxiα+1=αnxmnαi=1n1xiα+1.

לכן, הלוגריתם הטבעי של פונקציית הנראות הוא

(α,xm)=nlnα+nαlnxm(α+1)i=1nlnxi.

אפשר לראות כי (α,xm) עולה מונוטונית עם xm, כלומר ככל שהערך של xm גדל, כך גדל הערך של פונקציית הנראות. לפיכך, מכיוון ש- xxm, אנו מסיקים כי

x^m=minixi.

כדי למצוא את המשערך של α, מחשבים את הנגזרת החלקית המתאימה ומוצאים את הערך שבו היא מתאפסת:

α=nα+nlnxmi=1nlnxi=0.

לפיכך משערך הנראות המרבית ל α הוא:

α^=niln(xi/x^m).

השגיאה הסטטיסטית הצפויה היא:[11]

σ=α^n.

דוגמאות ומקרים פרטיים

כללי

וילפרדו פארטו השתמש במקור בהתפלגות זו כדי לתאר את הקצאת העושר בין יחידים, כיוון שנראה היה שהיא מתארת היטב את האופן שבו בחברות שונות חלק גדול של העושר נמצא בבעלות אחוז קטן של האנשים. הוא גם השתמש בהתפלגות זו כדי לתאר את חלוקת ההכנסה.[3] רעיון זה מתבטא לפעמים בצורה פשוטה יותר כעקרון פארטו או "כלל 80-20", שאומר ש-20% מהאוכלוסייה שולטת ב-80% מהעושר.[12]

התפלגות זו אינה מוגבלת לתיאור עושר או הכנסה. הדוגמאות הבאות נתפסות לפעמים כבעלות התפלגות פארטו בקירוב:

  • ארבעת המשתנים של מגבלת התקציב של משק הבית: צריכה, הכנסת עבודה, הכנסת הון ועושר.[13]
  • הגדלים של יישובים אנושיים (מעט ערים, כפרים/כפרים רבים)[14][15]
  • התפלגות גודלי קבצים בתעבורת אינטרנט המשתמשת בפרוטוקול TCP ( קבצים קטנים רבים, קבצים גדולים מעטים)[14]
התאמת התפלגות פארטו מצטברת לכמות גשמים מקסימלית של יום אחד
  • עתודות הנפט בשדות נפט[14]
  • תשואות של מניות בודדות[14]
  • גדלים של חלקיקי חול[14]
  • גדלים של מטאוריטים[16]
  • בהידרולוגיה, התפלגות הפארטו מיושמת על אירועי קיצון כמו כמות גשמים מקסימלית מדי שנה של יום אחד וספיקה של נהרות.[17] התמונה הכחולה ממחישה דוגמה להתאמת התפלגות פארטו לכמות גשמים מקסימלית שנתית מדורגת של יום אחד, המציגה גם את רווח בר סמך של 90% בהתבסס על ההתפלגות הבינומית. נתוני הגשמים מיוצגים על ידי התווית מיקומים כחלק מניתוח התדירות המצטבר.

הקשר לחוק זיף

התפלגות פארטו היא התפלגות הסתברות רציפה. חוק זיף הוא התפלגות בדידה, המפרידה בין הערכים לדירוג פשוט(אנ'). שניהם הם חוקי חזקות פשוטים עם מעריך שלילי, מנורמלים כך שההתפלגות המצטברת שלהם שווה ל-1. ניתן לגזור את חוק זיף מהתפלגות פארטו אם ערכי x ערכים (ההכנסות) מחולקים ל N דליים(אנ'), כך שמספר האנשים בכל דלי מתנהג כהופכי של הדירוג שלו. ההתפלגות מנורמלת על ידי ההגדרה של xm כך שיתקיים αxmα=1H(N,α1), כאשר H(N,α1) הוא המספר ההרמוני המוכלל. כך, פונקציית צפיפות ההסתברות של זיף מהווה מקרה פרטי של התפלגות פארטו:

f(x)=αxmαxα+1=1xsH(N,s)

כאשר s=α1, N הוא מדרגת ההכנסה הגבוהה ביותר ו-x הוא מספר שלם המייצג דירוג מ-1 עד N. אז לאדם שנבחר באקראי (או מילה, קישור לאתר או עיר) מאוכלוסייה (או שפה, אינטרנט או מדינה) יש הסתברות f(x) לדירוג x .

קשר ל"עקרון פארטו"

חוק "80–20", לפיו 20% מכלל האנשים מקבלים 80% מכלל ההכנסה, ו-20% מ-20% האמידים ביותר מקבלים 80% מאותם 80%, וכן הלאה, מתקיים כאשר מדד פארטו הוא α=log45=log105log1041.161 . תוצאה זו יכולה להיגזר מנוסחת עקומת לורנץ. יתר על כן, הוכח כי הטענות הבאות שקולות מתמטית[18]:

  • ההכנסה מחולקת לפי התפלגות פארטו עם מדד α > 1.
  • קיים מספר 12p0 כך שחלק יחסי p מכלל האנשים מקבלים חלק יחסי 1p מההכנסה., ובאופן דומה עבור כל מספר ממשי 0<n (לא בהכרח מספר שלם) חלק יחסי pn של כלל האנשים יקבל חלק יחסי (1p)n מכלל ההכנסה. α ו- p קשורים ב-
11α=ln(1p)ln(p)=ln((1p)n)ln(pn) .

התפלגויות פארטו, שעבורן 0 < α ≤ 1 אשר, כפי שצוין לעיל, יש להן עתוחלת אינסופית, אינן יכולות לשמש כמודל סביר להתפלגות של הכנסה.

ראו גם

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא התפלגות פארטו בוויקישיתוף   המזהה לא מולא ולא נמצא בוויקינתונים, נא למלא את הפרמטר.

הערות שוליים

  1. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  2. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  3. ^ 1 2 Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H.
  4. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  5. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  6. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  7. ^ בתהליכי בנייה "תבנית:Cite book"
  8. ^ S. Hussain, S.H. Bhatti (2018).
  9. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  10. ^ 1 2 Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1.
  11. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  12. ^ For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  13. ^ בתהליכי בנייה "תבנית:Cite web"
  14. ^ 1 2 3 4 5 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  15. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  16. ^ Alberto S Betzler, Ernesto P Borges, Mass distributions of meteorites, Monthly Notices of the Royal Astronomical Society, 493, 2020, עמ' 4058–4064
  17. ^ CumFreq, software for cumulative frequency analysis and probability distribution fitting
  18. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).