התפלגות פארטו

מתוך testwiki
קפיצה לניווט קפיצה לחיפוש

תבנית:נתוני התפלגות התפלגות פארטו, הנקראת על שם המהנדס האזרחי, הכלכלן והסוציולוג האיטלקי וילפרדו פארטו,[1] היא התפלגות הסתברות המשמשת לתיאור של תופעות מתחומים מגוונים: חברתיות, בקרת איכות, מדעיות, גיאופיזיות, אקטואריות ועוד. העיקרון, שיושם במקור לתיאור של חלוקת העושר בחברה, מתאים לתופעה לפיה חלק גדול מהעושר מוחזק על ידי חלק קטן מהאוכלוסייה.[2][3] עקרון פארטו או "כלל 80-20", הקובע ש-80% מהתוצאות נובעות מ-20% מהסיבות, נקרא על שם פארטו, אך רק התפלגויות פארטו עם פרמטר צורה תבנית:Math שערכו log451.16 ישקפו במדויק את עיקרון פארטו. תצפיות אמפיריות הראו שהתפלגות 80-20 זו מתאימה למגוון רחב של תופעות טבע[4] והתנהגות אנושיות.[5][6]

הגדרות

אם X הוא משתנה מקרי עם התפלגות פארטו (סוג I),[7] אזי ההסתברות ש- X גדול ממספר כלשהו x, כלומר, פונקציית ההישרדות (נקראת גם פונקציית זנב), נתונה על ידי

F(x)=Pr(X>x)={(xmx)αxxm,1x<xm,

כאשר xm הוא הערך המינימלי האפשרי (חיובי בהכרח) של X, ו- α הוא פרמטר חיובי. התפלגות פארטו מסוג I מאופיינת בפרמטר קנה-המידה xm ובפרמטר צורה α, הידוע כמדד הזנב. אם התפלגות זו משמשת למודל של התפלגות העושר, אז הפרמטר α נקרא אינדקס פארטותבנית:אנ.

פונקציית התפלגות מצטברת

מההגדרה, פונקציית ההתפלגות המצטברת של משתנה מקרי שמתפלג פארטו עם הפרמטרים α ו- xm היא

FX(x)={1(xmx)αxxm,0x<xm.

פונקציית צפיפות הסתברות

על ידי גזירה מקבלים שפונקציית צפיפות ההסתברות היא

fX(x)={αxmαxα+1xxm,0x<xm.

כאשר מציירים את ההתפלגות על צירים ליניאריים, ההתפלגות מתוארת על ידי עקומה בצורת האות J, ששואפת אסימפטוטית לשני הצירים. כל מקטעי העקומה דומים לעצמם (עם פרמטרי קנה מידה מתאימים). כאשר משרטטים בדיאגרמה שבה שני הצירים מכויילים לוגריתמית, ההתפלגות מיוצגת על ידי קו ישר.

מאפיינים

מומנטים ופונקציה אופיינית

E(X)={α1,αxmα1α>1.
Var(X)={α(1,2],(xmα1)2αα2α>2.
(עבור α ≤ 1, השונות אינה מוגדרת)
μn={αn,αxmnαnα>n.
M(t;α,xm)=E[etX]=α(xmt)αΓ(α,xmt)
M(0,α,xm)=1.

היות שהתוחלת אינה מתכנסת בקטע הפתוח המכיל את t=0 אנו אומרים שהפונקציה היוצרת אינה מוגדרת.

φ(t;α,xm)=α(ixmt)αΓ(α,ixmt),
כאשרΓ(a,x) היא פונקציית גמא הלא שלמה.

ניתן לחלץ את הפרמטרים באמצעות שיטת המומנטים.[8]

התפלגויות מותנות

התפלגות ההסתברות המותנית של משתנה מקרי המתפלג פארטו, בהינתן המאורע שערכו של המשתנה המקרי גדול או שווה למספר מסוים x1, שגדול מ xm, היא התפלגות פארטו עם אותו אינדקס פארטו α אך עם מינימום x1 בִּמקוֹם xm:

Pr(Xx|Xx1)={(x1x)αxx1,1x<x1.

הביטוי מרמז כל כך שהערך התוחלת המותנית (אם היא סופית, כלומר α>1 ) פרופורציוני ל-x1 :

E(X|Xx1)x1

במקרה של משתנים אקראיים המתארים את משך חייו של אובייקט, המשמעות היא שתוחלת החיים היא פרופורציונלית לגיל, והיא נקראת אפקט לינדיתבנית:אנ או חוק לינדי.[9]

משפט אפיון

נניח כי X1,X2,X3, הם משתנים מקריים בלתי תלויים אשר התפלגות ההסתברות שלהם נתמכת בקטע [xm,) עבור xm>0 כלשהו. נניח שלכל n, שני המשתנים האקראיים min{X1,,Xn} ו (X1++Xn)/min{X1,,Xn} הם בלתי תלויים. אז ההתפלגות המשותפת היא התפלגות פארטו.

ממוצע גאומטרי

הממוצע הגאומטרי (G) הוא[10]

G=xmexp(1α).

ממוצע הרמוני

הממוצע ההרמוני ( H ) הואתבנית:הערה

H=xm(1+1α).

ייצוג גרפי

התפלגות ה'זנב הארוך' המעוקל האופיינית, כשהיא משורטטת בסקאלה ליניארית, אינה מגלה את הפשטות הבסיסית של הפונקציה. כשהיא משורטטת על מערכת צירים בסקאלה לוגריתמית-לוגריתמית, היא מתוארת כקו ישר עם שיפוע שלילי, כפי שניתן לראות מהנוסחה עבור פונקציית צפיפות ההסתברות עבור xx m

logfX(x)=log(αxmαxα+1)=log(αxmα)(α+1)logx.

מכיוון ש- α חיובי, השיפוע (α+1) הוא שלילי.

הסקה סטטיסטית

הערכת פרמטרים

פונקציית הנראות של פרמטרי התפלגות פארטו α ו- xm, בהינתן מדגם בלתי תלוי x = (x1x2 , ..., xn), הוא

L(α,xm)=i=1nαxmαxiα+1=αnxmnαi=1n1xiα+1.

לכן, הלוגריתם הטבעי של פונקציית הנראות הוא

(α,xm)=nlnα+nαlnxm(α+1)i=1nlnxi.

אפשר לראות כי (α,xm) עולה מונוטונית עם xm, כלומר ככל שהערך של xm גדל, כך גדל הערך של פונקציית הנראות. לפיכך, מכיוון ש- xxm, אנו מסיקים כי

x^m=minixi.

כדי למצוא את המשערך של α, מחשבים את הנגזרת החלקית המתאימה ומוצאים את הערך שבו היא מתאפסת:

α=nα+nlnxmi=1nlnxi=0.

לפיכך משערך הנראות המרבית ל α הוא:

α^=niln(xi/x^m).

השגיאה הסטטיסטית הצפויה היא:[11]

σ=α^n.

דוגמאות ומקרים פרטיים

כללי

וילפרדו פארטו השתמש במקור בהתפלגות זו כדי לתאר את הקצאת העושר בין יחידים, כיוון שנראה היה שהיא מתארת היטב את האופן שבו בחברות שונות חלק גדול של העושר נמצא בבעלות אחוז קטן של האנשים. הוא גם השתמש בהתפלגות זו כדי לתאר את חלוקת ההכנסה.תבנית:הערה רעיון זה מתבטא לפעמים בצורה פשוטה יותר כעקרון פארטו או "כלל 80-20", שאומר ש-20% מהאוכלוסייה שולטת ב-80% מהעושר.[12]

התפלגות זו אינה מוגבלת לתיאור עושר או הכנסה. הדוגמאות הבאות נתפסות לפעמים כבעלות התפלגות פארטו בקירוב:

  • ארבעת המשתנים של מגבלת התקציב של משק הבית: צריכה, הכנסת עבודה, הכנסת הון ועושר.[13]
  • הגדלים של יישובים אנושיים (מעט ערים, כפרים/כפרים רבים)[14][15]
  • התפלגות גודלי קבצים בתעבורת אינטרנט המשתמשת בפרוטוקול TCP ( קבצים קטנים רבים, קבצים גדולים מעטים)[14]
התאמת התפלגות פארטו מצטברת לכמות גשמים מקסימלית של יום אחד
  • עתודות הנפט בשדות נפטתבנית:הערה
  • תשואות של מניות בודדות[14]
  • גדלים של חלקיקי חול[14]
  • גדלים של מטאוריטים[16]
  • בהידרולוגיה, התפלגות הפארטו מיושמת על אירועי קיצון כמו כמות גשמים מקסימלית מדי שנה של יום אחד וספיקה של נהרות.[17] התמונה הכחולה ממחישה דוגמה להתאמת התפלגות פארטו לכמות גשמים מקסימלית שנתית מדורגת של יום אחד, המציגה גם את רווח בר סמך של 90% בהתבסס על ההתפלגות הבינומית. נתוני הגשמים מיוצגים על ידי התווית מיקומים כחלק מניתוח התדירות המצטבר.

הקשר לחוק זיף

התפלגות פארטו היא התפלגות הסתברות רציפה. חוק זיף הוא התפלגות בדידה, המפרידה בין הערכים לדירוג פשוטתבנית:אנ. שניהם הם חוקי חזקות פשוטים עם מעריך שלילי, מנורמלים כך שההתפלגות המצטברת שלהם שווה ל-1. ניתן לגזור את חוק זיף מהתפלגות פארטו אם ערכי x ערכים (ההכנסות) מחולקים ל N דלייםתבנית:אנ, כך שמספר האנשים בכל דלי מתנהג כהופכי של הדירוג שלו. ההתפלגות מנורמלת על ידי ההגדרה של xm כך שיתקיים αxmα=1H(N,α1), כאשר H(N,α1) הוא המספר ההרמוני המוכלל. כך, פונקציית צפיפות ההסתברות של זיף מהווה מקרה פרטי של התפלגות פארטו:

f(x)=αxmαxα+1=1xsH(N,s)

כאשר s=α1, N הוא מדרגת ההכנסה הגבוהה ביותר ו-x הוא מספר שלם המייצג דירוג מ-1 עד N. אז לאדם שנבחר באקראי (או מילה, קישור לאתר או עיר) מאוכלוסייה (או שפה, אינטרנט או מדינה) יש הסתברות f(x) לדירוג x .

קשר ל"עקרון פארטו"

חוק "80–20", לפיו 20% מכלל האנשים מקבלים 80% מכלל ההכנסה, ו-20% מ-20% האמידים ביותר מקבלים 80% מאותם 80%, וכן הלאה, מתקיים כאשר מדד פארטו הוא α=log45=log105log1041.161 . תוצאה זו יכולה להיגזר מנוסחת עקומת לורנץ. יתר על כן, הוכח כי הטענות הבאות שקולות מתמטית[18]:

  • ההכנסה מחולקת לפי התפלגות פארטו עם מדד α > 1.
  • קיים מספר 12p0 כך שחלק יחסי p מכלל האנשים מקבלים חלק יחסי 1p מההכנסה., ובאופן דומה עבור כל מספר ממשי 0<n (לא בהכרח מספר שלם) חלק יחסי pn של כלל האנשים יקבל חלק יחסי (1p)n מכלל ההכנסה. α ו- p קשורים ב-
11α=ln(1p)ln(p)=ln((1p)n)ln(pn) .

התפלגויות פארטו, שעבורן תבנית:משמאל לימין אשר, כפי שצוין לעיל, יש להן עתוחלת אינסופית, אינן יכולות לשמש כמודל סביר להתפלגות של הכנסה.

ראו גם

קישורים חיצוניים

תבנית:ויקישיתוף בשורה

הערות שוליים

תבנית:הערות שוליים

תבנית:בקרת זהויות

  1. תבנית:Cite journal
  2. תבנית:Cite journal
  3. Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H.
  4. תבנית:Cite journal
  5. תבנית:Cite journal
  6. תבנית:Cite journal
  7. תבנית:Cite book
  8. S. Hussain, S.H. Bhatti (2018).
  9. תבנית:Cite journal
  10. Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1.
  11. תבנית:Cite journal
  12. For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  13. תבנית:Cite web
  14. 14.0 14.1 14.2 14.3 תבנית:Cite journal
  15. תבנית:Cite journal
  16. תבנית:צ-מאמר
  17. CumFreq, software for cumulative frequency analysis and probability distribution fitting
  18. תבנית:Cite journal