התפלגות קושי

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש
התפלגות קושי
פונקציית צפיפות ההסתברות
פונקציית ההסתברות המצטברת
מאפיינים
פרמטרים x0 החציון, γ סקלה
תומך
פונקציית צפיפות הסתברות
(pdf)
1π[γ(xx0)2+γ2]
פונקציית ההסתברות המצטברת
(cdf)
1πarctan(xx0γ)+12
תוחלת לא מוגדרת
סטיית תקן לא מוגדרת
חציון x0
ערך שכיח x0
שונות לא מוגדרת
אנטרופיה ln(4πγ)
פונקציה יוצרת מומנטים
(mgf)
לא מוגדרת
פונקציה אופיינית exp(x0itγ|t|)
צידוד לא מוגדר
גבנוניות לא מוגדרת

התפלגות קוֹשִי (Cauchy), על שם המתמטיקאי הצרפתי אוגוסטן לואי קושי, היא התפלגות רציפה בעלת חשיבות במתמטיקה ובמספר תחומים בפיזיקה. בקרב פיזיקאים ההתפלגות מכונה לעיתים פילוג לורנץ (Lorentz), פילוג ברייט-ויגנר (Breit-Wigner) או לורנציאן.

הגדרה

התפלגות קושי מוגדרת כהתפלגות רציפה בעלת פונקציית צפיפות ההסתברות

f(x;x0,γ)=1πγ[1+(xx0γ)2]=1π[γ(xx0)2+γ2]

כאשר x0 הוא פרמטר מיקום, אשר קובע את החציון של ההתפלגות, ואילו γ הוא פרמטר סקלה, אשר קובע את רוחב ההתפלגות ובהתאם את גובה הערכים. בגבול שבו γ0 נקבל את פונקציית הדלתא של דיראק.

המקרה הפרטי של התפלגות קושי עם פרמטרים x0=0 ו γ=1 נקרא התפלגות קושי סטנדרטית, עם צפיפות התפלגות[1][2]

f(x;0,1)=1π(1+x2) .

תכונות

תכונה יוצאת דופן של התפלגות קושי היא שהתוחלת והשונות שלה אינם מוגדרים, כמו גם המומנטים מסדר גבוה יותר. לעומת זאת, החציון והשכיח מוגדרים ושניהם שווים x0.

סכום של משתנים מקריים המתפלגים קושי

אם X1,X2,,Xn הם משתנים מקריים בלתי-תלויים ושווי-התפלגות שנדגמו מהתפלגות קושי סטנדרטית, ממוצע המדגם שלהם X¯=1niXi מתפלג קושי סטנדרטית. בפרט, הממוצע אינו מתכנס לתוחלת, ואכן התפלגות קושי אינה מקיימת את חוק המספרים הגדולים. ההוכחה של תכונה זו אפשרית על ידי אינטגרציה של פונקציית צפיפות ההסתברות או על ידי שימוש בפונקציה האופיינית של התפלגות קושי הסטנדרטית:φX(t)=E[eiXt]=e|t|עבור סכום הדגימות מקבלים φiXi(t)=en|t| כלומר X¯ הוא משתנה מקרי בעל התפלגות קושי סטנדרטית.

באופן כללי יותר, אם X1,X2,,Xn הם משתנים בלתי-תלויים בעלי התפלגות קושי עם פרמטרי מיקום x1,,xn ופרמטרי סקלה γ1,,γn ו a1,,an הם מספרים ממשיים אזי iaiXi מתפלג קושי עם פרמטר מיקום iaixi וסקאלה i|ai|γi. כלומר חוק המספרים הגדולים אינו מתקיים עבור סכום משוקלל של משתני קושי בלתי תלויים.

פונקציה אופיינית

יהי X משתנה מקרי המתפלג קושי. הפונקציה האופיינית של התפלגות קושי ניתנת על ידי

φX(t)=E[eiXt]=f(x;x0,γ)eixtdx=eix0tγ|t|

שאינו אלא טרנספורם פורייה של צפיפות ההסתברות. באופן דומה ניתן להביע את פונקציית צפיפות ההסתברות במונחי הפונקציה האופיינית על ידי טרנספורם פורייה ההפוך

f(x;x0,γ)=12πφX(t;x0,γ)eixtdt .

המומנט ה-n של ההתפלגות מתקבל מהצבת t=0 בנגזרת ה-n של הפונקציה האופיינית. יש לשים לב כי הפונקציה האופיינית אינה גזירה בראשית הצירים. ואכן המומנטים של התפלגות קושי אינם מוגדרים פרט למומנט האפס.

דיברגנץ קולבק-לייבלר

ניתן להביא את דיברגנץ קולבק-לייבלר בין שתי התפלגויות קושי עם פרמטרים x0,1,γ1 ו x0,2,γ2 כנוסחה סגורה סימטרית:[3]

KL(px0,1,γ1:px0,2,γ2)=log(γ1+γ2)2+(x0,1x0,2)24γ1γ2 .

אנטרופיה

האנטרופיה הדיפרנציאלית של התפלגות קושי נתונה על ידי

H(γ)=f(x;x0,γ)log(f(x;x0,γ))dx=log(4πγ)

הנגזרת של פונקציית השברונים של התפלגות קושי היא

Q(p;γ)=γπsec2[π(p12)] .

ניתן להגדיר את האנטרופיה של התפלגות במונחים של פונקציית השברונים שלה.[4] באופן ספציפי

H(γ)=01log(Q(p;γ))dp=log(4πγ) .

בניות

דגימה מהתפלגות קושי

אם עומדים מול קו ובועטים כדור לעבר הקו בזווית אקראית המתפלגת באופן אחיד בין 90- ל-90+ מעלות, ההתפלגות של הנקודה שבה פוגע הכדור בקו היא התפלגות קושי.

באופן פורמלי, תהי נקודה (x0,γ) במישור x-y. נבחר קו העובר דרך הנקודה, כך שהזווית שלו ביחס לציר x נבחרת באופן באופן אחיד (בין 90°- ל-90°+) באקראי. נקודת החיתוך של הישר עם ציר x הוא מתפלגת קושי עם פרמטר מיקום x0 ופרמטר סקאלה γ.

הגדרה זו נותנת דרך פשוטה לדגום מהתפלגות קושי סטנדרטית. תהי u דגימה מהתפלגות אחידה רציפה מהקטע [0,1]. אזי ניתן ליצור דגימה x מהתפלגות קושי סטנדרטית על ידי

x=tan(π(u12)) .

לחלופין, אם U ו V הם שני משתנים מקריים בלתי תלויים המתפלגים נורמלית עם תוחלת 0 ושונות 1 אז המנה U/V מתפלגת התפלגות קושי סטנדרטית. ובאופן כללי, אם ל-(U,V) סימטריה סיבובית במישור סביב ראשית הצירים, אזי המנה U/V מתפלגת התפלגות קושי סטנדרטית.

פונקציית צפיפות התפלגות

פונקציית צפיפות ההסתברות של התפלגות קושי היא[5][6]

f(x;x0,γ)=1πγ[1+(xx0γ)2]=1π[γ(xx0)2+γ2]

כאשר x0 הוא פרמטר המיקום (והשכיח של ההתפלגות) ו γ הוא פרמטר הסקאלה. 2γ הוא רוחב חצי המקסימום (FWHM) של התפלגות קושי. אוגוסטן לואי קושי השתמש בפונקציית צפיפות כזו עם פרמטר קנה מידה אינפיניטסימלי, והגדיר את מה שמכונה כעת פונקציית דלתא של דיראק.

המקסימום של פונקציית הצפיפות של התפלגות קושי הוא ב-x=x0 וערכו 1πγ.

פונקציית התפלגות מצטברת

פונקציית ההתפלגות המצטברת של התפלגות קושי היא

F(x;x0,γ)=1πarctan(xx0γ)+12

ופונקציית השברונים (הפונקציה ההופכית לה) היא

Q(p;x0,γ)=x0+γtan[π(p12)] .

הרבעון הראשון והשלישי הם (x0γ,x0+γ), ומכאן 2γ הוא הטווח הבין-רבעוני של ההתפלגות.

הקשר להתפלגות t

התפלגות קושי סטנדרטית היא התפלגות t עם דרגת חופש אחת, כך שניתן לבנותה בכל שיטה שבה משתמשים לבניית התפלגות t.[7]

שיערוך פרמטרים

הממוצע והשונות של התפלגות קושי אינם מוגדרים. משום כך, בהינתן מדגם של התפלגות קושי, לא ניתן לשערך את הפרמטרים של ההתפלגות באמצעות ממוצע ושונות המדגם.[8] ואכן, ניתן לחשב את הממוצע של מדגם של n דוגמאות בלתי-תלויות ושוות-התפלגות מהתפלגות קושי כ

x¯=1ni=1nxi

למרות שערכי הדגימות xi יתרכזו סביב x0, ממוצע המדגם לא יתכנס כאשר מגדילים את הערך של n. זאת מפני שההסתברות לדגימה x עם ערך מוחלט גדול, הולכת וגדלה. למעשה, התפלגות ממוצע המדגם תהיה שווה להתפלגות התצפיות עצמן; כלומר, ממוצע המדגם של מדגם גדול אינו טוב יותר (או גרוע יותר) משערוך הערך של x0 מכל תצפית בודדת במדגם. באופן דומה, חישוב שונות המדגם יביא לערכים שיגדלו ככל שיגדל מספר התצפיות.

זו הסיבה שיש צורך בשיטות אחרות לשיערוך פרמטר המיקום x0 ופרמטר קנה המידה γ. שיטה פשוטה אחת היא לקחת את הערך החציוני של המדגם כאומד של x0, וחצי מהטווח הבין-רבעוני כאומד של γ. פותחו גם שיטות אחרות, מדויקות וחזקות יותר, שלעיתים נותנות תוצאות מדויקות בהרבה[9][10], למשל הממוצע המקוטע (אנ') של 24% הדגימות המרכזיות מהמדגם, מייצר אומד של x0 מדויק יותר מחציון המדגם.[11]

ניתן להיעזר בשיטת הנראות המקסימלית כדי לאמוד את הפרמטרים x0 ו γ. עם זאת, זה גישה זו מורכבת, מכיוון שהיא דורשת מציאת השורשים של פולינום מסדר גבוה, ושורשים מרובים ייצגו נקודות מקסימה מקומיות.[12] כמו כן, בעוד שמעריך הנראות המקסימלית יעיל אסימפטוטית, הוא אינו יעיל יחסית עבור מדגמים קטנים.[13][14] פונקציית הלוג-נראות עבור התפלגות קושי למדגם בגודל n היא:

^(x1,,xnx0,γ)=nlog(γπ)i=1nlog(1+(xix0γ)2)

גזירה של פונקציית הנראות ביחס ל-x0 ול-γ והשוואת הנגזרות לאפס נותנות את המשוואות הבאות:

ddx0=i=1n2(xix0)γ2+(xix0)2=0
ddγ=i=1n2(xix0)2γ(γ2+(xix0)2)nγ=0

כאשר נשים לב כי במשוואת הנגזרת ביחס ל-γ הביטוי

i=1n(xix0)2γ2+(xix0)2

היא פונקציה מונוטונית של γ וכי הפתרון עבור γ חייב לקיים

min|xix0|γmax|xix0| .

הפתרון עבור x0 דורש מציאת השורשים של פולינום מסדר 2n1.[12] הפתרון עבור γ דורש מציאת השורשים של פולינום מסדר 2n. לכן בדרך כלל יהיה צורך להיעזר בשיטות נומריות. היתרון של שיערוך נראות מקסימלית הוא יעילות אסימפטוטית גבוהה יותר, שמתרגמת לשונות נמוכה יותר של האומד; הערכת x0 באמצעות חציון המדגם היא רק כ-81% יעילה מבחינה אסימפטוטית ביחס אומדן x0 לפי הסבירות המקסימלית.[11][15] ממוצע המדגם הקטוע המבוסס על 24% הדגימות המרכזיות יעיל אסימפטוטית בכ-88% יעיל ביחס למשערך הנראות המקסימלית של x0.[11]



קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא התפלגות קושי בוויקישיתוף   המזהה לא מולא ולא נמצא בוויקינתונים, נא למלא את הפרמטר.

הערות שוליים

  1. ^ בתהליכי בנייה "תבנית:Cite book"
  2. ^ בתהליכי בנייה "תבנית:Cite book"
  3. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  4. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  5. ^ בתהליכי בנייה "תבנית:Cite book", Chapter 16.
  6. ^ בתהליכי בנייה "תבנית:Cite book"
  7. ^ Rui Li, Saralees Nadarajah, A review of Student’s t distribution and its generalizations, Empirical Economics 58, 2020-03-01, עמ' 1461–1490 doi: 10.1007/s00181-018-1570-0
  8. ^ בתהליכי בנייה "תבנית:Cite web"
  9. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  10. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  11. ^ 1 2 3 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  12. ^ 1 2 שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  13. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  14. ^ בתהליכי בנייה "תבנית:Cite book"
  15. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).