הסתברות פוסטריורית

מתוך testwiki
קפיצה לניווט קפיצה לחיפוש

הסתברות פוסטריורית היא מושג מרכזי בסטטיסטיקה בייסיאנית. המייצגת את ההסתברות, או ההתפלגות, שמתקבלת מעדכונים של ההסתברות הפריורית על סמך מידע המתקבל מתצפיות.[1]

העדכון נעשה על ידי שימוש בכלל בייס.[2] הההסתברות הפוסטריורית עשויה לשמש כהסתברות פריורית במהלך נוסף של עדכון בייסיאני.[3]

הגדרה בהקשר של התפלגות

בסטטיסטיקה בייסיאנית, הפרמטרים של המודל, שיסומנו ב- θ, הם בעצמם משתנים מקריים. ההתפלגות הפריורית שלהם, כלומר ההתפלגות שלהם בהיעדר כל מידע מוקדם, תסומן ב p(θ) .

ההסתברות הפוסטריורית היא ההסתברות של הפרמטרים θ בהינתן תצפיות x, ומסומנת p(θ|x) .

לעומת זאת, פונקציית הנראות היא ההסתברות של התצפיות בהינתן הפרמטרים של המודל, כלומר p(x|θ) .

בהינתן הסתברות פריורית p(θ) וכי ההסתברות לתצפיות x היא p(x|θ), אז ההסתברות הפוסטריורית מוגדרת באמצעות כלל בייס[4]

p(θ|x)=p(x|θ)p(x)p(θ) .

כלומר, ההסתברות הפוסטריורית פרופורציונית לפונקציית הנראות המוכפלת בהסתברות הפריורית.[5]p(x) הוא קבוע הנירמול המחושב על ידי

p(x)=p(x|θ)p(θ)dθ

אם θ היא פרמטר רציף, או על ידי סיכום של p(x|θ)p(θ) על כל הערכים האפשריים של θ, אם θ הוא פרמטר בדיד.[6]

דוגמה 1 - התפלגות פוסטריורית של פרמטר במודל בינומי

נניח שרוצים למצוא מהו הסיכוי θ שבהטלת מטבע מסוים, לא בהכרח מטבע הוגן, הוא ייפול על עץ. כדי לאמוד את הערך של θ מבצעים סדרה של הטלות, ונניח ש-m פעמים הוא נפל על עץ, ו-n פעמים על פלי. נסמן ב X את סדרת התוצאות הללו. בהנחה שההטלות בלתי תלויות זו בזה, אז בהינתן מודל שבו ההסתברות לנפילה על עץ בהטלה בודדת היא θ, ההסתברות לסדרת התוצאות X היא P(X|θ)=θm(1θ)nאת האמונה הראשונית שלנו, שמטבעות הם בדרך כלל הוגנים, ניתן לנסח באמצעות פונקציית צפיפות הסתברות פריורית על הפרמטר θ. למען ההמחשה אפשר לבחור כהתפלגות הפריורית בפונקציה P(θ)=16θ(1θ).להתפלגות פריורית זו מקסימום ב θ=12 והיא סימטרית סביב נקודה זו. כעת ההתפלגות הפוסטריורית של θ היאp(θ|X)=p(X|θ)p(θ)p(X)=θm(1θ)nθ(1θ)01θm(1θ)nθ(1θ)dθ=θm+1(1θ)n+1B(m+1,n+1)כאשר B היא פונקציית בטא.[7]

דוגמה 2 - התפלגות פוסטריורית של פרמטר בהתפלגות נורמלית

ניח X1,...,Xn הם משתנים מקריים בלתי תלויים שווי התפלגות בעלי התפלגות נורמלית N(θ,σ2), כאשר התוחלת θ אינה ידועה והשונות σ2 נתונה. נניח גם כי צפיפות ההתפלגות הפריורית של θ היא N(μ0,σ02) כאשר μ0 ו-σ02 נתונים. נסמן ב-X את וקטור המשתנים המקריים (X1,...,Xn) ונסמן ב-x=(x1,,xn) את ערכי התצפית שלהם. אם נתעלם מכל הגורמים שאינם תלויים ב-θ, ההסתברות הפריורית המוכפלת בנראות היא מהצורה: p(θ)p(x|θ)exp[(θμ0)22σ02i=0n(xiθ)22σ2] באמצעות השלמה לריבוע נקבל: (θμ0)22σ02i=0n(xiθ)22σ2=θ2(1σ02+nσ2)2θ(μ02σ02+nx¯2σ2)+C1=1σ12(θμ1)2+C2 כאשר x¯=xi/n וכאשר C1 ו-C2 הם קבועים שאינם תלויים ב-θ (אך תלויים ב-x1,,xn), ו-μ1 ו-σ12 הם: 1σ12=1σ02+nσ2 ,μ1=σ12(μ0σ02+nx¯σ2) ולסיכום ההתפלגות הפוסטריורית היא התפלגות נורמלית עם תוחלת μ1 ועם שונות σ12p(θ|x)exp[(θμ1)22σ12]

ניתן לראות כי בגבול n מתקבלות התוצאות המצופות ממדגם גדול, μ1x¯ ו σ12σ2/n .[7]

חישוב

ניתן לחשב את התפלגות ההסתברות הפוסטריורית של משתנה מקרי אחד בהינתן ערכו של אחר באמצעות משפט בייס על ידי הכפלת התפלגות ההסתברות הפריורית בפונקציית הנראות, ולאחר מכן חלוקה בקבוע הנירמול, באופן הבא:

fXY=y(x)=fX(x)XY=y(x)fX(u)XY=y(u)du

נותן את פונקציית צפיפות ההסתברות הפוסטריורית עבור משתנה מקרי X, בהינתן שהמשתנה המקרי Y מקבל ערך ספציפי Y=y, כאשר

  • fX(x) היא הצפיפות הפריורית של X ,
  • XY=y(x)=fYX=x(y) היא פונקציית הנראות של Y כפונקציה של x ,
  • fX(u)XY=y(u)du הוא קבוע הנירמול, ו
  • fXY=y(x) היא הצפיפות הפוסטריורית של X בהינתן Y=y.[8]

סיווג (קלסיפיקציה)

בסיווג, הסתברות פוסטריורית משקפת את חוסר הוודאות של הערכת תצפית למחלקה מסוימת. בעוד שהפלט של שיטות סיווג סטטיסטיות הוא בהגדרה הסתברות פוסטריורית, שיטות של למידת מכונה לעיתים קרובות אינן מספקת הערכות הסתברותיות אמינות. אחת הדוגמאות הבולטות בהקשר זה הוא מסווג בייסיאני נאיבי, שנוטה להערכות הסתברות פוסטריורית מוטות בשל הנחת האי-תלות בין משתני הקלט.[9]

הערות שוליים

תבנית:הערות שוליים