דיברגנץ קולבק-לייבלר
בסטטיסטיקה מתמטית ובתורת האינפורמציה דיברגנץ קולבק-לייבלר (KL) (נקרא גם אנטרופיה יחסית[1]), מסומן , הוא סוג של מרחק סטטיסטי בין התפלגויות: מדד לאופן שבו התפלגות הסתברות אחת תבנית:Mvar שונה מהתפלגות הסתברות שנייה תבנית:Mvar.[2]
מתמטית
- .
ניתן לפרש את דיברגנץ קולבק-לייבלר של תבנית:Mvar מ- תבנית:Mvar כהפתעה הצפויה משימוש בהתפלגות תבנית:Mvar במקום ב תבנית:Mvar כאשר ההתפלגות בפועל היא תבנית:Mvar. למרות שמדובר במדד לשונות של שתי ההתפלגויות, ובמובן מסוים הוא לפיכך "מרחק", דיברגנץ קולבק-לייבלר אינו מטרי. בפרט, הוא אינו סימטרי בשתי ההתפלגויות, ואינו מקיים את אי השוויון המשולש.
הערך של דיברגנץ קולבק-לייבלר הוא תמיד מספר ממשי אי-שלילי, עם ערך 0 אם ורק אם שתי ההתפלגויות המדוברות זהות. יש לו יישומים מגוונים, הן תאורטיים כגון אפיון מערכות מידע, אקראיות של סדרות זמן רציפות ורווח מידעתבנית:אנ בעת השוואת מודלים סטטיסטיים של הסקת מסקנות, והן מעשיים, כגון סטטיסטיקה יישומית, מכניקת נוזלים, מדעי המוח, ביואינפורמטיקה ולמידת מכונה.
הגדרה
עבור התפלגויות הסתברות בדידות תבנית:Mvar ו- תבנית:Mvar המוגדרות על אותו מרחב מדגם, דיברגנץ קולבק-לייבלר מ- תבנית:Mvar ל- תבנית:Mvar מוגדר כ[3]
- ,
או לחלופין
- .
במילים אחרות, זוהי התוחלת של הפרש הלוגריתמים בין ההסתברויות תבנית:Mvar ו- תבנית:Mvar, כאשר התוחלת נלקחת באמצעות ההסתברויות תבנית:Mvar.
דיברגנץ קולבק-לייבלר מוגדר בדרך זו רק אם לכל , גורר . אחרת, הוא מוגדר כ תבנית:ללא גלישה. אבל דיברגנץ קולבק-לייבלר יכול לקבל את הערך גם אם בכל התומך של ,[4][5] בתנאי שאינסופי. הערות דומות חלות גם על התפלגויות רציפות.
בְּכָל נקודה שבההוא אפס, התרומה של האיבר המתאים בסכום מתאפסת מכיוון ש
- .
עבור התפלגויות תבנית:Mvar ו- תבנית:Mvar של משתנה אקראי רציף, דיברגנץ קולבק-לייבלר מוגדר כאינטגרל[6]
כאשר תבנית:Mvar ו- תבנית:Mvar מציינים את צפיפות ההסתברות של תבנית:Mvar ו- תבנית:Mvar.
דוגמה
קולבק נותן את הדוגמה הבאה: יהיו תבנית:Mvar ו- תבנית:Mvar ההתפלגויות המוצגות בטבלה ובאיור להלן. תבנית:Mvar, ההתפלגות בצד שמאל של האיור, היא התפלגות בינומית עם ו . תבנית:Mvar ההתפלגות בצד ימין של האיור, היא התפלגות אחידה בדידה עם שלוש התוצאות האפשריות, 0, 1, 2 (כלומר ), כל אחת בהסתברות .

| תבנית:Mvar | 0 | 1 | 2 |
|---|---|---|---|
| Distribution | |||
| Distribution |
תכונות
- הערך של דיברגנץ קולבק-לייבלר הוא אי-שלילית. תוצאה המכונה גם אי-שוויון גיבס. אם ורק אם כהתפלגויות.
- חסם תחתון מדויק יותר לערך של דיברגנץ קולבק-לייבלר[7]
- במקרה הכללי אין חסם עליון לערך של דיברגנץ קולבק-לייבלר.
- דיברגנץ קולבק-לייבלר נשאר מוגדר היטב עבור התפלגויות רציפות, ובנוסף הוא אינו משתנה תחת טרנספורמציות פרמטרים. לדוגמה, אם מתבצעת טרנספורמציה ממשתנה למשתנה אזי ובאותו אופן כאשר האו הערך המוחלט של הנגזרת, או באופן כללי יותר היעקוביאן. ניתן לכתוב את דיברגנץ קולבק-לייבלק:
- דיברגנץ קולבק-לייבלר הוא אדיטיבי להתפלגויות בלתי תלויות, בדיוק כמו האנטרופיה של שאנון. כלומר אם ו בלתי תלויות, ונסמן ובאותו אופן עבור ההתפלגויות הבלתי תלויות ו אזי
- ניתן לפתח את (i.e. ) כטור טיילור סביב נקודת המינימום (כלומר )
דוגמאות
התפלגויות רב-נורמליות
נניח שתי התפלגות רב-נורמלית עם תוחלות ועם מטריצות קווריאנס (לא סינגולריות) . אם לשתי ההתפלגויות יש אותו ממד, תבנית:Mvar, אז דיברגנץ קולבק-לייבלר בין ההתפלגויות הוא:[8]
באיבר האחרון יש להשתמש בלוגריתם בבסיס הטבעי מכיוון שכל האיברים מלבד האחרון הם לוגריתמים טבעיים של ביטויים שהם גורמים של פונקציית הצפיפות או שנוצרים באופן טבעי בדרך אחרת. כדי כדי שהדיברגנץ יבטא יחידות של סיביות יש לחלק את הביטוי לעיל ב .
במימוש נומרי, רצוי לבטא את התוצאה במונחים של פירוק שולסקי כך ש ו . ואז עם פתרונות תבנית:Mvar ו- תבנית:Mvar למערכות הליניאריות המשולשות , ו נקבל
אאאאא אנטרופיה משותפת ודיברכנץ קולבק-לייבלר אאאאא מקרה מיוחד, וכמות נפוצה בהסקת וריאציה, היא האנטרופיה היחסית בין נורמה רב משתנים אלכסונית, לבין התפלגות נורמלית סטנדרטית (עם ממוצע אפס ושונות אחת):
עבור שתי התפלגות נורמלית במשתנה אחד, תבנית:Mvar ו- תבנית:Mvar האמור לעיל מפשט ל- [9]
במקרה של התפלגויות נורמליות עם אותה תוחלת, נסמן , וניתן לפשט את הביטוי לעיל[10]:
התפלגויות אחידות
תהיינה שתי התפלגויות אחידות, עם תומך סגור המוכל בתומך ( ). אזי:
קשר לגדלים אחרים בתורת האינפורמציה
גדלים אחרים בתורת האינפורמציה קשורים לדיברגנץ קולבק-לייבלר
אינפורמציה הדדית
תבנית:הפניה לערך מורחב ניתן לבטא את האינפורמציה הדדית במונחי דיברגנץ קולבק-לייבלר
האינפורמציה ההדדית היא המספר הצפוי של סיביות נוספות שיש להעביר לזיהוי תבנית:Mvar ו- תבנית:Mvar אם הם מקודדים רק באמצעות ההתפלגות השולית שלהם במקום ההתפלגות המשותפת. באותו אופן, אם ההסתברות המשותפת ידועה, זהו תוחלת מספר הסיביות הנוספות שיש לשלוח בממוצע כדי לזהות את תבנית:Mvar אם הערך של תבנית:Mvar אינו ידוע.
אנטרופיה של שאנון
אם בוחרים עבור בהתפלגות בדידה של N איברים ( ) ניתן לכתוב את האנטרופיה של P
זהו מספר הסיביות שיהיה צורך לשדר כדי לזהות את תבנית:Mvar מתוך תבנית:Mvar אפשרויות סבירות באותה מידה, בהפחתת האנטרופיה היחסית של ההתפלגות האחידה על המשתנים המקריים של תבנית:Mvar, , מההתפלגות האמיתית - כלומר פחות המספר הצפוי של סיביות שנשמרו, שהיה צריך להישלח אם הערך של תבנית:Mvar היה מקודד לפי ההתפלגות האחידה ולא את ההתפלגות האמיתית . הגדרה זו של אנטרופיה שאנון מהווה את הבסיס להכללה האלטרנטיבית של אדווין תומפסון ג'יינס להתפלגות רציפות, הצפיפות המגבילה של נקודות בדידות (בניגוד לאנטרופיה הדיפרנציאלית הרגילה), המגדירה את האנטרופיה הרציפה
שהוא שווה ערך ל:
אנטרופיה מותנית
תבנית:הפניה לערך מורחבניתן לנסח את האנטרופיה המותנית באמצעות דיברגנץ קולבק-לייבלר
זהו מספר הסיביות שיש להעביר כדי לזהות את תבנית:Mvar מתוך תבנית:Mvar אפשרויות סבירות באותה מידה, בהפחתת האנטרופיה היחסית של התפלגות המכפלה מההתפלגות המשותפת האמיתית - כלומר פחות המספר הצפוי של ביטים שנשמרו שהיה צריך להישלח אם הערך של תבנית:Mvar היה מקודד לפי ההתפלגות האחידה במקום ההתפלגות המותנית של תבנית:Mvar בהינתן תבנית:Mvar.