בעיית אוסף הקופונים

מתוך testwiki
קפיצה לניווט קפיצה לחיפוש
מספר הקופונים (בציר האנכי) כנגד מספר הדגימות הנדרש בתוחלת (בציר האופקי)

בתורת ההסתברות, בעיית אוסף הקופונים היא בעיה קלאסית הדנה במשחק שבו נאספים קופונים מתוך תיבה עם n קופונים שונים, בהסתברות שווה עם החזרה, והמטרה היא לאסוף את כל הקופונים. [1]מהי ההסתברות שנדרשות לפחות t דגימות כדי לצפות בכל n הקופונים לפחות פעם אחת? ניתוח מתמטי מראה שתוחלת מספר הדגימות הנדרש כדי לצפות בכל קופון לפחות פעם אחת גדלה כתלות ב-n לפי Θ(nlog(n)) (לדוגמה כאשר מספר הקופונים הוא n = 50, נדרשות בממוצע כ-225תבנית:הערה דגימות).

עיקרון חשוב להבנת הבעיה הוא שנדרש מספר דגימות מועט מאוד כדי לאסוף את הקופונים הראשונים, ואילו כדי לצפות בקופונים האחרונים (אלו שלא נצפו קודם לאחר שכמעט כל הקופונים נצפו) נדרש מספר גדול של דגימות. למשל כאשר יש 50 קופונים ו-49 מהם כבר נצפו, ידרשו 50 דגימות בממוצע כדי לצפות בקופון האחרון.

פתרון הבעיה

נסמן T כזמן הנדרש (או מספר הדגימות) לאיסוף n קופונים, נסמן בti את הזמן הנדרש לאיסוף הקופון ה-i לאחר שנאספו i1 קופונים. נתייחס אל T ו-ti כאל משתנים מקריים. נשים לב שההסתברות לאיסוף קופון חדש (לא אחד מתוך ה-i1 שכבר נצפו) היא pi=n(i1)n. הזמן הנדרש לאיסוף הקופון ה-i (ti) מתפלג לפי התפלגות גאומטרית עם תוחלת של 1pi. באמצעות ליניאריות התוחלת ניתן למצוא את תוחלת הזמן הנדרש לאיסוף כל הקופונים, T:[2]

E(T)=E(i=1nti)=E(t1)+E(t2)++E(tn)=1p1+1p2++1pn=nn+nn1++n1=n(11+12++1n)=nHn.

כאשר Hn הוא המספר ההרמוני ה-n. בניתוח אסימפטוטי מקבלים שכאשר n:

E(T)=nHn=nlogn+γn+12+o(1)

כאשר γ0.5772156649 הוא קבוע אוילר-מסקרוני. באמצעות אי-שוויון מרקוב ניתן לחסום את ההסתברות שהזמן הנדרש לאיסוף כל הקלפים יעלה על  cnHn:

P(TcnHn)1c .

חישוב השונות

ניתן לקבל חסם לשונות מספר התצפיות הנדרש. בהסתמך על כך שהמשתנים המקרים ti בלתי תלויים:

Var(T)=Var(t1)+Var(t2)++Var(tn)=1p1p12+1p2p22++1pnpn2=(n2n2+n2(n1)2++n212)(nn+nn1++n1)=n2(112+122++1n2)nHn=n2(π261n+12n2)(nlogn+γn+12)+o(1)<π26n2.

כאשר π2/6 הוא ערך של פונקציית זטא של רימן. (ראו בעיית בזל). באמצעות אי-שוויון צ'בישב מתקבל החסם:

P(|TnHn|cn)π26c2.

הכללה והרחבה

פייר-סימון לפלס, אך גם פאול ארדש ואלפרד רניי הוכיחו את משפט הגבול להתפלגות T. תוצאה זו היא הרחבה נוספת של גבולות קודמים. הוכחה נמצאת ב[3].

P(T<nlogn+cn)eec כאשר n היא התפלגות גאמבל.

דונלד ג'יי ניומן ולורנס שפ הכלילו את בעיית אוסף הקופונים, כאשר יש לאסוף מספר עותקים של כל קופון. תהי Tm פעם הראשונה שבה נאספו m עותקים של כל קופון. בגבול של n גדול התוחלת של Tm היא

E(Tm)=nlogn+(m1)nloglogn+O(n)

עבור m = 1 מתקבלת התוצאה הקודמת.

קישורים חיצוניים

תבנית:ויקישיתוף בשורה

הערות שוליים

תבנית:הערות שוליים