המבחן המדויק של פישר

המבחן המדויק של פישר או בקיצור מבחן פישר הוא מבחן סטטיסטי לבדיקת השערת אי התלות בין שני משתנים איכותיים. מבחן זה שימושי כאשר גודל המדגם הוא קטן, ולכן הקירובים האסימפטוטיים של מבחנים כגון מבחן חי בריבוע אינם תקפים. עם זאת, המבחן עצמו תקף גם עבור מדגמים גדולים, אף על פי שבאופן מעשי יש קושי לבצע את החישובים הנדרשים כאשר המדגם גדול.

היסטוריה

רונלד פישר הציג את המבחן בשנת 1922.תבנית:הערה ההקשר המפורסם ביותר של המבחן הוא ניסוי "הליידי טועמת התה"תבנית:הערה, המתואר בספרו של פישר משנת 1935תבנית:הערה. הליידי, ד"ר מוריאל בריסטול, טענה כי היא מסוגלת לזהות על ידי טעימה אם ספל תה הוכן באופן שבו תחילה נמזגו המים הרותחים ולאחר מכן הוסף להם חלב, או להפך. כדי לבחון את טענתה, פישר ערך ניסוי בו הוגשו לליידי לטעימה 8 ספלי תה, כאשר בארבעה מהם נמזגו תחילה המים הרותחים ואז נוסף להם החלב, ובארבעה נמזג תחילה החלב ולאחר מכן נוספו המים הרותחים. הניסוי יצר לוח שכיחות של שני משתנים איכותיים, שכל אחד מהם מקבל שני ערכים. משתנה אחד מציין את האופן בו הוכן ספל התה, והשני מציין את קביעתה של הליידי לגבי אופן הכנת התה.

המבחן המקורי שהציג פישר התאים ללוח שכיחות דו־ממדי בעל שתי שורות ושתי עמודות, אולם בהמשך הוא הוכלל ללוח שכיחות דו־ממדי כלשהו, כלומר כאשר כל משתנה יכול לקבל מספר כלשהו של ערכים תבנית:הערה . במקרה הכללי, נוסחאות החישוב מסובכות יותר ובדרך כלל לא ניתן לבצע את החישובים באופן ידני.

הגדרה פורמלית ללוח 2x2

נתון לוח השכיחות הבא מסדר $2 \times 2$ עבור שני משתנים, $X$ ו- $Y$ :


סה"כ	$y_{2}$	$y_{1}$
$a + b$	$b$	$a$	$x_{1}$
$c + d$	$d$	$c$	$x_{2}$
$n$	$b + d$	$a + c$	סה"כ

כאשר $n = a + b + c + d$ . בלי הגבלת הכלליות נניח כי $a = \min {a, b, c, d}$ .

השערת האפס אומרת כי המשתנים $X$ ו- $Y$ הם בלתי תלויים.

אם נניח כי סכומי השורות והעמודות $a + b, c + d, a + c, b + d$ ידועים וקבועים, אזי ההסתברות כי השכיחות של התצפיות במדגם עבורן $X = x_{1}$ ו- $Y = y_{1}$ היא $a$ ניתנת לחישוב על ידי שימוש בהתפלגות ההיפרגאומטרית:

$p (a) = \frac{(\binom{a + b}{a}) (\binom{c + d}{d})}{(\binom{n}{a + c})}$

תחת השערת האפס, הערך הצפוי של $a$ הוא $\frac{(a + b) (c + d)}{n}$ . ערכים של $a$ הקטנים מהערך הצפוי או גדולים מהערך הצפוי מהווים עדות כנגד השערת אי התלות. לכן לפי הגדרת ערך ה-p, הוא שווה להסתברות כי תתקבל עדות השווה בעצמתה לעדות שהתקבלה במדגם $p (a)$ או גדולה ממנה. המשמעות היא לכן כי ערך ה-p שווה לסכום ההסתברויות של כל הלוחות האפשריים שהסתברותם שווה ל- $p (a)$ או קטנה ממנו.

בהינתן סכומי השורות והעמודות, השכיחות של התצפיות במדגם עבורן $X = x_{1}$ ו- $Y = y_{1}$ יכולה להיות כל מספר שלם בין 0 לבין $M = \min {a + b, a + c}$ . לכן ערך ה-p של מבחן פישר הוא $P v a l u e = \sum_{m : p (m) \leq p (a)} p (m)$

שימו לב כי זהו מבחן דו-צדדי, במובן שעדות נגד השערת היא התלות יכולה להתקבל גם מערכי $m$ הקטנים מ- $a$ וגם מערכי $m$ הגדולים מ- $a$ . ניתן להגדיר גם מבחן חד צדדי, שבו עדות נגד השערת היא התלות יכולה להתקבל רק מערכי $m$ הקטנים מ- $a$ . במקרה זה

$P v a l u e = \sum_{m : m \leq a & p (m) \leq p (a)} p (m)$

דוגמה

בקורס "מבוא לסטטיסטיקה" לומדים 24 סטודנטים, מחציתם גברים ומחציתם נשים. 10 מהם לומדים לקראת המבחן, ו-14 התייאשו והפסיקו ללמוד. האם יש קשר בין מין הסטודנט לבין גישת הסטודנטים למבחן (לומדים או מיואשים)? נתוני הסטודנטים מוצגים בלוח השכיחות הבא:


סך הכל	גברים	נשים
10	8	2	לומדים
14	4	10	מיואשים
24	12	12	סך הכל

ההסתברות כי בהינתן סך השורות וסך העמודות יתקבל לוח השכיחות הזה בו $a = 2$ היא: $p (2) = \frac{(\binom{10}{2}) (\binom{14}{10})}{(\binom{24}{12})} \approx 0.01666$ .

מכיוון שכאן $M = \min {10, 12} = 10$ , נחשב את ערכי $p (m)$ כעבור כל ערכי $m$ מ-0 ועד 10. תוצאות החישובים נתונות בטבלה הבאה:


$p (m) \leq p (2) ?$	$p (m)$	$m$
כן	0.00003	0
כן	0.00135	1
כן	0.01666	2
לא	0.08884	3
לא	0.23321	4
לא	0.31983	5
לא	0.23321	6
לא	0.08884	7
כן	0.01666	8
כן	0.00135	9
כן	0.0003	10

לכן $P v a l u e = 0.00003 + 0.00135 + 0.01666 + 0.01666 + 0.00135 + 0.00003 \approx 0.0361$ . בהנחה כי החלטנו מראש לבדוק את השערת אי התלות ברמת מובהקות $α = 0.05$ נדחה את השערת האפס של אי התלות בין מין הסטודנט וגישתו למבחן.

בתוכנת R ניתן לחשב את מבחן פישר הדו צדדי לנתונים אלה על ידי הפקודה: תבנית:Ltr

ובפייתון על ידי הפקודה: תבנית:Ltr

ביקורת

מספר חוקרים טענו כי בפועל רמת המובהקות של מבחן פישר נמוכה מרמת המובהקות המוצהרתתבנית:הערה תבנית:הערה תבנית:הערה . במילים אחרות, אם מבצעים את מבחן פישר ומשתמשים ברמת מובהקות $α$ , ההסתברות לטעות מסוג ראשון (דחיה מוטעית של השערת האפס) בדרך כלל קטנה מ- $α$ . הדבר נובע מחישוב ערך ה-p על סמך התפלגות בדידה. עם זאת, המונח "טעות מסוג ראשון" מוגדר בהקשר של מבחני יחס הנראות על פי הלמה של ניימן ופירסון, ומבחן פישר אינו מבחן יחס נראות.

ביקורת נוספת נוגעת לכך שהמבחן מחושב תחת ההנחה כי ההתפלגויות השוליות של המשתנים נתונות תבנית:הערה . המבחן יהיה מדויק רק עבור ההתפלגות המותנית של לוח השכיחות בהינתן ההתפלגויות השוליות, אך אינו מדויק ביחס ללוח השכיחות המקורי, מכיוון שבמדגם נוסף מאותו גודל עשוי להתקבל לוח שכיחות עם התפלגויות שוליות שונות. ניתן לבנות מבחן מדויק שאינו מותנה בהתפלגויות השוליות. מבחן ברנרד הוא דוגמה למבחן כזה.

ראו גם

לקריאה נוספת

תבנית:Ltr

קישורים חיצוניים

הערות שוליים

תבנית:הערות שוליים

המבחן המדויק של פישר

תוכן עניינים

היסטוריה

הגדרה פורמלית ללוח 2x2

דוגמה

ביקורת

ראו גם

לקריאה נוספת

קישורים חיצוניים

הערות שוליים

תפריט ניווט

המבחן המדויק של פישר

היסטוריה

הגדרה פורמלית ללוח 2x2

דוגמה

ביקורת

ראו גם

לקריאה נוספת

קישורים חיצוניים

הערות שוליים

תפריט ניווט

חיפוש