מסווג דו-ערכי

מתוך testwiki
קפיצה לניווט קפיצה לחיפוש

בסטטיסטיקה ובלמידה חישובית, מסווג דו-ערכי או מסווג בינארי הוא מסווג שמטרתו למיין את הפרטים בקבוצה לאחת משתי תת-קבוצות.

דוגמאות:

  • מסנן ספאם בדואר אלקטרוני מסווג את ההודעות הנכנסות לספאם וללא-ספאם.
  • בדיקה רפואית מאבחנת קיום מחלה (האם המטופל חולה או בריא?).
  • זיהוי עמית-טורף: מערכת הבודקת האם מטוס שזוהה במכ"ם הוא מטוס ידידותי או מטוס אויב.

סיווג סטטיסטי

תבנית:להשלים

מדדי הערכה למסווג דו-ערכי

תבנית:מטריצת טעות תבנית:הפניה לערך מורחב אינטואיטיבית, קל לומר האם מסווג מסוים הוא "מוצלח" (כלומר, ממיין את פריטי הקבוצה בדרך שתואמת את ההיגיון שלנו) או לא. עם זאת, לצרכים מדעיים, קיים צורך לתת הערכה מספרית לביצועי המסווג. כדי לבצע זאת, יש צורך לבדוק את המסווג מול קבוצת נתונים קטנה יחסית, שבה ידוע לנו (מלכתחילה או בדיעבד) הסיווג הנכון, בעזרת מדד זהב כלשהו.

גם בהינתן מדד זהב, עדיין ניתן לבחור דרכים שונות להעריך מספרית את הצלחת המסווג (ראו מסגרת).

קיימים מספר יחסים פשוטים, המתארים את היחסים בין חלקים שונים של התרשים. למשל:

  • רגישות מתארת את החלק היחסי של התוצאות החיוביות מתוך כלל הפריטים שאמורים היו להיות מסווגים כחיוביים.
כלומר:
תבנית:מת-גדול רגישות
  • סגוליות מתארת את החלק היחסי של התוצאות השליליות מתוך כלל הפריטים שהיו אמורים להיות מסווגים כשליליים.
תבנית:מת-גדול סגוליות

בנוסף, קיימים מדדי הערכה פשוטים פחות, אבל יותר תמציתיים; למשל, מקדם מתאם מתיוז:

תבנית:מת-גדול

כאשר ח"א הוא מספר החיוביים האמיתיים; ח"כ הוא מספר החיוביים הכוזבים; ש"א הוא מספר השליליים האמיתיים; ש"כ הוא מספר השליליים הכוזבים.

ניתן לומר, בהכללה, שמקדם מתאם מתיוז מתאר את המתאם בין המסווג למדד הזהב.

להלן איור המסכם את מטריצת הטעות וממדי ההערכה השונים, היסודיים והנגזרים, של מסווג דו-ערכי.

קובץ:Confusion-Matrix-01.jpg

המרת ערכים רציפים לסיווג דו-ערכי

תבנית:להשלים בהינתן קלט 𝐱V, על המסווג להחליט האם התוצאה חיובית או שלילית. דרך נפוצה לבצע זאת היא על ידי הגדרת פונקציית ניקוד n:V. הניקוד מבטא את מידת ההערכה שתוצאה קרובה לחיובית או חיובית בעצמה. בנוסף, מגדירים פונקציית מדרגה התלויה ב-T (שנקרא ערך הסף, threshold) באופן הבא: θT(t)={1 if tT,0 if t<T בעזרת שתי הפונקציות הללו, ניתו לבחור מסווג בינארי מהצורה fT=θTn, כלומר: לכל 𝐱V המסווג יחזיר fT(𝐱)=θT(n(𝐱)){0,1}, כלומר: המסווג יחזיר 1 אם הניקוד גדול או שווה לערך הסף, ואחרת יחזיר 0. באמצעות קביעת הסף אפשר להגדיל או להקטין את רגישות המסווג, וכן את הסגוליות. באמצעות עקומת ROC אפשר לבצע אופטימיזציה של המסווג fT על ידי כוונון הסף.