אינטגרציית מונטה קרלו

אינטגרציית מונטה קרלו היא שיטת אינטגרציה נומרית מבוססת דגימה אקראית של נקודות בתחום האינטגרל, והיא מקרה פרטי של שיטת מונטה קרלו. השיטה שימושית במיוחד לחישוב אינטגרלים רב ממדיים מאחר שאינה מחלקת את תחום האינטגרל לרשת בדידה שגדלה בצורה מעריכית כתלות בממד.

שיטה זאת זוכה לשימושים נרחבים במתמטיקה פיננסית^[1]^[2], פיזיקה סטטיסטית^[3], גרפיקה ממוחשבת^[4]^[5] ובעוד תחומים רבים.

רקע

נניח כי ברצוננו לחשב את האינטגרל המסוים $I$ של פונקציה חד או רב ממדית $g (𝐱)$ על התחום $Ω \subset ℝ^{n}$ כאשר $Ω$ היא קבוצה סופית.

$I = \int_{Ω} g (𝐱) d 𝐱$ נניח כי $Ω$ בעלת נפח סופי $V = \int_{Ω} d 𝐱$ .

נגדיר משתנה מקרי $\vec{X} \sim Unif (Ω)$ שמתפלג בצורה אחידה על $Ω$ ונשים לב כי פונקציית הצפיפות $f$ של $\vec{X}$ תוגדר להיות $f (x) = {\begin{matrix} p = 1 / V & x \in Ω \\ 0 & otherwise \end{matrix}$

נשים לב כי, התוחלת של $\vec{X}$ כאשר עליו מופעלת הפונקציה $g$ היא

$𝔼 [g (\vec{X})] = \int_{\bar{Ω}} g (𝐱) f (𝐱) d 𝐱 = \int_{\bar{Ω}} g (𝐱) p d 𝐱 = p I = I / V$

מאידך, עבור $N$ דגימות מהמ״מ $\vec{X}$ , $𝐱_{1}, 𝐱_{2}, \dots, 𝐱_{N} \in \bar{Ω}$ נשערך את $𝔼 [g (\vec{X})]$ ע״י

$𝔼 [g (\vec{X})] \approx \frac{1}{N} \sum_{i = 1}^{N} g (𝐱_{i})$ ולבסוף נקבל

$I = V \cdot 𝔼 [g (\vec{X})] \approx Q_{N} \equiv \frac{V}{N} \sum_{i = 1}^{N} g (𝐱_{i})$

מחוק המספרים הגדולים נקבל

$\lim_{N \to \infty} Q_{N} = V \cdot 𝔼 [g (\vec{X})] = I$

הערכת השגיאה

ראשית, נשים לב כי $Q_{N}$ משערך חסר הטיה תבנית:אנ

$𝔼 [Q_{N}] = 𝔼 [\frac{V}{N} \sum_{i = 1}^{N} g (𝐱_{i})] = \frac{V}{N} \sum_{i = 1}^{N} 𝔼 [g (𝐱_{i})] = V \cdot 𝔼 [g (\vec{X})] = I$

נחשב את המשערך חסר ההטייה ${\hat{σ}}_{N}^{2}$ של השונות^[6] $𝕍 [g (\vec{X})]$

{\hat{σ}}_{N}^{2} \equiv \frac{1}{N - 1} \sum_{i = 1}^{N} (g (𝐱_{i}) - I)^{2}

והשונות של המשערך

Q_{N}

$𝕍 [Q_{N}] = 𝕍 [\frac{V}{N} \sum_{i = 1}^{N} g (𝐱_{i})] = \frac{V^{2}}{N^{2}} \sum_{i = 1}^{N} 𝕍 [g (𝐱_{i})] = \frac{V^{2}}{N} \cdot 𝕍 [g (\vec{X})] \approx V^{2} \frac{{\hat{σ}}_{N}^{2}}{N}$

ולבסוף נקבל, כי שורש השגיאה הריבועית ממוצעת, ע״פ משפט 6.9 של^[7] והיעדר ההטייה של $Q_{N}$ הוא

$RMSE (Q_{N}) = \sqrt{𝕍 [Q_{N}] + bias (Q_{N})} = \sqrt{𝕍 [Q_{N}]} \approx V \frac{σ_{N}^{2}}{\sqrt{N}}$

דוגמה: שערוך הערך $π$ ע״י חישוב שטח מעגל היחידה

הדגמה נפוצה של השיטה היא שערוך הערך $π$ ע״י חישוב שטח מעגל היחידה $𝕊^{1}$ . על אף שזו אינה דרך יעילה לחשיוב הערך של $π$ , היא מדגימה את השיטה.

בשביל לחשב את $π$ ניתן לחשב אינטגרל על התחום $[- 1, 1] \times [- 1, 1]$ של פונקציית האינדיקטור של מעגל היחידה $𝟏_{S^{1}}$ המוגדרת להיות

$𝟏_{S^{1}} (x, y) = {\begin{matrix} 1 & if x^{2} + y^{2} \leq 1 \\ 0 & else \end{matrix}$ ומכך מקבלים:

$π = area (S^{1}) = \int_{S^{1}} d 𝐱 = \int_{[- 1, 1]^{2}} 𝟏_{S^{1}} d 𝐱$

והמשערך יהיה

$Q_{N} (π) = \frac{V}{N} \sum_{i = 1}^{N} g (𝐱_{i}) = \frac{vol ([- 1, 1]^{2})}{N} \sum_{i = 1}^{N} 𝟏_{S^{1}} = 4 \cdot \frac{# {samples in S^{1}}}{# {total samples}}$

כלומר למעשה, החישוב נעשה ע״י דגימת נקודות בריבוע היחידה $[- 1, 1]^{2}$ , ספירה של הנקודות שנופלות בתוך מעגל היחידה, חלוקה במספר נקודות הדגימה הכולל (תחולת האינטגרנד) והכפלה בנפח ריבוע היחידה.

מימוש ההדגמה בשפת פייתון:

import numpy as np

### parameters
# number of samples
N = 1e6

# generate N uniform random points inside the unit cube [-1, 1] x [-1, 1]
X = np.random.uniform(low=-1, high=1, size=(int(N), 2))
domain_volume = 4  # unit cube area.

# mask for points inside the unit circle - equivalent to applying the indicator function of the unit circle.
distance = np.sqrt(X[:, 0] ** 2 + X[:, 1] ** 2)
inside_mask = distance <= 1  # array of booleans.

# compute the mean of the indicator function over the domain and multiply by the domain volume to get the integral value.
indicator_mean = np.sum(inside_mask) / N
integral_value = indicator_mean * domain_volume

ניתן כמובן לשערך את הערך

π

בעזרת חישוב שטחם של מעגלים בעלי רדיוס שונה מ-1

יתרונות וחסרונות

תבנית:תמונות מרובות יתרונות

פשטות - להבנה ומימוש - השיטה אינטואיטיבית ודי פשוטה למימוש כפי שניתן לראות בקוד לעיל.
היעדר תלות בממד^[8]תבנית:הערה - שיטות אינטגרציה נומרית אחרות (תרבוע גאוסיאני ושיטת סימפסון תבנית:אנ לדוגמה) מחלקות את תחום האינטגרציה לרשת בדידה בעלת $N$ נקודות, בהן הפונקציה מופעלת. כאשר ממד האינטגרל גדול מאחד $d \geq 1$ אנו מקבלים גידול אקספוננציאלי במספר הנקודות מאחר שעלינו לחלק את התחום לרשת בדידה בכל ממד כלומר - $N^{d}$ נקודות. שיטת מונטה לעומת זאת, דוגמת $N$ נקודות במרחב הרב ממדי כולו ולכן אינה סובלת מ״קללת הממד״תבנית:אנ

חסרונות

התכנסות איטית - כאמור, השגיאה הריבועית ממוצעת דועכת בקצב $O (\frac{1}{\sqrt{N}})$ כתלות במספר הדגימות $N$ .
אינה דטרמיניסטית - בעלת מרכיב אקראי (דגימת הנקודות) - בשונה משיטות אינטגרציה נומרית רשתיות כגון שיטת הטרפז תבנית:אנ שמחלקות את תחום האינטגרציה לרשת בדידה דטרמיניסטית, שיטת מונטה קרלו דוגמת אקראית נקודות בתחום האינטגרציה. צורת הדגימה של הנקודות חשובה מאוד. לדוגמה, לא נרצה לקבל מעיין ״גוש״ נקודות קרובות אחת לשנייה (איור 1), אלא דגימה אחידה במרחב ע״מ לקבל כיסוי מספיק של התנהגות הפונקציה בתחום. נוסף על כך, אקראיות השיטה תאלץ אותנו לחזור על חישובנו מספר רב של פעמים על מנת ליצור סטטיסטיקה מספקת על התוצאות ולהשתמש ברווח בר-סמך ו/או מבחנים סטטיסטים.

וריאציות

דגימת שכבות רקורסיבית

תבנית:הפניה לערך מורחב

הכללה של אינטגרציה מסתגלת תבנית:אנ לשיטת מונטה קרלו. כאשר בכל חזרור, אם הדיוק המתקבל אינו עומד בדיוק הרצוי, תחום האינטגרציה מחולק ל-2 תתי תחומים, אשר עליהם נעשית האינטגרציה, בצורה איטרטיבית. החלוקה תעשה לתחומים בהם שונות הפונקציה היא הגדולה ביותר על מנת להביא לכיסוי טוב יותר של התחום באזורים חשובים אלה.

כאשר האינטגרל הוא רב ממדי, חלוקה של כל ממד ל-2 תגדיל את מספר הנקודות בצורה מעריכית, לכן החלוקה תעשה בממד בו חלוקה נוספת תביא להקטנת השגיאה המשמעותית ביותר.

ניתן להרחיב על דגימת שכבות רקורסיבית ואלגוריתם MISERתבנית:אנ המממש אותה.

דגימת חשיבות

שגיאה יחסית של חישוב ערך האינטגרל של פעמון גאוסיאני **סטנדרטי** בתחום האינטגרציה $[- 50, 50]$ כתלות במספר הדגימות $N$ . מדגיש את עליונות אלגוריתם וגאס תבנית:אנ אשר דוגם פחות נקודות בקצוות התחום (מאחר שחשיבותן נמוכה מאוד) לעומת דגימה אחידה על התחום האינטגרציה.

בדומה לאלגוריתמים דטרמיניסטים כגון שיטת סימפסון תבנית:אנ, נקודות בעלות ערך שונה בהרבה מסביבתן, אשר משפיעות על הערך הסופי של האינטגרל, עלולות ״להתפספס״ כנקודות דגימה ולהשפיע לרעה על התוצאה הסופית. לכן ישנה חשיבות רבה על נקודות הדגימה עצמן, הדרך בהן הן נבחרות.

השיטה ״הנאבית״ פשוטה להבנה ומימוש, הנקודות נבחרות בצורה שרירותית ע״י דגימה אחידה על תחום האינטגרציה, ללא התייחסות לחשיבותן בתוצאה הסופית. וריאציות של השיטה מסוג "דגימת חשיבות" מציעות צורת דגימה אחרת.

דוגמה טובה לכך היא חישוב האינטגרל המסוים של פעמון גאוסיאני סטנדרטי בעל תוחלת $μ = 0$ וסטיית תקן $σ = 1$ על התחום $[- 50, 50]$ . כאשר נשתמש בשיטה הנאיבית, מאחר שהדגימה אחידה על התחום, יתקבלו נקודות דגימה רחוקות ממרכז הפעמון ( $0$ ) למרות היותן בעלות חשיבות נמוכה עד זניחה עבור חישוב האינטגרל שהרי עבור $| x | \geq 3$ (3 סטיות תקן) ערך הפונקציה קטן מ- $5 \cdot 1 0^{- 3}$ . אי לכך, רצוי להתמקד בדגימה באזורים בהם הנקודות בעלות חשיבות גבוהה (סביב מרכז הפעמון בדוגמה לעיל). רעיון זה ממומש, לדוגמה, באלגוריתם וגאס ^[9] ^[10] ^[11]תבנית:אנ.

מימוש בקוד

קוד פייתון כללי כאשר הפונקציה ותחום האינטגרציה ידועים, והתחום הוא מלבן רב ממדי:

import numpy as np
from typing import Callable


def monte_carlo_integration(
    domain: np.ndarray, N: int, f: Callable[[np.ndarray], float]
) -> float:
    """monte_carlo_integration

    Args:
        domain (np.ndarray): d-dimensional domain - [a_i, b_i] x ... x [a_d, b_d] - represented as a 2 x d numpy array.
        N (int): number of random points to generate.
        f (Callable[[np.ndarray], float]): function to integrate that receives a d-dimensional point and returns a float.

    Returns:
        float: integral value of f over the domain.
    """

    # generate N uniform random points - a random matrix of size N x d with each row representing a random point.
    # first column of the domain holds the lower bounds and the second column holds the upper bounds.
    X = np.random.uniform(
        low=domain[:, 0], high=domain[:, 1], size=(N, domain.shape[1])
    )

    # evaluate the function at the random points
    f_values = np.apply_along_axis(func1d=f, axis=1, arr=X)

    # compute the domain volume and final integral
    domain_volume = np.prod(domain[:, 1] - domain[:, 0])
    integral_value = np.mean(f_values) * domain_volume

    return integral_value


# Example usage with unit circle
domain = np.array([[-1, 1], [-1, 1]])
N = 1e6
f = lambda arr: np.where(np.linalg.norm(arr) <= 1, 1, 0)
integral_value = monte_carlo_integration(domain, N, f)

בנוסף, קיימות דוגמאותתבנית:הערה וספריות ^[12] פייתון שממשות גרסאות שונות של האלגוריתם.

קישורים חיצוניים

תבנית:MathWorld

הערות שוליים

תבנית:הערות שוליים

[1] תבנית:צ-מאמר

[2] תבנית:צ-מאמר

[3] תבנית:צ-מאמר

[4] תבנית:צ-מאמר

[5] תבנית:קישור כללי

[6] תבנית:צ-ספר

[7] תבנית:צ-ספר

[8] מצגת על אינטגרציה רב ממדית וצורות דגימה שונות

[9] תבנית:צ-מאמר

[10] תבנית:Citation

[11] תבנית:צ-מאמר

[12] חבילת פייתון שממשת את אלגוריתם vegas

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

אינטגרציית מונטה קרלו

תוכן עניינים

רקע

הערכת השגיאה

דוגמה: שערוך הערך $π$ ע״י חישוב שטח מעגל היחידה

יתרונות וחסרונות

וריאציות

דגימת שכבות רקורסיבית

דגימת חשיבות

מימוש בקוד

קישורים חיצוניים

הערות שוליים

תפריט ניווט

אינטגרציית מונטה קרלו

רקע

הערכת השגיאה

דוגמה: שערוך הערך π ע״י חישוב שטח מעגל היחידה

יתרונות וחסרונות

וריאציות

דגימת שכבות רקורסיבית

דגימת חשיבות

מימוש בקוד

קישורים חיצוניים

הערות שוליים

תפריט ניווט

חיפוש

דוגמה: שערוך הערך $π$ ע״י חישוב שטח מעגל היחידה