בערך זה נעשה שימוש בסימנים מוסכמים מתחום המתמטיקה. להבהרת הסימנים ראו סימון מתמטי .
גרף התפלגות נורמלית תקנית מצטברת (אדום) וגרף של פונקציית התפלגות מצטברת אמפירית (כחול) שחושב מתוך מדגם של 50 תצפיות מתוך התפלגות נורמלית תקנית. התצפיות מסומנות בקווים ירוקים
בסטטיסטיקה , פונקציית התפלגות מצטברת אמפירית היא פונקציה שמחושבת מתוך מדגם ונועדה לאמוד את פונקציית ההתפלגות המצטברת של משתני המדגם. פונקציה זו היא פונקציית מדרגות מונוטונית לא יורדת . משמאל לערך המדגם הנמוך ביותר היא שווה ל-0. מימין לערך המדגם הגבוה ביותר, היא שווה ל-1. בכל ערך מדגם היא גדלה ב-
1
n
{\displaystyle {\frac {1}{n}
, כאשר
n
{\displaystyle n}
הוא גודל המדגם.
לפי משפט גליבנקו-קנטלי , ההתפלגות האמפירית מתכנסת ב מידה שווה כמעט בוודאות להתפלגות משתני המדגם.
הגדרה
נתון מדגם מקרי של משתנים מקריים שווי התפלגות ובלתי תלויים ,
X
1
,
…
,
X
n
{\displaystyle \ X_{1},\dots ,X_{n}
. פונקציית ההתפלגות המצטברת האמפירית של המדגם מוגדרת באמצעות,
F
^
n
(
x
)
=
1
n
∑
i
=
1
n
1
(
−
∞
,
x
]
(
X
i
)
{\displaystyle {\widehat {F}_{n}(x)={\frac {1}{n}\sum _{i=1}^{n}1_{(-\infty ,x]}(X_{i})}
כאשר הפונקציה המציינת
1
(
−
∞
,
x
]
{\displaystyle \ 1_{(-\infty ,x]}
מחושבת באופן הבא,
1
(
−
∞
,
x
]
(
t
)
=
{
1
if
t
∈
(
−
∞
,
x
]
0
if
t
∉
(
−
∞
,
x
]
{\displaystyle 1_{(-\infty ,x]}(t)=\left\{\begin{matrix}1&{\mbox{if}\ t\in (-\infty ,x]\\0&{\mbox{if}\ t\notin (-\infty ,x]\end{matrix}\right.}
תכונות האומד
עבור כל נקודה
x
{\displaystyle x}
, כל אחד מהמשתנים המקריים
1
(
∞
,
x
]
(
X
i
)
{\displaystyle 1_{(\infty ,x]}(X_{i})}
מתפלג ברנולי עם פרמטר
F
(
x
)
{\displaystyle F\left(x\right)}
, ולכן הסכום שלהם הוא משתנה מקרי בינומי ,
∑
i
=
1
n
1
(
∞
,
x
]
(
X
i
)
∼
B
(
n
,
F
(
x
)
)
{\displaystyle \sum _{i=1}^{n}1_{(\infty ,x]}(X_{i})\sim {\textrm {B}\left(n,F(x)\right)}
.
מכאן ניתן לחשב את התוחלת ואת השונות של
F
^
n
(
x
)
{\displaystyle {\widehat {F}_{n}(x)}
. האומד
F
^
n
(
x
)
{\displaystyle {\widehat {F}_{n}(x)}
הוא אומד חסר הטיה של
F
(
x
)
{\displaystyle \ F(x)}
, כלומר,
E
[
F
^
n
(
x
)
]
=
F
(
x
)
{\displaystyle E\left[{\widehat {F}_{n}(x)\right]=F(x)}
.
השונות היא,
V
a
r
(
F
^
n
(
x
)
)
=
F
(
x
)
(
1
−
F
(
x
)
)
n
{\displaystyle \ Var\left({\widehat {F}_{n}(x)\right)={\frac {F(x)(1-F(x))}{n}
.
לפי החוק החזק של המספרים הגדולים ,
F
^
n
(
x
)
{\displaystyle {\widehat {F}_{n}(x)}
מתכנס כמעט בוודאות ל-
F
(
x
)
{\displaystyle \ F(x)}
ולכן הוא אומד עקיב .
לפי משפט גליבנקו-קנטלי,
F
^
n
(
x
)
{\displaystyle {\widehat {F}_{n}(x)}
מתכנס כמעט בוודאות ל-
F
(
x
)
{\displaystyle \ F(x)}
, באופן אחיד על הממשיים.
כלומר,
sup
x
∈
R
|
F
^
n
(
x
)
−
F
(
x
)
|
→
a.s
0
{\displaystyle \ \sup _{x\in \mathbb {R} }{\big |}{\widehat {F}_{n}(x)-F(x){\big |}{\xrightarrow {\text{a.s}0}
.
לפי משפט הגבול המרכזי יש ל-
F
^
n
(
x
)
{\displaystyle {\widehat {F}_{n}(x)}
התפלגות אסימפטוטית נורמלית,
n
(
F
^
n
(
x
)
−
F
(
x
)
)
→
d
N
(
0
,
F
(
x
)
(
1
−
F
(
x
)
)
)
{\displaystyle \ {\sqrt {n}{\big (}{\widehat {F}_{n}(x)-F(x){\big )}{\xrightarrow {d}{\mathcal {N}{\Big (}0,F(x){\big (}1-F(x){\big )}{\Big )}
.
קישורים חיצוניים