条件付き確率分布

確率論において、条件付き確率分布(じょうけんつきかくりつぶんぷ、: conditional probability distribution)とは、確率変数 XY があり、X の値が特定の値であることを知ったときの Y確率分布のことである。

条件付き累積分布関数・条件付き確率質量関数・条件付き確率密度関数などから、条件付き確率条件付き期待値などが計算できる。

条件付き累積分布関数

確率変数 X と事象 A が与えられたときに の時に条件付き累積分布関数(conditional cumulative distribution function)は以下のように定義する[1]:p. 97

条件付き離散確率分布

離散確率変数の場合、条件付き確率質量関数(conditional probability mass function)は の時に以下のように定義する。

条件付き連続確率分布

連続確率変数で連続確率分布の場合、条件付き確率密度関数(conditional probability density function)は の時に以下のように定義する。

は X と Y の同時分布で、周辺分布である。

X と Y の確率密度関数は以下の関係が成立する。

連続確率分布の条件付き分布の概念は見た目よりも直観的では無い。 の時、ボレル-コルモゴロフのパラドックス英語版は座標変換に対して確率密度関数が必ずしも不変では無いことを示している。

写像の条件付き確率分布表現

条件付き確率分布 は確率論的(: stochastic)な の対応付けを表現する[2]。一方で写像 は決定論的(: deterministic)に(一意な) の対応付けを表現する。この写像は条件付き確率分布でも以下のように表現できる[3]

すなわちディラックのデルタ関数 を用いた 点でのみ非ゼロの値をもつ確率密度関数として表現できる。

参照

  1. ^ Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3 
  2. ^ "stochastic ... mapping from input X to a novel representation Y ... mappings q(Y|X)" Vincent. (2010). Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion.
  3. ^ "a deterministic mapping from X to Y, that is, representation Y is to be computed by ... q(Y|X;θ) = δ(Y − fθ(X)) (where δ denotes Dirac-delta)" Vincent. (2010). Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion.