やがてめぐになる

さんすうとえいごのおべんきょうブログ。ほかにもかきたいことをかきます。

条件付き確率

先週習ったので、忘れないうちにまとめたいと思います。

条件付き確率の定義

まずは最も基本的な条件付き確率の定義から。
 (\Omega,\mathcal{F},P)を確率空間とします。
 A,B\in\mathcal{F} P(B)>0として、 Bを与えたときの Aの条件付確率は
\begin{align*}
P(A|B)=\frac{P(A\cap B)}{P(B)}
\end{align*}
です。

 \sigma-加法族に関する条件付き確率(期待値)

 \mathcal{G}\subset\mathcal{F} \sigma-加法族、 X\in L^1(P)とします。
このとき、集合関数  \mathcal{F}\ni A\mapsto E[X;A] :=E[X\boldsymbol{1}_A] は符号付き測度となり、 Pに関して絶対連続になります。
よって、ラドン-ニコディムの定理より、ある \mathcal{G}-可測な Y\in L^1(P)がa.s.の意味で一意に存在して、
\begin{align*}
E[X;A]=E[Y;A]
\end{align*}
となります。
この Y \sigma-加法族 \mathcal{G}に関する Xの条件付き期待値といい、 E[X|\mathcal{G}]とかきます。
 A\in\mathcal{F}に対して、 E[\boldsymbol{1}_A|\mathcal{G}]を \mathcal{G}に関する Aの条件付き確率といい、 P(A|\mathcal{G})とかきます。
条件付き期待値は線型性など通常の期待値が持つ性質が成り立ちます。

確率変数に1点を与えた条件付き確率/期待値

マルコフ性をいう場合などで、条件付き期待値 E[X|Y=y]などを見ることがあります。
しかし、例えば Yが連続型分布のときは P(Y=y)=0となってしまうため、上で述べた基本的な条件付き期待値は定義できません。
以下では、 Yを実数値関数とします。
集合関数 \mathcal{B}(\mathbb{R})\ni A\mapsto E[X;Y\in A]は Yの分布 P^Yに関して絶対連続であるので、ラドン-ニコディムの定理より、あるボレル可測な f_X\in L^1(\mathbb{R},\mathcal{B}(\mathbb{R}),P^Y) P^Y-a.s.の意味で一意に存在して、
\begin{align*}
E[X;Y\in A]=\int_A f_X(y)P^Y(dy)
\end{align*}
となります。
この f_X(y) E[X|Y=y]とかき、 X Y=yに関する条件付き期待値といいます。

条件付き期待値の注意

さて、この条件付き期待値、注意しないといけないのは1つの確率変数ごとにa.s.の意味で定義されるということです。
例えば、互いに素な A_1,A_2,\dots\in\mathcal{F}に対して P(\bigcup_{j} A_j|\mathcal{G})=\sum_{j}P(A_j|\mathcal{G})のようなことをする場合は注意が必要だということです。
条件付き期待値は被積分確率変数1つに対し1つの除外零集合を除き定義されるという点を常に意識しなければなりません。
上のはまだ可算個なので大丈夫なのですが、可算濃度を超えたときはどうなのでしょうか。
例えば、
\begin{align}
\int_0^u E[X_t|\mathcal{G}] dt = E\left[ \left. \int_0^u X_t dt \right| \mathcal{G} \right] \tag{1}
\end{align}
というような操作はまずいです。
何がまずいかというと、 tに依存しない除外零集合を1つ取ってこれるか分からないという点です。
また、そもそも t\mapsto E[X_t|\mathcal{G}]は可測ですか?ということも問わなければなりません。

この場合は、 ([0,\infty),\mathcal{B}([0,\infty)),e^{-t}dt) (\Omega,\mathcal{F},P)の直積確率空間を考えることで、 \mathcal{B}([0,\infty)) \otimes \mathcal{G}に関する条件付き期待値が e^{-t}dt\times dP-a.s.の意味で定義できて、可測性も問題なくいえるため、(1)のようなことができるようになります。

ただ、この場合はたまたまこういう回避策があったものの、別の場合に一斉に除外零集合を取る必要に迫られた場合、やっかいなことに依然変わりありません。
要するに、上で述べた \sigma-加法族 \mathcal{G}に関する条件付き確率 P(\cdot|\mathcal{G})が1つの除外零集合を除いて定義される (\Omega,\mathcal{F})上の確率測度であれば、これまで上で懸念したような問題が解決します。
このスマートな方法が次に述べる正則条件付き確率と呼ばれるものです。

正則条件付き確率

 p(\omega, A) \mathcal{G}に関する正則条件付き確率とは、次の(1)~(3)を満たすものです。
(1)固定した \omega\in\Omegaに対し、 \mathcal{F}\ni A \mapsto p(\omega,A) (\Omega,\mathcal{F})上の確率測度
(2)固定した A\in\mathcal{F}に対し、 \Omega\ni\omega\mapsto p(\omega,A) \mathcal{G}-可測
(3)任意の A\in\mathcal{F} B\in\mathcal{G}に対し、
\begin{align*}
P(A\cap B)=\int_Bp(\omega,A)P(d\omega)
\end{align*}


正則条件付き確率は確率空間が“よい”空間であればある除外零集合 Nを除いて一意に存在することが知られています。
これを用いると、 N^c=\Omega\setminus N上で \int X(\omega')p(\omega,d\omega') E[X|\mathcal{G}] (\omega)と定めることができます。
1点を与えたときの正則条件付き確率についても同様です。