指数型分布族とはなんぞ その2
情報幾何の観点から指数型分布族を眺めるその2です.前回よりはもう少し内容のあることを書きたいと思います.前回のエントリーを書いた後に指数型分布族の空間におけるデータ解析法について(pdf)を見つけてとてもわかりやすいので死にたくなりました.でも,このエントリーではもう少し初歩的なことをまとめておきたいと思います.
前回,「指数型分布族とはexpの中身がに対して線形であるってこと?」みたいなことを書いたのですが,「指数型分布族とはexpの中身がに対して線形な項とポテンシャル関数で表せる」が正しい見方なのかなと思い至りました.
多項分布(簡単のため三項分布)による例
情報幾何的な視点で見るために,まず簡単な多項分布でその例を示します.三項分布モデルとは確率変数が1,2,3のいずれかの値を確率で取るモデルです.確率なのでが成り立ちます.なので,は実際は不要なので,と置き換えましょう.また,のとき1, のとき0となるクロネッカーのδとしてをおきます.
よって,繰り返し回数が1回の三項分布モデルの確率密度関数は
と書けます.対数尤度関数は
です.ここで,新たなパラメータとして
,
を導入します.これが何かということは後で説明するとして,このパラメータ変換の下での対数尤度関数を書き直すと,
と書くことができます.第一項がとの線形関数,第三項はのみの項ですが,この第三項をポテンシャル関数と呼ぶことにしましょう.このポテンシャル関数は次のような性質を持ちます.
よってポテンシャル関数をで偏微分することで確率が得られています.
双対平坦空間
情報幾何において,モデル多様体がどの程度曲がっているのかを評価する方法があるのですが,とりあえずそれは置いておいて,あるモデル多様体がe-接続の下で曲がっていない(平坦)とき,m-接続の下でも曲がっていない(平坦)であることが知られています.これは双対平坦空間と呼ばれ,非常に扱いやすく応用も広い空間です.
双対平坦空間において,計量とe-接続,m-接続が与えられているとき,はe-接続に対して平坦なので,e-接続の下でのアフィン座標系を取ることができます.同様に,m-接続に対しても平坦なのでm-接続の下でのアフィン座標系を取ることが可能なのですが,座標系と相性の良い座標系を取ることにします.
座標系から座標系への変換は計量に対して
を満たすの凸関数(ポテンシャル関数)を取ることができ,
が成り立ちます.このような座標変換をルジャンドル変換と呼びます.同様に
を定義すると,
が成り立ちます.このような関係性を双対座標系と呼びます.一般にを自然パラメータ,を期待値パラメータと呼びます.よって,指数型分布族とはこのような双対座標系で考えることができる確率分布族であると捉えることができるのかもしれません.ちなみに上記の多項分布の例における座標系はe-接続の下でのアフィン座標系になっています.
正規分布モデルによる例
最後に,正規分布を(指数型分布族として)双対座標系の観点から見てみることにします.正規分布は
であり,対数尤度関数は
と書けます.ここで,とおき,とおくことで,
と書き換えることができます.すると,これまでの議論より第三項はポテンシャル関数になっているはずです.なので,で偏微分してみると
となっていることが確認できます.つまり,上記のの置き方によってポテンシャル関数から期待値が導出され,これは双対関係にあるということです.この見方は単純にといったよく知られたパラメータで見るよりも見通しが良い場合もありえることを示しています.
まとめ
双対関係,超重要.