これは パターン認識と機械学習(PRML)読書会 #7 (5章 ニューラルネットワーク 後半) での発表用の資料「5.7 ベイズニューラルネットワーク」です(作成中)。
はてP でプレゼン資料になります。
細かい説明/計算やサンプルは読書会にて板書します。
はてP でプレゼン資料になります。
細かい説明/計算やサンプルは読書会にて板書します。
5.7.3 クラス分類のためのベイズニューラルネットワーク
- クラス分類の場合の hyperparameter αを推定したい
- 出力用活性化関数が線形ではない&値域が限定されるため、5.7.2 とは少し違う
- ベイズロジスティック回帰(PRML 4.5)のニューラルネットワーク版
クラス分類の場合の likelihood function:
, where
- は正しくラベル付けされていると仮定⇒精度を指す hyperparameter βは現れない
prior:
error function:
より、5.7.2 と同様に共役勾配法や backprop. を駆使して w_MAP を見つける。
αの推定
(★結果は PRML5.7.2 と同等)
evidence:
とおいて (4.135) を用いる。
これを最大化するαは
⇒ w_MAP を再度求める(反復)
周辺予測分布 p(t|x,D)
このままでは計算できないので近似
- (1) posterior p(w|D) は幅が狭い
- (2) 出力ユニットの activation a=a(x,w) について w_MAP で1次までテーラー展開 (PRML4.5.2)
- ⇒ p(a|x,D) を周辺化して p(t|x,D) を得る
出力ユニットの activation a=a(x,w) を線形近似
where
PRML4.5.2 より
where δ:Dirac's delta function
これより平均と分散を求めると , where であることがわかる
marginal predictive
これを求めるためにプロビット関数の逆数とかなんとかかんとかして(PRML4.5.2)
,
where *1
- ★とPRMLには書いてあるが、計算すると になる。本が間違っている?