2010-01-01から1年間の記事一覧

混合ガウス分布の変分下界の計算式

やっぱりまじめに実装して確認しないと、ということで PRML 10.2.2 の変分下界の膨大な式、つまり (10.71)+(10.72)+(10.73)+(10.74)-(10.75)-(10.76)-(10.77) を変形&整理していったら、打ち消しあって消えて消えて、残ったのはたったこれだけ。 \tilde{π} …

PRML 復習レーンが始まるよ、だって。

この前の「パターン認識と機械学習(PRML)」読書会の後の懇親会で、「いや、機械学習は PRML が初めてで、読み始める前はガウス分布も共役事前分布も何それおいしいの? だったよ〜」と話して驚かれたことに驚いたのだが、でも本当にその通りなのだ。 PRML 読…

PRML 読書会 #13 10章 近似推論法(変分ベイズ)

参考:「機械学習とパターン認識」(PRML)のアンチョコ by herumi PRML 9章や10章の数式の解説ノート。10章の大変な計算も丁寧に展開してある。 4/10 の C.M.ビショップ「パターン認識と機械学習(PRML)」読書会 #13@サイボウズ・ラボ に参加しました。各位お…

PRML 読書会 #13 「10.2 変分混合ガウス分布」資料(2)

「パターン認識と機械学習」(PRML)読書会 #13 で担当する 10.2.1「変分事後分布」の資料の後半です。その1はこちら。 負担率 r_nk を求める q^*(π_k,μ_k,Λ_k) を推定したので、ρ(z_nk) の各項を計算できる。(B.21)より ψ(・) はディガンマ関数 (B.25) (B.81…

「Web を支える技術」出版! 記念トークセッション行ってきた

最近はすっかり機械学習なブログだが、何を隠そう実は @yohei さんの大ファン。 このブログにも以前は REST の話もちょっこりあったり無かったり。 twitter のアイコンは、ひそかに REST に由来するものだったり。 そんな n_shuyo としては、@yohei さんの「…

C++ でお手軽乱数(boost::random のラッパー)

C++ で乱数、特に正規乱数とか欲しいなあ。 rand() 関数は使っちゃダメ! 絶対! ということらしいので、boost::random を使ってみた。 が、なんでちょこっと乱数が欲しいくらいでそんなややこしいコード書かないといけないの!? と、キレたくなるほど複雑…

PRML 読書会 #13 「10.2 変分混合ガウス分布」資料(1)

「パターン認識と機械学習」(PRML)読書会 #13 で担当する 10.2「変分混合ガウス分布」と 10.2.1「変分事後分布」の資料です。その2はこちら。 10.1 で述べた変分ベイズ近似(Variational Bayesian)を混合ガウス分布の推論に適応する例を見る。X = {x_n} : 観…

Boost uBlas の疎行列で値がセットされているか判定

Boost uBlas で、mapped_matrix に値が入っているかどうかは find_element メソッドでわかる。 typedef boost::numeric::ublas::mapped_matrix<int> Matrix; const int N=3; Matrix m(N,N); m(0,2) = 0; m(1,0) = 2; m(2,1) = 1; std::cout << m << std::endl; fo</int>…

SVD/LSI の手触りチュートリアル

"Introduction to Information Retrieval" の18章に従って SVD(Singular Value Decomposition) と LSI (Latent Semantic Indexing) を試した。 といっても、原理は線形代数で固有値とか計算したことある人にはシンプルな話だし、実装は世にいくつもあるか…

NLP2010 行ってきた

ほとぼりがさめた頃に NLP2010(言語処理学会年次大会) に のこのこ行ってきた話など。 参加したのは、 3/8 のチュートリアルと、3/10 のポスターセッション(午後)。 チュートリアル午前はどちらも興味あったが、ちょうど協調フィルタ周りでいろいろ試してい…

多次元混合ガウス分布での incremental EM 更新式

計算してみた。 が、Σの式、ちょっと自信がないから実装する前に晒しとく。 [2010/03/15] Σの更新式が間違っていたので訂正(今度も絶対あってる自信はないが) x_m について更新するとき、 E step M step とおくと

PRML 読書会 #12 9章 EMアルゴリズム&10章 変分ベイズ

参考:「機械学習とパターン認識」(PRML)のアンチョコ by herumi PRML 9章や10章の数式の解説ノート。10章の大変な計算も丁寧に展開してある。 3/7 の C.M.ビショップ「パターン認識と機械学習(PRML)」読書会 #12@サイボウズ・ラボ に参加しました。各位お…

変分ベイズ実装(PRML 10.2)

「Old Faithful の推論を K-means と EM について、Rで実装」の続き。 【追記】実装にバグが見つかり、この記事の末尾の「うまく縮退しない」は間違いでした。→フォロー記事へ PRML 10章、変分推論(変分ベイズ)がいまいちわからない。 観測&隠し変数のハ…

EM アルゴリズム実装(勉強用)

最近忙しくて*1、PRML の予習が滞り中。 しかし、次の PRML 読書会に徒手空拳で行ったら、気持ちよく昇天してしまいそうなので、なんとか頑張って読んでみる。 EM アルゴリズムは何となくわかるが、変分ベイズがわからん……というわけで、Old Faithful の混合…

「パターン認識と機械学習」(PRML)読書会 #11 + R で K-means

2/6 に 「パターン認識と機械学習」(PRML)読書会 #11 @サイボウズ・ラボに のこのこ行ってきました。お疲れ様>各位 今回は8章「グラフィカルモデル」の後半+9章の K-means まで。 sum-product(積和アルゴリズム) や max-sum で、グラフィカルモデルが周…

iVoca で単語の難易度を取得する API を試験リリース(項目反応理論)

英単語タイピングゲーム iVoca にて、単語の難易度を取得する API を試験的に提供開始しました。 http://ivoca.31tools.com/api/wordlevel?word=[単語] にアクセスすると、単語の難易度データを JSON 形式で返します 指定できる単語は言語に寄りません。英語…

PRML 読書会 #11 資料(max-sum アルゴリズム)

「パターン認識と機械学習」(PRML)読書会 #11 で担当する 8.4.5「max-sum アルゴリズム」の資料です。 8.4.5 max-sum アルゴリズム 8.3 まで モデルを表現するツールとしてグラフィカルモデルを使う 8.4 以降、周辺化や同時分布の大域最大解を求めるツールと…

LSH(SimHash) で recall(適合率) を見積もりたい

英単語タイピングゲーム iVoca で「おすすめブック」機能をリリースしました。 ブック(単語帳)の画面に、そのブックと似ていて、同じユーザが学習しているブックを自動的に表示します。英検の単語を集めたブックには英検の、しかもだいたい同じレベルのもの…

「パターン認識と機械学習(PRML)」 読書会 #10 (8章 グラフィカルモデル 前半)

というわけで PRML 読書会 第10回 にも参加。 関係各位お疲れ様でした。 今回の第8章「グラフィカルモデル」は、最低限の必須前提知識が「確率の加法・乗法定理」だけ*1、計算式もほとんど無い(積分の具体的な計算は皆無!)。 途中参加するならココしか! …

「パターン認識と機械学習(PRML)」 読書会 #9 (7章 サポートベクトルマシン)

PRML 読書会 第9回@サイボウズ・ラボに会場係 兼 Chapter 7.2 担当として参加。 って、もう1ヶ月以上も前のことなので、簡単に。 RVM は名前を SVM に似せているだけの全く別物。むしろ線形回帰。「使われてるとしても、他の名前なんちゃう?」「あれ? R…