9/5 の「パターン認識と機械学習」(PRML)読書会に のこのこ参加してきました。
昨年の6月から参加してきた PRML読書会も、17回目の今回で最終回。ほんとお疲れ様でした>各位。
今回は13章後半の線形動的システム(LDS, カルマンフィルタ)から、14章の終わりまで。
カルマンフィルタやパーティクルフィルタは専門家がいたので、応用範囲とかいろいろ聞いてみたり。
パーティクルフィルタはなかなか面白そうだけど、自然言語処理には使うところなさそうなのが残念。超解像とかに手を延ばしたら縁ができるのかな? って、興味はあるけどさすがになあ……。
【追記】
コメント欄にて、持橋さんが文脈推定問題にパーティクルフィルタを持ち込んだお仕事を、id:syou6162 さんに教えていただいた。
- http://chasen.org/~daiti-m/paper/nl165pf-slides.pdf (プレゼン資料)
- http://chasen.org/~daiti-m/paper/nl165pf.pdf (論文)
自然言語処理は基本的に有限な離散分布なので、パーティクルフィルタ使う余地なさそうと早合点していたけど、なんでも決めつけるのは良くないんだなあ。やっぱり。
【/追記】
コミッション(バギング/ブートストラップ)は普通に使いそう。というか、今使ってる。
実際に適用してみた感触は、精度があがるというより、使っている判別器の性能の範囲で良い方に安定する(まさに「バリアンスが小さくなる」)感じ。
結果のばらつきを抑えたいときには有効な手法なのだろう。
線形動的システムとか AdaBoost あたりはちょっと実装してみたかったんだけど、なんか時間がなくてアウト。
もう自然言語処理にシフトしてきてるからなあ、とあきらめつつ、Collocations まわりも試してみたいのに手つかずなのを思い出した。あれれぇ? そう言えば最近あんまり小ネタ実装してないな。
で、最近の時間の使い方をつらつら思い返してみたら、原稿のせいやった(苦笑)。
最後は、PRMLの翻訳の仕掛人であり、twitterやブログでPRMLについての疑問を呟やくと、どこからともなく表れてコメントを返してくださる神嶌先生(@shima__shima さん)が「PRMLの翻訳ができるまで」の特別基調講演。
企画を通すところから、翻訳担当者のリクルート、訳語の選定と、やはりご苦労の連続だったそうで。
この読書会と同じく naoya_t さん主催のもと、PRML読書会の2周目(復習レーン)が平行して始まっている。
復習といっても初参加の人が大半だけど、読書会1周目の完走者もそこそこ参加しており、ノウハウ(どういうところで詰まりやすいか等)が蓄積された安心感のある読書会ということもあってか、参加者は毎回40人前後と非常に多い。
この難易度の教科書の、それも自主的な読書会にこんなに集まるというのは、「機械学習これから流行るぞ!」と感じている人が結構いるんだな、ということもあるだろうけど、それもこれも PRML が翻訳されていればこそ。
原書読書会だったら、さすがにこんなには集まらなかっただろうなあ。
こちらも読書会がきっかけだったが、"Working Effectively with Legacy Code"(邦題:「レガシーコード改善ガイド」)の翻訳の際に、苦労話を伺ったり、訳語の候補を考えるのをちょびっとだけお手伝いしたり、といったことが。
レガシーコード本もとても大変だったというお話を聞いていたので、専門書の翻訳を手がけられている人には足を向けて寝られない。ほんと。
自分のことで言うと、機械学習についても統計的手法についても、1年半前はずぶの素人だったのが、PRML と読書会のおかげで機械学習の論文をいくつか読めるところまで来た。
もちろん PRML これ1冊で全て事足りるなんてあるわけないし、まだまだ力不足は びしばし感じるけれど、機械学習の入り口に立てたのは間違いなく PRML と読書会のおかげ。
というわけで、PRML に携わられた方々、読書会を主催・運営・参加された方々に大感謝。これからもよろしく。