夏のプログラミングシンポジウムで「数式を綺麗にプログラミングするコツ」を発表してきました

8/25 に開催された夏のプログラミングシンポジウム 2013 にて、「数式を綺麗にプログラミングするコツ」というお話をさせてもらいました。運営、発表に携わった&参加者のみなさん、会場のドリコムさん、お疲れ様でした&ありがとうございました。お水おいしかったです。

こちらが発表資料。

www.slideshare.net

この発表、実は一昨年に Tokyo.SciPy #2 でやらせてもらった「数式を numpy に落としこむコツ」のブラッシュアップ版である。

変更点は R のサンプルコードの追加と、表現をよりわかりやすくリライトしたという2点であり、紹介されているサンプルも含め本質的にはほぼ同じ内容である。手抜きっぽくてごめん。
本当は他の例を追加したかったのだけど、なにぶん観測範囲が狭くて、紹介にちょうどいい例(難しすぎず、易しすぎず)を機械学習ネタ以外で見つけることが出来ず。これ以上 PRML からネタを引っ張ってくると、「ふーん、これって機械学習限定なのね」みたいな空気になってしまうんじゃあないかと。
まあ発表時間的に3例は難しいというのも。


他の例も見てみたいという方には、こちらの記事で同じく PRML 13章の隠れマルコフモデルの推論に出てくる Baum-Welch の更新式を、「コツ」にしたがって誰でも実装できる形に書き直す手順を追っかけているのでよろしければ。


言いたいことは「紙と鉛筆が最強」なので、最悪それだけでも。
こういうプログラミングがすご〜く得意な人は、ロジスティック回帰の更新式だろうが Baum-Welch だろうが、式を10秒ぐらいじーっと見つめたら、ぴらっとコードを書けてしまったりするんだけど、そんなのは誰にでもできることではないので真似しちゃあダメ。




他の方の発表もいろいろ楽しませていただいたが、中でも JFEスチール 茂森氏の発表がおもしろかった。
でもこれってプロシンっぽくないんでは〜とちょっと心配したが、twitterドメイン知識の大切さがよくわかったといったような感想が続出しているところを見て、ああなるほど、プロシンでやる意味があったんだなあと実感。


実務でデータ解析をしようと思ったら、ドメイン知識バリバリの人でないとモデルもルールも書けない&超絶泥臭い努力の積み重ねの固まりというのは、テキストマイニングシンポジウムとかに行って、企業の方の発表とか聞くとめちゃめちゃ実感させられるので、今回のプロシンで蒙を啓かれてしまった! もっとそういう話を聞きたい! という人は行ってみると幸せになれるかも。
え? ちょうど再来週に第3回のテキストマイニングシンポジウムがあるんだ。へー(ステマ……じゃあないよ、別に)