Tokyo.SciPy #2 で「数式を numpy に落としこむコツ」を話します

Tokyo.SciPy #2 っていう、Python で numpy と scipy について語り合う勉強会があって、第1回には残念ながら行けなかったので、第2回に のこのこ参加予定。
で、発表枠がまだ空いていたので、(例によって)何を話すかはおいといて手を挙げてみた(笑)。


最初「LDA の numpy 実装について、とつとつと語り明かす」なあんてのもいいかも、とか思ってたんだけど、参加者層的に誰得すぎる。
というわけで、もう少し汎用的なところを狙って、「数式を numpy に落としこむコツ 〜機械学習を題材に〜」という話をしてみようと思う。


機械学習を実装するとき、まずは数式(あるいは数式入りのアルゴリズム)を導出して、それを実装に落とすという手順を踏むわけだが、導出のところはバッサリ無視して、あくまで「この数式をどうやって numpy の実装に落とすか」というところに注目してみようという企画。
こういうイメージ。



Tokyo.SciPy は、機械学習に興味のある参加者が比較的多そうな印象を勝手に持っているんだけど、それでもさすがに全員ではないだろう。
一方、「数式を実装に落とす」という部分については、恐らく参加者全員にとってストライクだろうと期待。

単純に数式をこんなふうに実装してみました、というだけではなく、ここに気をつけようとか、実装への落とし方は全然一通りではないわけで、拡張性重視ならこういう風にに実装できるよとか、とりあえず1回動けばいいだけならこういう書き方が確実で手っ取り早い(悩む時間がもったいないよね!)とか、なんかそういう話が出来たらなあとか考えてる。


って、まだ全然準備できてないので、実は事前アナウンスして尻に火を付けるメソッドなのだけど(苦笑)。


底本は、ワンパターンでほんとすんませんが、「パターン認識機械学習」(PRML)になる予定。
SVM とかまだ実装してみたこと無いのでそれもいいかなあとかパラパラめくってみたけど、SMO とか載ってないから PRML だけじゃあ実装できねー。