WebDB Forum 2010 で「国際化時代の40カ国語言語判定」を発表しました #webdbf2010

11月11〜12日に早稲田大学 理工学院にて行われた Webとデータベースに関するフォーラム (WebDB Forum 2010) に参加してきました。
サイボウズが本フォーラムのシルバースポンサーを務めており、そちらの関係から 12日の技術報告セッションにおいて「国際化時代の40カ国語言語判定」と題し、以前開発したオープンソースの言語判定ライブラリについて発表させていただきました。


発表に用いましたプレゼンテーション資料はこちらです。*1
発表時は口頭で加えていた注釈のいくつかを追加してあります。



なお、ご紹介した言語判定ライブラリ for Java はこちらです。


本ライブラリは「第2回 自然言語処理勉強会@東京」にて一度発表しており、今回の発表はそのときの内容と基本的には同じとなっています。が、発表の時間などの関係からアルゴリズムの詳細や、文字や言語についての一般的な知識のまとめなどを省略しておりますので、もしそのあたりにご興味あれば、以前の発表資料もご参照ください。


また、サイボウズ技術評論社さんが共催する「エンジニアの未来サミット for student」について、発表の中でほんの少しお時間をいただいて宣伝させていただきました。第一線級のエンジニアがエンジニアになると言うのはどういう事か学生さん向けに語るというなかなかない機会だろうと思います。
エンジニアという仕事に興味のある方、今回のような成果をオープンソースとして公開できちゃうサイボウズという会社に興味のある方(言語判定ライブラリの他にも様々な成果物をオープンソースとして公開しています!)は是非ご参加を検討してもらえると嬉しいです。

*1:いつもなら、後から資料単独で見る人にはあまりいらないかなあと、資料から自己紹介や宣伝は削って公開するんですが、今回は文脈上付いていた方がいいかと思って残してあります。