NLP2012 での発表資料「極大部分文字列を使った twitter 言語判定」

言語処理学会の第18回年次大会(NLP2012)での発表「極大部分文字列を使った twitter 言語判定」で使用した資料を公開します。

www.slideshare.net

論文は下記ページにて公開済み。

論文との変更点は、執筆時よりも対応言語がカタルーニャ語ハンガリー語の2言語増えて19言語になっており、結果も最新のものに差し変わっているところ。


なお本発表資料は TokyoNLP #8 での発表「∞-gram を使った短文言語判定」がベースとなっている。

発表時間が15分であること*1から本発表資料はコンパクトにまとめたものとしつつ、いわゆる知見的なところを加味したものとなっている。


残念ながら発表自体は成功と呼べる感じではなく、言語判定がメジャーな研究ではないことについて認識不足であった点などなど、いろいろ反省点の多いものだった。
そのあたり、言語処理学会に初めてのフル参加&初めての発表というあたりを勘案して大目に見ていただけると。
ま、次がもしあれば、活かされるかも?


その一点は置いといて、NLP2012 に参加させていただけたことは非常に楽しかった。今まで論文や twitter などで知るだけだった方を含め、多くの人に直接の知己を得られたし*2、このブログを読んでくださっている方々も思っていたより全然多くいらして、恐縮しきり。
@klmquasi くんと××年ぶりに再会して文芸部の同窓会ができたのもめちゃめちゃ思い出深い。超個人的だけどw


というわけで、ご挨拶させて頂きました皆さん& NLP2012 を運営してくださった各位、改めてありがとうございました。
今後も機会がありましたらよろしくおねがいします。

*1:実際の発表では結局大きくオーバーしてしまい……

*2:「○○さんに会いたいなー」と言えばことごとく叶えてくれた nokuno さんには大感謝