2009-05-07
■ 計算理論I 試験
NAISTの最初の試験. まあまあかな. xyz定理の問題に穴があるのが悔やまれるが…….
■ 買い物
試験の出来に少し落ち込みつつも,ryuta-kくんに買い物に付き合ってもらう. その前に,一緒にラーメンを食す. 色々面白い話を聞けて楽しかった.
■ 推論2.0勉強会
久しぶりの勉強会. EACL*1 *2 -09で発表された, Evaluating the Inferential Utility of Lexical-Semantic Resources という論文紹介.
出てくる専門用語がよく分からず,勉強会終了後, 全然分からなかったということを, 乾さんにぼそっと話したところ, 親切に説明していただき,大まかだが理解できた. また,どんどん質問をしていくようにとの 勉強会への参加方法のアドバイスをいただく.
ぼくは今まで, このような勉強会というものに参加したことが無く, あまり要領というか,参加の仕方がよく分からなかった. 何でもそうだけど,議論をする上では"前提知識"というものが必要で, そういうのが無いのに,参加して話の腰を折るのは恐縮だと思っていた. もちろん基礎勉強は必要だけど,これからはあまり遠慮せずに,どんどん分からないところは聞いていきたいと思う.
precisionとrecall-share
ちなみに,分からなかったのは, 「precision」と「recall-share」という語について. 和訳すると「精度」と「再現率」になるらしい.
情報検索の場面で,ある事柄Nについて記述されている文書を,沢山の文書から調べる場合を考える. 全文書数が(a+b+c+d),Nが記述されている文書数を(a+b),無関係の文書数を(c+d)とする. そして,検索してヒットした文書数が(a+c)だったとする. (無記述と判断された文書数がb+d個だったということだ) つまり,表にすると下表になる. ○が記述ありで,×が記述なしだ.
↓真の答 →得た答 | ○ | × |
○ | a (TruePositive) | b (FalseNegative) |
× | c (FalsePositive) | d (TrueNegative) |
ここで,最良の結果はaの部分だけがヒットすることだ. precisionはa/(a+c),recall-shareはa/(a+b)となる. 一般にprecisionを上げればrecall-shareは下がり, precisionを下げればrecall-shareは上がるという トレードオフの関係にある.
ちなみにaccuracyは(a+d)/(a+b+c+d)で, F値は((b^2+1)PR)/(b^2P+R)で, b=1のときのF値は,F1と言う.
precision と recall の話はこれからすぐ FSNLP で出てくると思いますので、予習ですね (^_^)
勉強会は途中で止めて質問しまくっていいです。実際自分もそうしていました。最初しばらくそうしていると、段々分かってくるので、聞かなくてもよくなります。自分が疑問に思うことは他の人もきっと疑問に思うことなので、ばしばし質問しましょう!
なるほど,FSNLPでもフォローがあるんですね.
論文執筆の件もそうですが,分からないことだらけなので,
先輩達からたくさん吸収していきたいと思います!