2011-12-21から1日間の記事一覧

EMアルゴリズムの実装

EMアルゴリズムの復習:ある不完全データが属すると思われる確率分布のパラメータを推定することができる 正規分布を仮定したEMアルゴリズム ポアソン分布を仮定したEMアルゴリズム

ナイーブベイズ分類器

ナイーブベイズ分類器(Naive Bayes Classifier) ベイズの定理より、クラスcに分類する確率を次のような最大化問題で解く。 つまり dは文書であるので、単語の種類数とその組合せを考えると起こりうるdは膨大である。 あらゆるdについてそれぞれがデータ空…

クラスタリングのまとめ

凝集型クラスタリング(ボトムアップクラスタリング) 簡単に言うと、一番末節から樹形図を書いていって、一つのルートにマージしていくアルゴリズム 入力:事例集合D={x1,x2,...,xD} C={c1,c2,...,cD} #1つのクラスタに1つの事例を割り当てる c1={x1},c2…

機械学習、自然言語処理の教科書など

これとこれは読んでなかった 情報検索と言語処理 応用のための確率論入門 CRFって何だと思ったらConditional Random Field:条件付き確率場のことだった。自然言語処理ではFSNLPが絶賛されてる。 http://d.hatena.ne.jp/echizen_tm/20111103/1320321200ベク…

EMアルゴリズム

EMアルゴリズム:不完全データに対し、尤度が大きくなるようにパラメータを決定する一般的な枠組み 不完全データにおける観測されない変数→隠れ変数(latent variable)と呼ぶ クラスタリングにおいて、クラスタに対応する確率変数を隠れ変数と考えることが多…