混合ベルヌーイ問題をEMアルゴリズムで解く

機械学習 MATLAB

尤度関数シグマ（和）とパイ（積）が混在しているので対数尤度関数の偏微分が容易に計算できない。（パイだけだとログを取るとシグマに転換するので簡単に計算できる）https://github.com/shohei/mnistうまく尤度が計算できてないやりかけのコード functio…

2016-11-12

Perlでk-meansクラスタリング

機械学習 Perl

完全にランダムなエリアから重心を選ぶと計算がうまくいかなかったので、ランダムにサンプルを抽出した。 TODO：任意のkを与えられるようにする kmeans.pl use strict; use warnings; use Moo; use feature qw(say); use Switch; use Data::Dumper; use List…

2016-07-07

ROC曲線とは

統計学機械学習

ROC(Receiver Operating Characteristic) curve・・・横軸に偽陽性率、縦軸に真陽性率をプロットしたもの

2016-06-27

ナイーブベイズとベイジアンフィルタの違い

機械学習

http://gihyo.jp/dev/serial/01/machine-learning/0003ナイーブベイズ（単純ベイズ分類器）の一種がベイジアンフィルタ、でいいのかな

2016-06-27

機械学習の手法について整理する

機械学習

TODO確保 k近傍法、ナイーブベイズ、ベイズフィルタ、EMアルゴリズム、最小二乗法、最尤推定法、パーセプトロン、ロジスティック回帰、k平均法

2014-10-14

sentdexのコード

機械学習

この手法は機械学習ではなく、情報検索に近いといえる。履歴を使っているので一般的な意味での学習とはいえるが、全く処理を施していないので機械学習とは異なる。（精度が上がる保証がある手法のことを機械学習と呼ぶのか） import matplotlib import ma…

2014-08-12

WxMaximaで逆行列を求める

機械学習

文字のままで計算ができる。 A : matrix( [a,b,c],[d,e,f],[g,h,i]); A_ : invert(A);

2014-08-05

航空機設計における多目的最適化

機械学習統計学

https://www.google.co.jp/search?q=%E5%A4%9A%E7%9B%AE%E7%9A%84%E6%9C%80%E9%81%A9%E5%8C%96&ie=utf-8&oe=utf-8&aq=t&hl=ja&gws_rd=ssl#hl=ja&q=%E5%A4%9A%E7%9B%AE%E7%9A%84%E6%9C%80%E9%81%A9%E5%8C%96+%E8%88%AA%E7%A9%BA%E6%A9%9F

2014-04-20

Rで使える機械学習の手法の比較

機械学習

使うのはアヤメのデータ(iris) 縦軸: Sepal.Width, 横軸: Sepal.Lengthでプロットする ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width,color=rev(Species)))+geom_point() k-meansクラスタリング R言語プログラミング：クラスター分析 - k-means http://d.h…

2012-05-19

PythonでLSAを使う

Python 機械学習

LSAとはlatent semantic analysisの略。主成分分析とかに似てる感じ。固有値の大きい固有ベクトルを基底として座標変換する。単純にTF-IDFとっただけだとゼロの成分に重みが付加されるので（主に単語ベクトルなどのスパースなベクトルから）特徴ベクトル…

2011-12-21

EMアルゴリズムの実装

機械学習

EMアルゴリズムの復習：ある不完全データが属すると思われる確率分布のパラメータを推定することができる正規分布を仮定したEMアルゴリズムポアソン分布を仮定したEMアルゴリズム

2011-12-21

ナイーブベイズ分類器

機械学習

ナイーブベイズ分類器（Naive Bayes Classifier）ベイズの定理より、クラスcに分類する確率を次のような最大化問題で解く。つまり dは文書であるので、単語の種類数とその組合せを考えると起こりうるdは膨大である。あらゆるdについてそれぞれがデータ空…

2011-12-21

クラスタリングのまとめ

機械学習

凝集型クラスタリング（ボトムアップクラスタリング）簡単に言うと、一番末節から樹形図を書いていって、一つのルートにマージしていくアルゴリズム入力：事例集合D={x1,x2,...,xD} C={c1,c2,...,cD} ＃１つのクラスタに１つの事例を割り当てる c1={x1},c2…

2011-12-21

機械学習、自然言語処理の教科書など

機械学習自然言語処理

これとこれは読んでなかった情報検索と言語処理応用のための確率論入門 CRFって何だと思ったらConditional Random Field：条件付き確率場のことだった。自然言語処理ではFSNLPが絶賛されてる。 http://d.hatena.ne.jp/echizen_tm/20111103/1320321200ベク…

2011-12-21

EMアルゴリズム

機械学習

EMアルゴリズム：不完全データに対し、尤度が大きくなるようにパラメータを決定する一般的な枠組み不完全データにおける観測されない変数→隠れ変数(latent variable)と呼ぶクラスタリングにおいて、クラスタに対応する確率変数を隠れ変数と考えることが多…

2011-12-20

パラメータ推定法

機械学習

準備その１ i.i.dの仮定：independency, identically distributed = 独立に同一の確率分布に従うつまり、確率変数XのサンプルデータD={...xi...}の生成確率が次のように書ける。・独立なので積に分解できる・同一の確率分布に従うので１種類の確率関数p(x…

2011-12-20

ディリクレ分布

機械学習統計学

連続型確率分布の代表的なものとして・正規分布・ディリクレ分布がある。正規分布：d次元正規分布：ディリクレ分布：ただし、ディリクレ分布は、簡単に言うと、各確率変数が極端な値をとりにくい分布。多項分布のパラメータの拘束条件と等しい→ →多項…

2011-12-20

離散確率分布に関するメモ

機械学習統計学

１．離散確率分布ベルヌーイ分布： ※はデルタ関数多変数ベルヌーイ分布：２項分布：多項分布：ポアソン分布：ポアソン分布の実装 #! /usr/bin/env python # -*- coding: utf-8 -*- import scipy from pylab import * import math amp = range(1,11) def poi…

2011-09-28

Widrow-Hoffの学習規則

機械学習 Python

データの完全な分離ができない場合、誤差を最小にするように、識別関数の重みベクトルを計算する。（定式化）教師信号と識別関数の値の差を誤差と定義この誤差の２乗和を考えるこれについて、すべての学習パターンについて総和をとる。やることは、この…

2011-09-28

サポートベクターマシンの実装（その１）

Python 機械学習

ラグランジュ係数を2次計画問題で解くところが肝。 SMOアルゴリズムとかあるけど、とりあえず最急降下法を試す。やることは、ラグランジュ関数の、制約条件のもとでの最大化である。更新式は、より # coding: utf-8 import numpy as np import matplotli…

2011-09-28

パーセプトロンの学習規則

Python 機械学習

線形分離可能な２クラスの識別問題をパーセプトロンの学習規則を使って解く。（NN法について） 1. NN法(Nearest neighborhood:最近傍法)とは、各クラスw1,w2,..に属するプロトタイプ（代表点）p1,p2,..に対して入力された特徴ベクトルxとの距離が最小とな…

2011-09-28

学習のアルゴリズムのまとめ（識別）

機械学習

2011-09-26

いろいろなフィッティング

機械学習 Python

http://d.hatena.ne.jp/aidiary/20100327/1269657354 http://d.hatena.ne.jp/aidiary/20100404/1270359720 を見ながらフィッティングのお勉強。まずはサンプルデータの生成 #usr/bin/env python #-*- coding: utf-8 -*- import numpy as np from pylab impor…