まずは単回帰分析から。
単回帰分析:1変量から1変量を予測する
各営業所の売上と宣伝費のデータが以下のように与えられている。
営業所 | 宣伝費(x)(百万円) | 売上(y)(千万円) |
---|---|---|
1 | 5.5 | 73 |
2 | 4.5 | 59 |
3 | 4.1 | 56 |
4 | 3.5 | 31 |
5 | 2.5 | 28 |
6 | 2.3 | 31 |
7 | 2.7 | 30 |
8 | 2.8 | 25 |
このとき、売上yと宣伝費xの間の関係をうまく表したい。
Yを売上yの推定値として、
Y=ax+b
と表した時のaとbの最適値を求める。
推定値Yと実測値yの残差を以下のように定義する。
残差
また、の残差平方和Qを以下のように定義する。
にを代入して、
極値条件、を用いると
両辺をデータサンプル数nで割ると、
これは変量x,y の平均を使って書き直すと
つまり変量の平均は回帰直線上に位置することになる。
上式を変形して、
- a \bar{x} ]
これをQの式に代入すると、
これにもう一つの極値条件、を適用して、
この両辺をn-1で割って、共分散, 分散を用いて書き換えると
よって、回帰方程式は
同様に、2変量及び3変量の場合を示す(重回帰)。