統計的手法
最小二乗法
n個の観測値の組が与えられているとき,2つの変量間の関係を説明するモデルとして
平均2乗誤差(Least Mean Squared Error)を最小とするようなパラメータを求める推定方法は,最小2乗法と呼ばれている.つまり,
M-estimator
当てはめるモデルと観測値との誤差が平均で0の正規分布に従う場合,最小2乗法で推定したモデルは最適となる.しかし,観測値に外れ値(例外値)が含まれている場合,推定結果に大きな影響を与えてしまう.
そこでロバストな推定方法を用いることで,外れ値を多く含む観測値に対しても比較的良い推定結果を得ることができる.代表的な手法としてM-estimatorとLeas Median of Squaresなどがある.
最小2乗法で用いられる最小2乗基準
とした場合が最小2乗法である.つまり,M-estimatorは最小2乗法の拡張と言える.
はinfluence functionと呼ばれ,観測値がモデルから離れた場合の重みを表す.図1にその一例を示す.関数のとりかたによっては,観測値がモデルからある程度離れるとその影響はほぼ0となることがわかる.
M-estimatorによる推定のためのアルゴリズムはMを最小化する最適化問題として定式化することができ,重み付き最小2乗問題となる.ただし,このアルゴリズムは,関数によっては必ずしも最適解に収束するとは限らないため,良い初期値から出発する必要がある.