重回帰売上予測/方法論の概要

重回帰分析でなぜ売り上げ予測が出来るのかということを中心に概要を説明します。大まかな概念として方法をつかんでいただければと思います。

●重回帰分析とは

原因と結果の関係を法則性としてとらえる統計的手法。

・原因と結果の関係を、法則性としてとらえる統計的方法が回帰分析です。

回帰式 y = ax + b

は、目的変数 y を、説明変数 x に説明させる式で、回帰分析とは、定数項 b と勾配 a を推計する方法のことです。また、重回帰分析とは、説明変数が2つ以上の分析を指しています。

・ひとつひとつの観測点と回帰線との距離を残差といいます。考え方は、この残差の合計をなるべく小さくなるように回帰線を引くことによって、精度の高い結果を算出しようとするものです。

・回帰線上の上側の残差はプラス、下側の残差はマイナスですから、この相殺をなくすために残差の二乗の合計が最小となるよう回帰線を探します。この方法を最小二乗法といいます。この方法を使って、勾配と定数項を算出するという訳です。

・n個のデータ(x1,y1),(x2,y2),……(xn,yn)が得られたとした場合、最も適合する直線を
y = ax + b
とすると右の式でa,bが算出されます。

●重回帰式と説明力の判断

決定係数で「あてはまりの良さ」を判断。

・こういった計算は、統計解析ソフトで分析することが一般的となっています。次に、算出された重回帰式の説明力判断をする必要があります。

・まず、決定係数で目的変数への回帰式の「あてはまりの良さ」を判断します。決定係数とは、重相関係数を二乗したものです。

・また、合わせて、個別に説明変数を判断。 p値で各変数の有意性を判断したり、多重共線性への対応をする必要があります。多重共線性とは、説明変数の間に高い相関関係があった場合、決定係数は高くなりますが、重回帰式は柔軟さに欠け、予測した時の信頼性が低くなる場合のことをいいます。この場合は、説明変数同士の相関が高い変数の絞り込み等を行う必要がある訳です。

・最終的には、予測値と実績値の関連を見て重回帰式の説明力判断を行います。

※詳しくは、多変量解析の専門書をご参照下さい。

 

(2012年/旧webサイト「GISエリアマーケティングと店舗開発より)

Follow me!

お問い合わせ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です