回帰分析(読み)かいきぶんせき

デジタル大辞泉の解説

かいき‐ぶんせき〔クワイキ‐〕【回帰分析】

ある変数が他の変数とどのような相関関係にあるのかを推定する統計学的手法の一。原因となる変数x(説明変数)と、結果となる変数y(目的変数または被説明変数)の間に、回帰式yaxbと表される関係があるとすると、xyの観測値から最小二乗法を用いてabが求められる。この回帰式をもとに将来予測や要因分析を行う。

出典 小学館デジタル大辞泉について 情報 | 凡例

人材マネジメント用語集の解説

回帰分析

・回帰分析 regression analysis
説明変数目的変数の関係を回帰式で表し、目的変数が説明変数によってどの程度
説明できるかを定量的に分析することである。
・回帰式は、y=ax+b(x:説明変数、y:目的変数)で表される。
・目的変数とは予測や要因分析を行う変数のことで、説明変数とは目的変数に影響を
与えると考えられる変数のことである。
・回帰式を求めるのに変数a、切片bを推定する。推定には最小二乗法を用いる。最小
二乗法は、観察された各点(x,y)と回帰線上の各点(x,yi)との残差dの平方和が最小
となる直線を求める方法である。
・回帰分析は、予測・要因分析等に用いられる。例えば、過去の生産量と製造費用の
データから回帰式を求め、将来の生産量に対する製造費用の予測に活用される。この
場合、生産量(x)に対する製造費用(y)の過去のデータから回帰式を推定する。生産
量(x)1単位当りの製造費用(y)がどれ程増加するかを示す傾きaは変動費、切片bは
固定費となる。将来の生産量(x1)を回帰式に代入すると将来の製造費用(y1)が導
かれる。
・予測をする際には、回帰式の精度の良さの尺度となる決定係数(0〜1の値)が1に
近い(当てはまりが良い)のが望ましい。
・また回帰分析は、因果関係が想像される2つの変数の関係を調べるのに用いられる
が、回帰式は、ある変数が増加(減少)すれば、もう一方の変数が増加(減少)する
という関係性を示しているだけで、変数間に因果関係が本当に存在するかは注意して
判断しなければならない。

出典 (株)アクティブアンドカンパニー人材マネジメント用語集について 情報

ブランド用語集の解説

回帰分析

回帰分析とは独立変数従属変数の間の関係を推定するための統計的手法のことをいう。独立変数が1つなら単回帰分析、独立変数が2以上なら重回帰分析という。一次式を用いた線形回帰モデルが用いられることが多いが、それ以外の式を用いた非線形回帰モデルもある。

出典 (株)トライベック・ブランド戦略研究所ブランド用語集について 情報

世界大百科事典 第2版の解説

かいきぶんせき【回帰分析 regression analysis】

なんらかの操作や活動結果を予測したり,その結果の変動を制御したりするための手法で,統計的多変量解析の一つ。操作や活動のデータとそれに対応する結果のデータの組を多数集め,予測の対象とする量(目的変数もしくは従属変数と呼ぶ)の変動を,操作や活動のデータのうちその変動を説明する要因と考えられるデータ(説明変数もしくは独立変数と呼ぶ)によって予測するために,両者の関係を求めることをいう。製鉄所の炉の制御や化学工場での操業条件の決定のための工程解析をはじめ,経済データの分析や予測,心理学や医学など,多くの分野でもっともよく使われる統計的手法である。

出典 株式会社平凡社世界大百科事典 第2版について 情報

大辞林 第三版の解説

かいきぶんせき【回帰分析】

多変量の関係を解析する手法。一つの変数y が、他の変数(説明変数)x 1, x 2, …, x k の一次式(回帰式)で表されると仮定し、その係数を最小二乗法などで推定する。

出典 三省堂大辞林 第三版について 情報

ブリタニカ国際大百科事典 小項目事典の解説

回帰分析
かいきぶんせき
regression analysis

2つの変数 xy の間に,yabx ( ab は定数パラメータ) のような線形関係の数式モデルを仮定して,xy についてのいくつかの観測あるいは測定データから,最小二乗法により未知パラメータ ab を推定する方法。 y を目的変数,x を説明変数という。理学,工学で実験式を求める場合や,経済学で経済 (予測) モデルをつくるのに,広く用いられる。説明変数が2つ以上あるときは,重回帰分析と呼ばれる。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

日本大百科全書(ニッポニカ)の解説

回帰分析
かいきぶんせき
regression analysis

ある変数の動きが、他のどのような変数を原因としておこされるものであるか、その影響力はどれほどのものであるか、その変動全体のどれほどの部分がそれらの他の変数によって説明されるのかなどの問題を、統計的手法を用いて数量的に解析すること。[高島 忠]

線型回帰モデル

いま、ある変数Yがk個の他の変数X1、X2、……、Xkの影響を受けて変動すると考えられるとき、その関係は、a0、a1、a2、……、akを定数として
  Y=a0+a1X1+a2X2+……+akXk+V
と表される。ここで、Vはこの関係式に採用されたk個の変数以外の要因からくるYへの影響を集約して表現する変数であって、その値は、なんらかの確率的な法則に従って発生するものと考えられる。X1、X2、……、Xkは説明変数、Yは被説明変数、そしてVは確率攪乱(かくらん)項とそれぞれよばれる。
 以下、取扱いを簡単にするために、説明変数が1個である場合について述べよう。Xがx1の値のときYはy1であり、x2のときy2であるというように、XとYに関して対応するデータをn組とする(観測する)。そして、それぞれの場合におけるX以外の要因の効果を表すもの、つまり、確率攪乱項をv1、v2、……、vnとすると、
yi=a+bxi+vi (i=1,2,……,n)
となる。これは、もっとも簡単な線型回帰モデルである。[高島 忠]

パラメータ(係数)の推定

n組のデータ(x1,y1),(x2,y2),……,(xn,yn)から未知の係数a、bを求めるには、最小二乗法が用いられる。それは、この方法によって得られるa、bの推定量が、確率攪乱項viに関するある仮定の下で、推定式として統計的に望ましい性質を備えているからである。
 推定量を用いて計算されるyiの値と実際の観測値yiとの誤差をeiとすると、は、その誤差の2乗和

が最小になるように求められる。すなわち、Eが極値をとる条件として、およびでそれぞれ偏微分したものを0とおいて、

という連立方程式が得られる。これは、線型回帰モデルの未知のパラメータa、bの値を推定するための正規方程式とよばれる。これを解くことによって、は次のように得られる。

ここで、Σはすべてiについての1からnまでの和を表す。[高島 忠]

回帰直線の性質

このようにして求められる回帰係数については、正規方程式の第1式から、をそれぞれxiおよびyiについての平均値として
  
の関係のあることがわかるので、回帰直線は、XおよびYの観測値の各平均値を座標とする点()を通る。また、誤差eiの総和は0となるので、観測値を描いたグラフ上で、回帰直線より上方にある観測点から回帰直線までの距離の総和は、下方にある観測点から回帰直線までの距離の総和にかならず等しい。[高島 忠]

決定係数

変数yに対する変数xの影響力(説明力)の強さは、回帰直線に対する変数yiのばらつきの大きさによって測られる。
 それは、iを回帰係数を用いたyiの計算値とするとき

として表され、決定係数とよばれる。[高島 忠]
『森田優三著『新統計概論』(1974・日本評論社) ▽J・ジョンストン著、竹内啓他訳『計量経済学の方法』(1975・東洋経済新報社)』

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

最新 心理学事典の解説

かいきぶんせき
回帰分析
regression analysis

回帰分析とは,関心の対象となっている変数群を,説明や予測をするための説明変数explanatory variable(予測変数,独立変数などともよばれる)と,その基準となる従属変数dependent variable(基準変数などともよばれる)に分け,両者の間に統計モデルを設定し,その間の関係を推論する手法である。その統計モデルは,線形回帰モデルと非線形回帰モデルに大別される。

【線形回帰モデルlinear regression model】 線形回帰モデルとは,従属変数を,個の説明変数1,…,pによって予測・説明するために,回帰係数regression coefficient bj=1,…,)を乗じた説明変数の和に切片を加えた予測式



を考え,これと従属変数との誤差e=y-y^の大きさを最小にする1,…,pを求める統計解析法を指す。

【単回帰分析と重回帰分析】 =1つまりy^=bx+cと表わせる分析と≧2の分析を区別したいときは,前者を単回帰分析simple regression analysis,後者を重回帰分析multiple regression analysisとよぶ。個体を表わす添え字i(=1,…,n)を各変数につけると,予測式は



と表わせ,これを,従属変数を予測式と誤差の和とする式iy^iiの右辺に代入した



が回帰分析のモデル(回帰モデル)となる。

【切片と係数の最小2乗解】 誤差の2乗和



を最小にする1,…,pが最小2乗解となる。従属変数・説明変数の平均を



と表わすと,切片の解は



と表わせ,これを回帰モデルのに代入すると



となり,平均偏差得点ỹiiȳx̃ijijx̄jを用いてモデルを整理すると,



が得られる。この式から,平均偏差得点の回帰分析は,切片が0になって消える以外は,素データの分析と同等であることがわかる。

 個体すべての平均偏差得点,係数,誤差を



のようにベクトルと行列で表わせば,回帰モデルはy=Xb+eと書け,係数ベクトルbの解は



で与えられる。ここで,RXXは説明変数同士の相関係数からなるp×pの行列,rXy個の説明変数と従属変数の相関係数からなる×1のベクトル,DXは各説明変数の標準偏差を対角に配する対角行列,yは従属変数の標準偏差である。全変数を平均0,分散1,つまりy=1かつDXが単位行列となる標準得点に変換したデータに回帰分析を適用すると,前段のb^からy-1Xが消えたR-1XXXyがbの解となって,切片が0となる以外は,素データを分析した場合と同じ結果が得られる。この解をとくに標準解standardized solutionとよぶ。単回帰分析の回帰係数の標準解は,従属変数と説明変数の相関係数に一致する。

【分散説明率と重相関係数】 解b^=[b^1,…,b^p]′,c^と説明変数の値を予測式に代入して得られる予測値



従属変数i,および残差e^iiy^iは,次の性質をもつ。⑴残差e^iの平均ēは0となり,平方和



に基づく残差分散s2eを,総体的な残差の大きさとみなせる。⑵予測値y^iの平均は,従属変数の平均ȳに等しい。⑶iy^iの共分散yŷは,y^iの分散2ŷに等しい。⑷従属変数の平方和は,



のように分割され,これを平方和の分割decomposition of sum of squaresとよぶ。

 この分割より従属変数iの分散2yについて,



が導かれ,この両辺を2yで割ると



が得られ,従属変数の分散に対する予測値の分散の比率



が,0以上1以下の値を取って,残差の小ささを表わすことがわかる。この比率2ŷ/2yは,決定係数coefficient of determinationまたは分散説明率proportion of variance accounted forとよばれ,従属変数の分散のうち,個の説明変数の分散によって説明される成分の割合と解される。さらに,前段⑶の性質2ŷyŷを分散説明率2ŷ/2yに代入すると



となり,予測値と従属変数の相関係数yŷyŷ/yŷの2乗が分散説明率に等しいことがわかる。≧2のときのyŷは,説明変数と従属変数の重相関係数multiple correlation coefficientとよばれ,複数変数と一つの変数との相関の指標となる。正規分布を仮定する場合,「母集団では分散説明率と重相関係数は0である」という仮説を,分散分析によって検定できる。

【偏回帰係数partial regression coefficient】 ≧2のときに説明変数jにかかる回帰係数jを,とくに偏回帰係数とよぶ。これによって,j以外の説明変数の影響を除いたjの効果を把握できるのが,重回帰分析の利点である。たとえば,商品の質1だけから商品の売上を予測する単回帰分析では,「質1が高いと値段2も高いので,売上は下がるため,質1にかかる係数が負になる」というように,分析に投入されない変数2の効果が結果に混入する。これに対し,商品の質1と値段2の両者から売上を予測する重回帰分析では,値段2の影響を除いたときに質1が売上へ及ぼす効果を,偏回帰係数1によって把握できる。仮説「偏回帰係数=0」の検定と係数の区間推定には,分布が用いられる。分散の異なる説明変数の間で従属変数への効果の大小を比較するときは,標準解の偏回帰係数である標準偏回帰係数standardized partial regression coefficientを参照しなければならない。

【変数選択variable selection】 説明変数1,…,pすべてを分析に投入するのではなく,回帰モデルの適合度が高い説明変数の部分集合を求めることを変数選択とよぶ。たとえば,=3であれば,計7通りの部分集合{1},{2},{3},{12},{13},{23},{123}のそれぞれからを予測する回帰分析を行ない,適合度が最大となる集合による分析結果を採択すればよい。適合度指標の一つに自由度調整済み重相関係数multiple correlation coefficient adjusted for the degrees of freedomがあり,これは説明変数が多いほど値が高くなる重相関係数の短所を補正した統計量である。説明変数が多いときは変数集合を網羅的に考慮できないので,適当な初期変数集合から始めて,適合度を高める説明変数の投入,あるいは適合度を下げる変数の除去,あるいは変数の取捨選択を繰り返して,望ましい変数集合にたどり着く方法が使われ,取捨選択を繰り返す方法はステップワイズ法stepwise methodとよばれる。

多重共線性multicollinearity】 b^=y-1X-1XXXyのように偏回帰係数の解は相関行列RXXの逆行列の関数であるため,説明変数同士の相関が非常に高い場合に,たとえば偏回帰係数の信頼区間が負から正にわたるなど,解が不安定になる現象を多重共線性とよぶ。各説明変数が多重共線性の原因になっているか否かを診断するために,その変数と他の-1個の説明変数の重相関係数を利用できる。

【他の回帰分析】 従属変数が複数(個)であり,それぞれの平均偏差得点と偏回帰係数を行列



にまとめ,Eを誤差行列とすれば,モデルがY=XB+Eと表わせる分析を多変量回帰分析multivariate regression analysisという。ただし,の解は(X′X)-1X′Yで与えられ,その第列は,の第列を従属変数とした重回帰分析の解と同じになる。列数がより少ない行列Wを用いて,p×qが行列の積WVに等しいと制約した多変量回帰分析は縮小ランク回帰reduced rank regressionとよばれる。

【非線形回帰モデルnon-linear regression model】 非線形回帰モデルは,従属変数を説明変数の線形式に限らず,一般的な関数によって説明するものである。たとえば,従属変数iが正答⑴と誤答(0)のように2値,説明変数ijは連続変数のときに,その確率



を予測式とする分析をロジスティック回帰分析logistic regression analysisとよぶ。なお,非線形回帰モデルにおいて,従属変数の分布の系統的成分が,未知パラメータの線形式で表現されるとき,一般化線形モデルgeneralized linear modelとよばれる。 →因果分析 →構造方程式モデル →相関係数 →多変量解析
〔足立 浩平〕

出典 最新 心理学事典最新 心理学事典について 情報

世界大百科事典内の回帰分析の言及

【季節変動】より

…一つは経済データを作成する政府系機関等がよく用いるもので,考える変数の原系列を適当な長さの移動平均で割って季節指数を求め,さらにこれを年間平均が100になるように調整したうえで,原系列に適用することによって季節変動を除去した系列が求められる。これに対して,回帰分析を用いる方法も存在する。考えている変数の中・長期的な変動を説明する変数とともに,季節ダミーを回帰式の右辺に導入し,季節変動の部分を後者によってとらえようとするものである。…

※「回帰分析」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

キャッシュレス決済

キャッシュレス決済とは、財やサービスの対価の支払い手段として、物理的なキャッシュ(現金)である紙幣や硬貨ではなく、クレジットカードや電子マネーなどによる電子的な決済手段を用いることをいう。このキャッシ...

続きを読む

コトバンク for iPhone

コトバンク for Android