分散膨張係数(VIF)-概要、式、用途

Variance Inflation Factor(VIF)は、回帰分析で多重共線性の重大度を測定します。回帰分析回帰分析は、従属変数と1つ以上の独立変数の間の関係の推定に使用される一連の統計手法です。これは、変数間の関係の強さを評価し、変数間の将来の関係をモデル化するために利用できます。。これは、共線性の結果として回帰係数の分散が増加することを示す統計的概念です。

分散膨張係数

概要

  • 分散膨張係数(VIF)は、通常の最小二乗(OLS)回帰分析で多重共線性の重大度を検出するために使用されます。
  • 多重共線性は、分散とタイプIIのエラーを膨らませます。これにより、変数の係数は一貫性がありますが、信頼性が低くなります。
  • VIFは、多重共線性によって引き起こされる膨張した分散の数を測定します。

分散膨張係数と多重共線性

通常の最小二乗(OLS)回帰分析では、2つ以上の独立変数が独立変数である場合に多重共線性が存在します。独立変数は、従属変数への影響(結果)を評価するために変更される入力、仮定、またはドライバーです。 。それらの間の線形関係を示します。たとえば、回帰モデルで会社の規模と収益と株価の関係を分析するには、時価総額と収益が独立変数です。

会社の時価総額時価総額時価総額(時価総額)は、会社の発行済み株式の最新の市場価値です。時価総額は、現在の株価に発行済み株式数を掛けたものに等しくなります。投資コミュニティはしばしば時価総額の値を使用して企業をランク付けし、その総収益は強く相関しています。企業の収益が増えるにつれて、企業の規模も大きくなります。これは、OLS回帰分析で多重共線性の問題を引き起こします。回帰モデルの独立変数が完全に予測可能な線形関係を示す場合、それは完全多重共線性として知られています。

多重共線性を使用すると、回帰係数は依然として一貫していますが、標準誤差が大きくなるため、信頼性が失われます。これは、モデルの予測力が低​​下しないことを意味しますが、タイプIIエラーでは係数が統計的に有意ではない可能性がありますタイプIIエラー統計的仮説検定では、タイプIIエラーは、仮説検定が帰無仮説を棄却できない状況です。は誤りです。その他。

したがって、変数の係数が個別に有意ではない場合(t検定でそれぞれ棄却できない場合)、F検定で棄却され、決定係数が高い(R2)従属変数の分散を一緒に説明できます。多重共線性が存在する可能性があります。これは、多重共線性を検出する方法の1つです。

VIFは、回帰モデルに多重共線性が存在するかどうかを検出するために一般的に使用されるもう1つのツールです。これは、共線性のために推定された回帰係数の分散(または標準誤差)がどれだけ膨張するかを測定します。

分散膨張係数の使用

VIFは、次の式で計算できます。

分散膨張係数-式

ここで、R i 2は、残りの独立変数のi番目の独立変数を回帰するための未調整の決定係数を表します。VIFの逆数は許容値として知られています。個人の好みに応じて、VIFまたは許容値のいずれかを使用して多重共線性を検出できます。

R i 2が0に等しい場合、残りの独立変数の分散はi番目の独立変数から予測できません。したがって、VIFまたは許容誤差が1に等しい場合、i番目の独立変数は残りの変数と相関しません。これは、この回帰モデルに多重共線性が存在しないことを意味します。この場合、i番目の回帰係数の分散は膨張しません。

一般に、4を超えるVIFまたは0.25未満の許容誤差は、多重共線性が存在する可能性があることを示しており、さらなる調査が必要です。VIFが10より大きいか、許容誤差が0.1より小さい場合、修正が必要な重大な多重共線性があります。

ただし、多重共線性に悩まされることなく、高いVFIを安全に無視できる状況もあります。以下はそのような3つの状況です。

1.高VIFは制御変数にのみ存在し、対象の変数には存在しません。この場合、対象の変数は相互に、または制御変数と同一線上にありません。回帰係数は影響を受けません。

2.積または他の変数の累乗を含めた結果として高いVIFが発生した場合、多重共線性は悪影響を引き起こしません。たとえば、回帰モデルには、独立変数としてxとx2の両方が含まれています。

3. 3つ以上のカテゴリを表すダミー変数のVIFが高い場合、多重共線性は必ずしも存在しません。カテゴリ変数が他の変数と相関しているかどうかに関係なく、カテゴリにケースのごく一部がある場合、変数のVIFは常に高くなります。

多重共線性の修正

多重共線性は係数の分散を膨らませ、タイプIIのエラーを引き起こすため、それを検出して修正することが不可欠です。以下に示すように、多重共線性を修正するための2つの簡単で一般的に使用される方法があります。

1. 1つ目は、相関性の高い変数を1つ(または複数)削除することです。変数によって提供される情報は冗長であるため、決定係数は削除によって大きく損なわれることはありません。

2. 2番目の方法は、OLS回帰の代わりに、主成分分析(PCA)または部分最小二乗回帰(PLS)を使用することです。PLS回帰は、変数をより小さなセットに減らすことができ、それらの間に相関関係はありません。PCAでは、新しい無相関変数が作成されます。情報の損失を最小限に抑え、モデルの予測可能性を向上させます。

その他のリソース

ファイナンスは、グローバルなCertified Banking&Credit Analyst(CBCA)™CBCA™認定の公式プロバイダーです。CertifiedBanking&Credit Analyst(CBCA)™認定は、ファイナンス、アカウンティング、クレジット分析、キャッシュフロー分析をカバーするクレジットアナリストのグローバルスタンダードです。 、コベナンツモデリング、ローン返済など。誰もが世界クラスの金融アナリストになるのを支援するように設計された認定プログラム。あなたのキャリアを前進させ続けるために、以下の追加のリソースが役に立ちます:

  • 財務の基本的な統計の概念財務の基本的な統計の概念統計をしっかりと理解することは、財務をよりよく理解するために非常に重要です。さらに、統計の概念は投資家が監視するのに役立ちます
  • 予測方法予測方法トップ予測方法。この記事では、金融アナリストが将来の収益を予測するために使用する4種類の収益予測方法について説明します。
  • 重回帰重回帰重回帰は、独立変数の値に基づいて従属変数の結果を予測するために使用される統計手法を指します
  • 確率変数確率変数確率変数(確率変数)は、統計における変数の一種であり、その可能な値は特定のランダム現象の結果に依存します。