Bai-Ng (2002) assumes strong factors: top-$K$ eigenvalues of the sample covariance grow linearly with $N$, the rest stay bounded. In practice (especially in finance) factors can be "weak" — relevant but bounded, shrinking the gap between signal and noise eigenvalues.
Under weak factors:
Random matrix theory gives the tool. Marchenko-Pastur (1967) describes the limiting eigenvalue distribution of a sample covariance from i.i.d. noise. Onatski uses it as the null.
Same approximate factor model: $X_{it} = \lambda_i' F_t + e_{it}$. Define sample covariance $S = X'X/T$ with eigenvalues $\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_N$.
Under "no factors, i.i.d. idiosyncratic with variance $\sigma^2$", as $N, T \to \infty$ with $N/T \to c \in (0, \infty)$, the empirical eigenvalue distribution converges to the Marchenko-Pastur (MP) law on $[\sigma^2(1 - \sqrt c)^2,\, \sigma^2(1 + \sqrt c)^2]$.
So without factors, eigenvalues bunch in a known continuous interval. With factors, the top-$K$ eigenvalues separate from the bulk and float above $\sigma^2(1 + \sqrt c)^2$.
Imagine plotting the sorted eigenvalues. Under no factors, they form a smooth distribution that fills the MP interval. Each true factor pushes one eigenvalue out of the bulk and above the upper edge. The number of factors is the number of outliers.
Tests $H_0: K \leq k_0$ vs $H_1: K > k_0$. Statistic: how much the $(k_0 + 1)$-th sample eigenvalue exceeds the MP upper edge. Calibrated by the Tracy-Widom distribution from random matrix theory.
If true $K = 3$: $\lambda_3$ is a "signal" eigenvalue, $\lambda_4$ is "noise" — their ratio is large. For $k \neq 3$, numerator and denominator are the same kind, so the ratio is moderate.
Onatski shows this estimator is consistent under weaker conditions than BN — including the weak-factor regime.
Monte Carlo: ER outperforms BN when factor strengths are heterogeneous (some strong, some borderline). On Stock-Watson macro data, ER selects fewer factors than BN. Applied to US stock returns (FF25 and individual stocks): 1–3 factors depending on universe — matches CRW's later 1–2 finding on individuals.
ER is the right selector when any of:
| Use case | Selector |
|---|---|
| US full panel, large $N$ and $T$ | BN $\text{IC}_{p2}$ (default; ER as robustness check) |
| US large-cap subset | Either; agreement is good signal |
| US micro-cap subset | ER (weak factors likely) |
| JP full panel | ER (factors less strong than US in our priors) |
| Any rolling window ($T < 120$) | ER (CRW fixed-$T$ result applies) |
| Sector deep-dives (energy, biotech) | ER |
Report both BN and ER selections side-by-side as a diagnostic — agreement strengthens the claim; disagreement is a red flag worth investigating.
Bai-Ng (2002) は強因子を仮定:標本共分散の上位 $K$ 固有値が $N$ に比例して成長、残りは有界。実際(特にファイナンス)にはファクターは「弱い」可能性がある — 関連はあるが固有値が有界で、シグナル・ノイズ固有値のギャップが縮む。
弱因子の場合:
道具立てはランダム行列理論。Marchenko-Pastur (1967) は i.i.d. ノイズの標本共分散の固有値極限分布を記述。Onatski はそれを帰無分布として用いる。
同じ近似ファクターモデル:$X_{it} = \lambda_i' F_t + e_{it}$。標本共分散 $S = X'X/T$、固有値 $\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_N$。
「ファクターなし、$e_{it}$ が i.i.d.、分散 $\sigma^2$」のもと、$N, T \to \infty$ かつ $N/T \to c \in (0, \infty)$ で経験固有値分布は MP 法則 $[\sigma^2(1 - \sqrt c)^2,\, \sigma^2(1 + \sqrt c)^2]$ に収束。
つまりファクターなしでは固有値は既知の連続区間に集まる。ファクターありでは上位 $K$ 固有値がこの bulk から離れ、$\sigma^2(1 + \sqrt c)^2$ より上に浮かぶ。
固有値をソートしてプロットすることを想像せよ。ファクターなしでは MP 区間を埋めるスムーズな分布になる。真のファクター 1 つにつき、1 つの固有値が bulk から外れて上縁を超えて押し上げられる。ファクター数 = 外れ値の数。
$H_0: K \leq k_0$ vs $H_1: K > k_0$ を検定。統計量は $(k_0 + 1)$ 番目の標本固有値が MP 上縁をどれだけ超えるか。ランダム行列理論の Tracy-Widom 分布で較正。
真 $K = 3$ なら:$\lambda_3$ は「シグナル」固有値、$\lambda_4$ は「ノイズ」固有値 — 比は大きい。$k \neq 3$ では分子分母が同種なので比は中程度。
Onatski はこの推定量が BN より弱い条件下で一致性を持つことを示す — 弱因子レジームを含む。
モンテカルロ:ファクター強度が異質(強・弱混在)な場合、ER は BN を上回る。Stock-Watson マクロデータでは ER の方が BN より少なくファクターを選択。米国株式リターン(FF25 と個別株):ユニバースに応じ 1〜3 ファクター — 個別株での CRW の 1〜2 ファクターという後続結果と整合。
以下のいずれかの場合、ER が正しいセレクター:
| ユースケース | セレクター |
|---|---|
| 米国フルパネル、大 $N$・大 $T$ | BN $\text{IC}_{p2}$(デフォルト;ER はロバストネスチェック) |
| 米国大型株サブセット | どちらでも;一致は良い兆候 |
| 米国極小型株サブセット | ER(弱因子の可能性が高い) |
| 日本フルパネル | ER(米国より因子が弱いという事前見立て) |
| ローリング窓($T < 120$) | ER(CRW の固定 $T$ 結果が適用される) |
| 業種深掘り(エネルギー、バイオ等) | ER |
BN と ER の選択結果を並べて報告することは診断として有用 — 一致は主張を強化、不一致は調査すべき赤旗。