このページは、平成１０年３月３日に開設しました。
このページは、令和２年４月２７日に一部更新しました。

第２章　反復測度分散分析
　2.1 節　球形検定
　　2.1.1 節　対称性仮定と球形仮定

　反復測度デザインを用いると、しばしば各反復測度要因の水準間には相関関係が生じる。そのために、1.5.2 節で指摘したように、反復測度要因の効果の有無を検定するためのＦ比が、帰無仮説のもとで必ずしも正確なＦ-分布に従うとは限らない。 Rouanet and L\'epine (1970) によれば、 1960年代までは、帰無仮説のもとでＦ比が正確なＦ-分布に従うための条件として、対称性仮定 (symmetry assumption) が知られていたが、それがＦ比の正確なＦ-分布に従うための必要条件なのか十分条件なのかについて、統計学者の間でさえ定説がなかった。

　対称性は複合対称性 (compound symmetry) と呼ばれることもあるが (Crowder & Hand, 1990; Kirk, 1982)、一般に反復測度の水準数を p として、水準間母共分散行列 (population covariance matrix)

(2.1)

について、

(2.2)

(2.3)

が成り立つことをいう。(2.2)及び(2.3)式が成り立つ行列はS型行列 (a type S matrix) と呼ばれることがある (Huynh and Feldt, 1970)。

　もっとも、反復測度デザインにおけるＦ比の性質については、Box (1954a, 1954b) の先駆的研究がある。Box は、一連の研究とりわけ後者で、Kirk (1982) 流に言えば RB-p デザインにおけるＦ比の性質について、つぎの２つのケースを考察している:

ケース１　処理要因の水準間に相関がなく（したがって、ブロック因子に観測単位を充てない通常の RB-p デザインとみれる）、水準間で分散が異なるケース
ケース２　処理要因の水準間で分散は等しいが、隣接水準間のみに相関がある（したがって、ブロック因子の各水準に観測単位を充てて反復測度にした時の特別なケース）、言い換えれば１次の系列（自己）相関 (first order serial correlation) のあるケース

　Box によれば、これら２つのケースは、当該分散分析モデルでの誤差項ベクトルの直交変換を考えたとき、変換後の第 k 水準とそれ以外の k-1 個の水準間の共分散がすべてゼロになるための条件が満たされていない特殊ケースに過ぎない（Box, 1954b, p.489）。

　その条件とは、(2.1) 式すなわち、一般の処理要因の水準間母共分散行列の各行（または各列）の和がすべて一定であるというものであり、Box はこれが満たされるケースとして、

水準間に相関がなく、かつ水準間の分散がすべて等しい、すなわち Σ= σ I の時、
観測値が循環的に相関 (circularly correlated) の時、

の２つをあげている。

　 Box は一連の研究により、つぎのような結論を得ている:

　 (1) 任意の Σ の場合、表 1.13 の SS_A と SS _E は独立であるが、処理要因のＦ比 U _A / U _E の自由度は

(2.4)

と修正する必要がある。

　 (2) 任意の Σ の場合、表 1.13 の SS_BL と SS _E は一般に独立ではなく、うえの条件が満たされていないときには、ブロック因子のＦ比 U _BL / U _E は偏る。

　 (3) ケース１の場合、帰無仮説のもとで、処理要因のＦ比は過大評価され、ブロック因子のＦ比は過小評価される。

　 (4) ケース２の場合、系列相関の影響は、ブロック因子に対しては大きいが、（反復測度としての）処理要因に対しては小さい。

　これらのうち、(1) の ε については、 Boxのε因子と呼ばれている（例えば、SAS/STAT User's Guide, Release 6.03 edition, 1988; 同 Release 6.07 edition, 1990)。最近ではこれを改良した幾つかの指標が提案されている。詳細については、2.1.2 節でふれる。

　これに対して、Huynh and Feldt (1970) と Rouanet and Lépine (1970) は、対称性よりさらにゆるい条件である循環性仮定 (circularity assumption)

(2.5)

が、帰無仮説のもとでＦ比の正確なＦ-分布に従うための必要十分条件であることを明確に示した。ここで、一般に行列 M は m 行 p 列 (m< p-1) の正規直交対比行列 (orthonormal contrast matrix) 行列 I _m は m 行 m 列の単位行列である（したがって、MM ^t= I _m であり、行列 I _m の次数は m 次である。また、行列 M の各行は対比を表すので、M ₁_p = 0 であり、ベクトル 0 の次数は m である）。また、c ² は未知の正定数である。

　一般的に、行列の各行にいわゆる対比 (contrast)

(2.6)

(2.7)

を持ってくる行列を、対比行列あるいはパターン行列 (patterned matrix) と呼ぶが (Morrison, 1967; Kirk, 1982)、循環性仮定に関する文献では、M の転置行列 M ^t の方を対比行列と呼ぶことが多い(Harris, 1984; Mendoza, 1980; Rouanet et al, 1970)。後者の呼び方では、M _t = C として、

(2.8)

と書くことになるが、本質的な問題ではない。また、(2.6)式の α_i,　 i=1,2,…,p は、当該反復測度要因の p 個の水準の効果を表す。

　ところで、(2.8) 式が成り立つような行列は "spherical" と呼ばれるので、循環性仮定のことを sphericity assumption とか sphericity condition と呼ぶことも多い (Crowder et al., 1990; Hochberg & Tamhane, 1987; Kirk, 1982)。

　これについて、本邦では SPSS/PC+ の日本語版マニュアル (Release 3.0) が、球状性仮定、竹内啓監修高橋行雄ら著 (1990) SAS による実験データの解析、が球面性（仮定）、STATISTICA (1996) が、球面性検定と訳しているが、定訳はない。最近では、SPSS も SAS も球面性検定と呼んでいる。

　これらのうち、球面性という訳は日本語のニュアンスとして球の"面"というイメージを連想しやすいのに対して、本来の sphere の意味は、例えば Cambridge Advanced Learner's Dictionary, 3rd Ed. では、"an object shaped like a round ball" となっており、「丸いボール」ではあっても「球の表面」の意味ではない。筆者は、以下に紹介するもとの sphericity test の意味及びそれとの混同の可能性、呼び安さ等を考慮して、これを球形検定と訳した (Chino, 1993; 1994; 1995b)。

　一方、分散分析の文脈とは離れて多変量仮説の検定の一つとして知られている検定に、モクリーの等方性検定 (sphericity test) (Mauchly, 1940) がある。ちなみに、等方性検定のための帰無仮説である、等方性仮説は、少し後の (2.9) 式で表される。ここで、等方性の訳は竹内 (1989) 編集の統計学辞典による。等方性検定の意味はもとの変数が"面"ではなく多次元の方向に等質的に広がっているかどうかである。千野は、最近ではこちらも「球形検定」と訳している。

　ここで、Mauchly 発音については、最近彼が 1940 年当時教鞭を執っていた米国の Ursinus College の数学のある教授に筆者が直接確認したところ、モクリーと呼ばれていたことがわかった。これについては、たとえば STATISTICA は、少なくとも平成１１年の時点ではマーキュリーの球面性の検定と呼んでいるが、この発音は適切とは言いがたいし、混乱を招くのではないか。

　等方性検定は、たとえば Anderson (1958) にも示されているように、もともと N (μ, Σ)、すなわち p 次元多変量正規母集団からの無作為標本 x ₁, x ₂, ... , x _N をもとに、帰無仮説

(2.9)

を検定するもので、 sphericity という概念は、この H ₀ そのものの幾何学的意味に由来する。ここで、σ は、未知の定数である。(2.9) 式は、 p 次元多変量データが、任意の平均ベクトル（μ）を持ち、分散一定（σ²) ですべての変量間の共分散（したがって相関も）がゼロなる多変量正規分布母集団からの標本である、という仮説である。

　一般に N (μ, Σ) なる母集団での変数 x の分布は、p 次元空間の

(2.10)

なる集中楕円面 (concentration ellipsoids) で表され、さらにその広がり具合は、楕円面の主軸 (principal axes) により表現できる。
　そこで、(2.9)式で表される等方性仮定は、直前のパラグラフの青色で示した言い方とは異なるもう１つの言い方として、主軸の長さがすべて等しい、すなわち球 (sphere) であるとする仮定である、ということもできる。言い換えればこの仮定のもとでは、変量の分布はどの方向に対しても等方的である、とも言える。

　上のような議論からは、(2.8) 式の仮説の検定、すなわち球形検定は正規直交対比変数に適用された場合のモクリーの等方性検定、とも呼べる。Huynh and Feldt (1970) は、分散分析の文脈では (2.8) 式が成り立つことが、要因の効果の検定統計量 F が歪まないための必要十分条件であることを示している。

　一方、Rouanet et al., (1970) が示したのは、(2.5)式そのものでなく、

(2.11)

という条件である。(2.11)式は、反復測度要因の水準相互の変量の差の分散がすべて等しいことを表しており、彼らはこの条件が、(2.5) 式に等しいとした。 (2.11)式を満たすような Σ は、H 型行列 (a type H matarix, Σ_H) と呼ばれたり (Huynh and Feldt, 1970)、 SAS などでは H 型共分散 (a type H covariance) と呼ばれたりする。これに対して、 Mendoza, Toothaker, and Crain (1976) は、 Σ が H 型でなくても球形仮定が成り立つことを示している。

　以下の図１では、モクリーの多変量仮説の１つとしてのもとの等方性仮説（球形仮説）が成り立つ場合のデータの特徴を MATLAB によりイラスト化して示した。図の４つの散布図のうち、上部左側の図は、平均がすべてゼロで変数相互間もすべて無相関なる 1,000 個の３変数からなる正規乱数を発生させ、３次元空間上にプロットしたものである。それに対して、４つの散布図の残りの３つは、当該３変数の３次元空間への同時プロットではなく、いわばそれを Dim.1-Dim.2 平面、を Dim.1-Dim.3 平面、を Dim.2-Dim.3 平面に順に投影した２次元の散布図である。

図１．多変量仮説の１つとしてのモクリーの等方性仮説が成り立つ場合の３変量データの散布図

　一方、つぎの図２は、MATLAB の球面座標生成のルーチンを用いて３変数の球面上の座標値を発生させ、特別な MATLAB の球面描画ルーチンによりこれを上部左側の図に、また、当該３変数の３次元球面上の点の座標を２次元ごと、すなわち 1-2 平面、1-3 平面、及び 2-3 平面に投影して描いたものである。これらの図のうち、上部左側の球面の図を除く他の３つの平面上に投影された球面上の座標では、これらの点が球の表面にのみ位置することを明示できていない。

図２．MATLAB による３変数の球面上の座標値による３次元球面の表示と、座標値の２次元平面への投影

　そこで、図３では半径２の２次元球面、すなわち円の周上の 201 点のそれぞれの位置で、標準偏差の異なる正規乱数を５つづつ発生させプロットさせた。この図は、多変量仮説としての等方性検定における等方性の意味を、２変量の場合に限定し、さらにデータが２次元平面上に等方的に広がっているのではなく、２次元球面の近傍にのみ広がっていると（誤って）仮定した場合にイラスト化したものである。

　ここで、このような２次元平面上でのデータの分布状態は、分散分析の文脈での球形仮説、(2.8) 式が例えば１要因反復測定デザイン ANOVA で要因の水準数が３の場合、３変量を特別な形で変数変換することにより２変量に変換することに対応している。

図３．SAS や SPSS の表現である「球面性仮説」の２次元版における常識のレベルでの意味内容

　上記図１から図３を見れば、「球面性」という "球の表面を連想させる" 表現が、モクリーのもとの多変量仮説の文脈でも、また分散分析の文脈でも、適切とは言えないことは明らかである。

　つぎに、球形仮定は実際のデータを考えるとき果たして成り立つことが多いのであろうか。一般的には、この仮定はデータの性質に依存しよう。ここでは、1.5.5 節の鏡映描写実験データの標本共分散行列を表 2.1 に示し、その特徴及び Mauchly の球形検定の結果にふれる。

　この表の試行間共分散行列の特徴は、反復側度の水準に時点を充てる時にしばしば見られるもので、隣接試行間の相関は相対的に高いが間隔が離れる程低くなっている。1.5.5 節のデータに対して Mauchly の球形検定を行うと、あとで見るように球形仮定は成り立っていないことがわかる。

　最後に、３変量の架空のデータを考えてみよう。表 2.2 は３変量間の正規乱数を発生させるに際しての正規分布の標本共分散行列である。ここで、同分布の平均ベクトルは、(1.0, 2.0, 3.0) である。

また、図４は、うえの表 2.2 なる標本共分散行列を持つ正規乱数データを MATLAB で 1000 サンプル分発生させた時の３変量間の散布図と、それを各２次元平面上に投影した場合の２変量散布図を示したものである。

図４．架空の 1000 個の３変量正規乱数による３変量の散布図

最後に、図５はこのデータを正規直交行列（ここでは、ヘルメルト行列）により２変量データに変換したものの散布図を示す。変換後の２変量データの相関係数は、-0.2459 であり、その共分散行列も必ずしも (2.8) 式の球形仮説どうりにはなっていない。もちろん、実際のデータでは、この例のように球形仮説はいつも満たされるとは限らず、そのような場合、球形仮説からの乖離が大きくなると分散分析における要因の効果の検定のための統計量に無視できない歪みが生ずることになる。

図５．架空の 1000 個のデータの正規直交変換行列による変換後の２変量の散布図

第２章 反復測度分散分析 2.1 節 球形検定 2.1.1 節 対称性仮定と球形仮定

第２章　反復測度分散分析
　2.1 節　球形検定
　　2.1.1 節　対称性仮定と球形仮定