その統計モデルはMultivaliableなのか,それともMultivariateか?

book book pages bookcase browse

多変量を意味する multivariable / multivariate という語について,定義の違いを意識することなく使用していることにある時気付き,反省とともに語に関する定義の違いを調べていると以下の論文がヒットしました。

Hidalgo, B., & Goodman, M. (2013). Multivariate or multivariable regression?. American journal of public health, 103(1), 39-40.
www.ncbi.nlm.nih.gov

文献内にてこれらの語の定義に関する提言していたのでまとめています。

MultivariableとMultivariateの違い

最初から結論となってしまいますが,著者らは「1つの結果変数に対して,複数の独立変数や予測変数を有するモデル」を”Multivariable”な統計モデルとして「複数の結果変数に対して,1セットの予測変数を有するモデル」を”Multivariate”な統計モデルとして記述しています。

文献内では線形回帰を例に,次のようにMultivariableなモデルとMultivariateなモデルを表現しています。

Multivariableな統計モデル

 y = \alpha + x_1\beta_1 + x_2\beta_2 + ... + x_k\beta_k + \epsilon

Multivariateな統計モデル

 Y_{n*p} = X_{n*(k+1)} \beta_{(k+1)*p} + \epsilon

これらの語に関する定義の違いは単なるsemanticな問題に過ぎないですが,調査時や報告時には使い分けを意識しておくに越したことはないといえるでしょう。

また,この話題はresearchgateでも取り上げられており,やはりというべきか,定義の違いを意識しておくほうがよさそうです。

www.researchgate.net

コメント