EPV≧10 (a)
ロジスティック回帰で投入できる変数の数はイベントの数の1/10までである,という経験則がある. 世の中の全てがそれですめばよいのだが,そうはいかない. よくまとまっているのは,こちら.
しかし結局どうやって変数の数を決めればよいのかは分からない. 上記のリンク先にある論文についてまとめてみようと思う.
ログオッズあるいはロジット
変換はinvolutionであり,である. のオッズは,
となる. それゆえロジットをにより定めると,のロジットは,
となる. さての関数が区間]からへの写像であるとしよう. 対称性からは,関数等式を満たしてほしい. そのようなとしては,logitが存在するわけだが,それ以外に存在するだろうか. logitを参考にすると,を1変数関数として,
なる形の関数がこの等式を満たす. はへの全単射であってほしいから,
も満たしてほしい.そのためにはであれば十分である. または単調であることも要請する.区間上で
である. やならばこれらの条件を満たす. ちなみにの1/2でのテーラー展開は以下のようになる.
見ての通り1/2に関して交代で,のとき,
である.
オッズ
確率のオッズは,
で0,で,で,
となる.