Logistic回帰に関するメモ

Logistic回帰についてまとめます.

繰り返し計算による回帰係数の決定

ロジスティック回帰の係数は最尤法により決まるわけだが,繰り返し計算によって収束し値が求まる.

オーバーフィットとはなんぞや

回帰モデルに投入する変数が多いとオーバーフィットする,という. ではオーバーフィット(過剰適合)とは何を指すのか? よく例に出されるのはn個の点とそれを通るn-1次式である. 全ての点を正確に通るが補外はおろか補間もできそうにない. n <- 10 x <- …

ロスマンと多重比較

ロスマンは多重比較を考慮しないそうだ. Rothman KJ. No adjustments are needed for multiple comparisons. Epidemiology. 1990 Jan;1(1):43-6. PMID: 2081237. 引用数は4000以上. 並の疫学者はひれ伏すであろう. ロスマンが言っているから多重比較は考…

『完全無欠の賭け』

『感染の法則』が面白かったので同じ著者の本を借りた. やはり軽快な文章で面白い. この本の訳では一人称は私. 脚注番号があるのに本の中に脚注がない. 巻末に「本書の原注は,下記のURLよりPDFファイルをダウンロードしてご覧ください.」とあった. 今…

EPV≧10 (d)

次は, Riley RD, Snell KI, Ensor J, et al. Minimum sample size for developing a multivariable prediction model: PART II - binary and time-to-event outcomes [published correction appears in Stat Med. 2019 Dec 30;38(30):5672]. Stat Med. 2019…

EPV≧10 (c)

続いて,2019年の論文である. Google scholarでは引用数150. Crossrefでは83.Web of Scienceでは74. van Smeden M, Moons KG, de Groot JA, et al. Sample size for binary logistic prediction models: Beyond events per variable criteria. Statistic…

EPV≧10 (b)

ロジスティック回帰においてEPV≧10の起源は以下の論文のようである.まだ25年前だから新しいと感じる. ネット上にPDFが転がっているが真っ当なものかどうかはあやしい. Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR. A simulation study of …

EPV≧10 (a)

ロジスティック回帰で投入できる変数の数はイベントの数の1/10までである,という経験則がある. 世の中の全てがそれですめばよいのだが,そうはいかない. よくまとまっているのは,こちら. en.wikipedia.org しかし結局どうやって変数の数を決めればよい…

『感染の法則』

著者の一人称が僕なのが独特. 文章はとても読みやすい. フラミンガム研究が出てくる. フラミンガム研究のデータを使って肥満が伝染するのか調べたのだ. 「ブラボー! ニック・クリスタキスとジェイムズ・ファウラーの想像力と勇気に脱帽だ」 ゲルマンも…

ログオッズあるいはロジット

変換はinvolutionであり,である. のオッズは, となる. それゆえロジットをにより定めると,のロジットは, となる. さての関数が区間]からへの写像であるとしよう. 対称性からは,関数等式を満たしてほしい. そのようなとしては,logitが存在するわけ…

オッズ

確率のオッズは, で0,で,で, となる.