导读
在Logistic回归分析时,偶尔会遇到这样的情况:P值与OR的95%置信区间(CI)结果矛盾的情况,即P0.05,但OR的95%置信区间却包括1;或者P0.05,但OR的95%置信区间却不包括1。这是怎么回事呢?
在单因素Logistic回归和多因素Logistic回归中都出现了这样情况。一般认为,这种情况很难发生,因为它们检验具有一致性。之所以发生这种情况,还与变量有关。有些人采取如下方法:一般都是合并变量的例数,回避这一问题。实际上,可能有如下一些原因:
1.存在多重共线性
多重共线性会产生大的标准误,导致单因素分析中Wald检验中P值过大,虽然标准误增大,会使OR的95%置信区间变宽,95%CI的上线或下线特别接近1但还未超过1这个界限,所以出现了P0.05,但OR的95%置信区间却不包括1。
解决的办法是可以利用逐步筛选变量的方法找出与因变量相关的变量,其他没有进入模型的变量在单因素分析中不给予分析。此外,还可以设法将彼此高度相关的自变量先综合成新变量,然后做因变量关于综合变量的回归。
2.该变量某一类的例数特别少
如文化程度,小学有人,初中人,高中30人,大学3人。可能会出现95%置信区间特别宽而包括1,而P值却0.05。解决的办法可以合并例数少的几类,如本例中可以合并高中和大学成一类为高中和大学。
3.样本含量太小
使估计结果不稳定,产生大的标准误,使本来可能有意义的变量变得无统计学意义。解决办法是增大样本含量。但是在Logistic回归中,到底多大的样本才算合适呢?根据国外一些专家的看法,如果样本小于,Logistic回归的最大似然估计可能就有一些风险,如果样本大于则比较合适。样本含量还依赖于变量个数和数据结构等条件。
一般是每一个自变量至少需要10例结局。这里说的结局例数不是整个样本的例数。假如,Logistic回归中自变量总共有5个,则至少需要50例研究结局,即如果你研究的因变量是自杀(1=自杀,0=没自杀),其中自变量有8个,那么你的研究中需有80个人是发生了自杀的。可是按照这种情况的话,很多研究的因变量发生结局是很少的,比如自杀这种结局是比较少的,可能我们研究的自变量有18个,但是自杀这个结局却远远没有例。
(本期案例搜集于网站:丁香园)
松哥统计说
请大家一定要明白,统计只是工具,去帮助我们发现事物背后的规律,不是去创造规律。然而运用这个工具必须符合该工具的使用说明。忽略运用条件的统计分析结果,是不可靠的。
本站热门贴集锦:
1.学习SPSS终身不忘必杀技!2.别说相关太简单,且听松哥说相关3.西藏冬虫夏草失窃案,松哥受邀告破实录4.统计学就是放屁!5.珍藏10款统计与作图软件放送啦!!6.SPSS数据录入格式总结7.她说方差分析有啥了不起!8.松哥被批评了,关于Meta分析异质性!9.英文论文写作40集视频免费送10.学习数据分析的最大困惑!!11.国家自然科学基金文献库全面免费开放12.临床试验的科研设计与数据分析9大易忽视的错误(推荐)13.轻松玩转PDF(推荐)14.R×C列联表(分类数据)的统计分析方法选择与SPSS实现15.Meta分析的精髓就是一个词的事?把握住就掌握了16.Meta分析解决的首要任务17.3年13篇SCI,最快5天写1篇meta文章的不为人知的秘密-end18.为什么每天必须要进步一点点19.诊断试验MetaDisc教学视频20.常用统计分析方法选择图解21.嗨,松哥,卡方分割可以自动实现吗?22.松哥荐“临床样本量计算最权威软件PASS教程”23.统计!统计!统计!24.医生与黑社会25.松哥的思维导图软件26.第一季10集集锦27.sata循证实践系列(1-8集)集锦28.本科、硕士、博士都学过统计,为啥还不会的死因!29.常用统计分析方法选择图解30.9种数据库如何导入Endnote全集31.SCI编辑让做偏相关散点图,神啊,松哥怎么破?32.样本量计算软件PASS集锦33.老司机教你如何学习统计软件;34.统计学习的“一个中心,两个基本点”35:34种统计数据转换神器Stat/Transfer36:SAS、SPSS、Stata&R软件如何读取Excel数据.
预览时标签不可点收录于话题#个上一篇下一篇