spss--数据分析Log-Binonial模型

               在横断面研究中,Log-binomial 模型能够获得研究因素与结局变量的关联强度指标患病率比(PR),是一种研究二分类观察结果与多因素之间关系的重要方法,在医学研究等领域中得到了广泛的应用。

采用log-binomial 模型可直接估计PR,  log-binomial模型的因变量y服从二项分布 ,且因变量(y= 1)概率的对数与自变量呈线性关系:

 

其中,

 

β表示控制其他自变量时 , 自变量X 与Y之间的回归系数 ,PR = exp ( β)

01适用情形
 

但当事件的发生率较高(>10%)时 ,若仍用OR描述关联强度,则会高估暴露与结局的关联。因此,很多学者建议采用现患比(PR)描述暴露与结局的关联强度。

 

当存在连续型自变量时,可能导致log-binomial 模型出现不收敛的情况,这是则可采用COPY方法(数据集扩充,后面会介绍)。

02案例分析

假设有因变量Y与自变量X1,X2, X3, X4 等;因变量Y(二分类)患病率大于20%,自变量X1 为年龄age(连续型变量),其他均为分类变量;

对于此案例,最直接的方法是采用logistic回归模型,但是Y患病率大于20%,可能会高估OR值。因此,本例使用Log-binomial 模型的PR值来估计患病率与研究因素的关联强度

03 SAS 程序实例
 

PROC GENMOD 的详细使用可参照SAS help 手册。

 

 

在SAS/STAT中,通过PROC GENMOD 程序实现

数据集名为Log_binomial,参数统计量输出到Log_binomial _y中;

定义数据集OUT-para,  计算PR, LPR, UPR; 并打印

 

输出结果

 

 

但是,日志中警告 模型出现不收敛。可能的原因与很多,其中连续型自变量age可能导致模型出现不收敛;
下面采用COPY方法对数据集进行扩张。

04 SAS程序示例—COPY方法
 

当存在连续型自变量时, MLE(maximum likelihood estimation)估计的参数通常在参数所限制范围的边界上 ,MLE得不到似然函数导数为零的极大值点,导致模型不能收敛。

Deddens等学者提出先对原始数据集调整扩充后再拟合 log-binomial模型,称为COPY方法扩充原始数据集的步骤:当log-binomial 回归模型不收敛时,将原始数据集中Y=1的个案增加 c-l倍 ,然后再将原始数据集Y值互换 ,将这两个新的数据集合并成一个数据集, 即为复制(COPY )数据集 , 再利用 COPY 数据集拟合log-binomial 回归模型从而达到解决模型不收敛问题 。

通常C为常数 ,C越大(通常取1000) ,COPY数据集的伪似然估计值越接近于最大似然估计值 。在 SAS 软件中, 可以利用 genmod 模块中的加权log-binomial回归模型实现COPY 数据集下的log-binomial回归方法 。



对数据集log-binomial 进行复制,其中,c=1000;

 

再对数据进行log-binomial模型分析,应特别注意需要对 w 进行加权处理

 

结果输出

 

 

05 logistic回归模型与log-binomial模型的对比
 

从调整OR值和PR值可看出,log-binomial模型计算出的PR值要更接近与1。

 


http://www.niftyadmin.cn/n/4946086.html

相关文章

tomcat源码修改与编译

1、获取源码 从github下载其源码:https://github.com/apache/tomcat 2、选择版本 切换到对应版本(直接用相对应的Git tag即可): git checkout 9.0.793、修改源代码,并且生成补丁 这里我们以修改去掉新版本的ws的检…

【CTF-web】bugku-成绩查询(sql注入)

题目链接:https://ctf.bugku.com/challenges/detail/id/84.html 判断注入点 查看网页源码可知输入数据通过POST发送到index.php并显示出查询结果,可能需要sql注入。 如上图所示,当id为1时返回名字为“龙龙龙”的成绩单。 再测试&#xff0c…

More Effective C++学习笔记(1)

目录 条款1:仔细区别pointers和references条款2:尽量使用C风格的类型转换条款3:绝对不要以多态方式处理数组条款4:非必要不提供默认构造函数 条款1:仔细区别pointers和references 在任何情况下都不能使用指向空值的引…

五分钟搭建生鲜蔬果小程序

如今,随着移动互联网的快速发展,小程序已经成为众多企业和商家推广产品和服务的重要工具。而生鲜蔬果行业作为一个常见的消费领域,也开始逐渐转向小程序商城来进行销售和服务。那么,如何从零开始搭建一个生鲜蔬果小程序商城呢&…

Websocket原理和实践

一、概述 1.websocket是什么? WebSocket是一种在单个TCP连接上进行全双工通信的协议。WebSocket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手&…

Lodash——使用与实例

1. 简介 Lodash是一个一致性、模块化、高性能的JavaScript实用库。Lodash通过降低array、number、objects、string等等的使用难度从而让JavaScript变得简单。Lodash的模块方法,非常适用于: 遍历array、object 和 string对值进行操作和检测创建符合功能的…

使用 PyTorch 进行高效图像分割:第 1 部分

一、说明 在这个由 4 部分组成的系列中,我们将使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。我们将在本文中从图像分割所需的基本概念和想法开始本系列。 图1:宠物图像及其分割掩码(来源:牛津-IIIT宠物数据集) 图像分…

排污口水质的在线监测,实时掌握排口水质助力生态治理

水是生命之源,良好的水生态环境是社会发展的必然要求。然而随着工业化和城市化的发展,人类面临空气和水环境污染等严峻挑战,其中水环境问题尤为突出。排污成为城市和工业生产过程中不可避免的环保问题。 为加快解决生态环境突出问题&#xff…