浅谈生存分析

在生物医学研究中,生存分析是非常重要和常见的分析方法。本文对生存分析中的Kaplan–Meier模型、Cox比例风险模型进行简要的介绍,帮助大家更好地理解生存分析等相关概念。

生存分析经常用在癌症等疾病的研究中,例如在对某种抗癌药物做临床试验时,会首先筛选一部分癌症患者随机分为两组,一组服用该试验药物,一组服用对照药物,服药后开始统计每个患者从服药一直到死亡的生存时间,通过考察两组之间的病人在生存时间上是否有统计学差异来判断试验药物是否有效。

在这里,死亡是整个实验中重点观测的事件,即event。对于每个病人,需要记录他们发生该事件的具体时间。因此,生存分析可以抽象概述为,研究在不同条件下,特定事件发生与时间的关系是否存在差异。

这些具体事件可以是死亡,也可以是肿瘤转移、复发、病人出院、重新入院等任何可以明确识别的事件,而不同条件即为不同的分组依据,可以是年龄、性别、地域、某个基因表达量的高低、某个突变的携带与否等等。

A列是从试验开始起,持续的观测时间,星号代表在该时间有删失数据发生;

B列是指在A列对应的时间开始之前所有存活的研究对象个数,也可以叫做at risk的人数,表示当前具有死亡风险的有效人群,是排除了已经死亡和删失的数据之后剩余的人数;

C列为恰好在A列对应的时间死亡的人数;

D列是在该时间点删失的个数,即在实验过程中丢失的、失去跟踪的数据。

在引入Kaplan–Meier公式之前,大家可以先尝试自己去思考下如何计算每个时间节点的生存概率,即研究对象从试验开始直到某个特定时间点仍然存活的概率S(t)。比如在1.536年这个时间点,即表中的第五行,病人在该点的生存概率是多少呢?

很容易可以想到,要想在1.536这个时间点存活,他/她必须在1.536之前的所有时间点存活才行,也就是说在0.909、1.112、1.322、1.328这几个时间点,病人都必须存活。那么在1.536这个时间点的生存概率实际上就等于在包括1.536 在内的所有之前的时间点都不死亡的概率乘积,即:P(存活至1.536) = P(0.909时不死亡) * P(1.112时不死亡) * P(1.322时不死亡) * P(1.328时不死亡) * P(1.536时不死亡)

对于某个特定时间点不死亡的概率,可以用 1 – 死亡概率 来估算,举个例子:P(0.909时不死亡) = 1 – P(0.909时死亡) = 1 – (0.909时死亡的人数)/(0.909之前的所有人数) = 1 – 1/10 = 0.9

当我们计算出每个时间点不死亡的概率之后,我们就可以通过连续乘积算出每个时间点的生存概率,即存活至该时间点的概率。如下表所示:

该表中E列即不死亡概率,F列则表示累积的生存概率,可以看到随着时间增加,死亡人数增多,越到后期,生存概率越低。

上面这个例子的思路就是Kaplan–Meier方法的主要思路,我们也可以用数学公式来表示。一共有m个时间点,每个时间点用下标 i 来表示, i 为从 1 到 m 的整数, 生存概率 S(ti) 可以表示为:

其中,ti 表示第 i 个时间点,ni 表示在 ti 之前的有效人数,di 表示在 ti 死亡的人数,S(ti-1) 表示在上一个时间点 i-1 的生存概率。

根据这一公式,我们可以画图来展示生存率的变化情况,即Kaplan-Meier生存曲线,如下图所示:

图中横轴即时间轴,纵轴是累积存活比例,也就是生存概率,加号表示删失数据。

一般来说,生存分析是要比较不同组之间的一个生存情况,因此Kaplan-Meier生存曲线一般不止一条曲线。如果想比较整体生存时间分布是否存在统计学差异,一般我们可以采用Logrank统计方法来对生存数据进行统计分析。Logrank统计方法假设两组的生存时间分布一致,去检验是否能拒绝该假设。

除了Logrank检验之外,常用的检验包括Breslow检验,即Wilcoxon检验。该方法加入了权重因子,即每个时刻的总人数,使得试验前期的权重较大,贡献更大,所以Breslow检验对试验前期的差异更加敏感。

Kaplan-Meier方法只能针对单一的变量进行分析,无法同时考察多个因素。当需要同时考察多个因素的影响时,这时我们可以使用Cox比例风险回归模型。

Cox比例风险回归模型(Cox's proportional hazards regression model),简称Cox模型,Cox来自提出者英国统计学家D.R.Cox的名字,主要用于肿瘤和其他疾病的预后分析。这个模型是一种半参数回归模型,因为它的公式中既包含参数模型又包含非参数模型。

其中

t是生存时间,

x1, x2到xp指的是具有预测效应的多个变量,

b1,b2到bp则是每个变量对应的effect size,即效应量,可以理解为结果的影响程度。

h(t)就是不同时间t的 hazard,即风险值,例如在观测死亡事件时,指的是研究对象从试验开始到某个特定时间t之前存活,但在t时间点发生死亡的概率。

h0(t)是基准风险函数,也就是说在其他协变量x1, x2到xp都为0时,即不起作用时,衡量风险值的函数。

根据公式我们可以看到指数部分是参数模型,因为其参数个数有限,即b1,b2到bp,而基准风险函数h0(t)由于于其未确定性,可根据不同数据来使用不同的分布模型,因此是非参数模型。所以说, Cox模型是一种半参数模型。

从公式中我们可以看到,Cox模型能够把诸多可能影响生存率的因素都当作协变量引入到公式中去,在该公式中即x1, x2到xp,所以可以同时考察多个因素的影响。

我们的主要目标是通过一定方法来找到合适的h0(t),以及所有协变量的系数b1,b2到bp。实际上cox模型是需要用到极大似然估计等计算方法,首先构建特定的似然函数,通过梯度下降等方法来求解模型的参数,使得函数求解值最大,这里不对细节进行解读。

假设我们已经通过计算得到了合适的h0(t)和协变量系数,如何去解读结果呢?我们可以比较某个协变量x1 在不同值时对应的不同风险比(hazard ratio),这里 x1和x1+1,即若增加1个单位,增加前后的风险比实际上等于 exp(b1)。

假如x1指的是年龄,那么对于年龄 51岁 (x+1) 和年龄 50 岁 (x) 的人,可能死亡的风险比为 exp(b1)。如果b1>0,则 exp(b1)>1,意味着年龄+1,死亡风险增加;如果b1<0, 则 exp(b1)<1,意味着年龄+1,死亡风险降低;如果b1=0,exp(b1)=1,意味着年龄变化对死亡风险不起作用。从hazard ratio推导的结果看到,它是不包括时间t的。这是Cox模型可用的一个基本假设,即任意两人的风险比例是不随时间变化的。

研究者开发了方便进行生存分析的R包,survival和survminer。首先安装并加载这两个包:

在survival包中提供了coxph()函数可以用来计算cox模型:

method默认为 “efron”,也可以是 “breslow”和“exact” 。以示例数据为例:

从结果中看到:sex对应的系数(coef)为-0.5310,小于0表示sex增加会降低风险,风险比(hazard ratio)为exp(coef) =0.588,该数值小于1,同样表明sex增加会导致风险增加,即女性比男性预后更好。

除了关注系数外,同时需要关注的是p value,即该参数估计是否具有统计学显著性,这里给出三种方法的结果,分别是Likelihood ratio test,Wald test和Score logrank test。

分析多个因素的影响:

最后是结果的可视化:

以上是对生存分析中主要知识的一个整理,希望梳理清楚生存分析中的大多数概念,有助于大家在自己的工作中使用相关方法进行分析。

本文来自作者[薛瑞丽]投稿,不代表博利网立场,如若转载,请注明出处:https://boliduo.cc/bl/3882.html

(17)

文章推荐

  • 新手怎么开始学化妆

    新手学化妆有几种方式:自学、做学徒、化妆培训学校。自学:可以在一些网站上去学习化妆技巧和手法,或者看视频,自己再慢慢练习;但时间耗费长,没有练手的机会,学的不够专业。去化妆店当学徒:在店里打下手,然后“偷师”学习,因为店里一般不愿意带新人,而且需要的就只是助理,如果他们需要化妆师,可以直接外招,而不

    2025年08月31日
    20
  • 小动物科普小知识

    1.关于小动物的有趣小知识关于小动物的有趣小知识1.关于动物的经典小常识~最好有趣点的.猪为什么爱拱泥土?答案:现代的猪是经过千万年的驯养演变过来的.猪喜欢用嘴拱泥土和墙壁,并不是在寻找食物,而只是野生时代里遗传下来的习惯.为什么鸟类没有牙齿?答案:我们看鸟类的嘴都是角质的,口腔内也没

    2025年09月22日
    16
  • 欧舒丹precious serum用法

    欧舒丹preciousserum是一款非常受欢迎的面部精华液。它的用法非常简单,只需要在洁面后,将适量的精华液均匀涂抹于脸部和颈部即可。使用时,建议先将精华液倒在手心,再用指尖将其轻轻按摩至全脸。重点在于眼周和唇周需要轻柔按摩,并且要避免过多的拉扯肌肤。可以选择每天早晚使用一次或者只在晚上使用一次

    2025年09月24日
    21
  • 听露乌发滋养精华液使用方法

    1、拨开发根,把乌发滋养精华液均匀的喷在头皮上,用手或软毛牙刷按摩头皮。2、然后用梅花针轻轻敲打头皮,促进精华液吸收,全头只需要轻轻敲打五分钟。3、然后用气囊梳敲打全头15分钟。4、再次将乌发滋养精华液均匀的喷在头皮上,这次只需再用气囊梳敲打头皮5分钟就结束了。每天只需20分钟哟!

    2025年09月27日
    18
  • 贞观政要论求谏

    唐太宗从隋亡吸取的最重要的教训是:认识到君与民的关系是舟与水的关系。唐太宗在位期间,君臣关系融洽和谐,契若金兰,为后世推崇。这主要缘于唐太宗吸取前朝覆亡的教训,头脑清醒,心胸开阔,从谏如流,善于自省。盘圆水圆,盂方水方。因为皇帝闻过则喜,言者无罪,故臣下知无不言,言无不尽。唐太宗对君臣关系多有论述,

    2025年10月09日
    31
  • 海的女儿手抄报简单又漂亮

    海的女儿手抄报简单又漂亮如下:1、在手抄报的上方正中写上标题“海的女儿”。在手抄报的左上方画出巨大的翻滚的波浪。在手抄报的右下方画出美丽的人鱼公主,头顶上画出扇贝和水母,右下角画一些水草。在手抄报中间画一个不规则的文字框,底部画上海星和许多泡泡。2、把标题涂上红蓝相间的颜色,波浪是深浅不同的蓝色,人

    2025年10月13日
    16
  • 常吃阿司匹林的危害是什么

    相信很多人都知道阿司匹林,这种药被人们称作万能药,在临床上被广泛运用于出现发热的患者身上,能够对感冒流感等原因引起的发热产生退烧作用,无论是老人还是孩子阿司匹林都适用。同时,还能够降低心肌梗死发生的概率,在中老年群体中有极大的热度。最为重要的是,在心脑血管疾病中,阿司匹林表现突出的预防作

    2025年10月14日
    17
  • 创建文明城市入户调查技巧

    南开区正在创建全国文明城区,创建周期为2018-2020年,三年中,每年要接受上级部门的测评。我们南开区的每位居民都有可能碰到测评人员上门开展问卷调查,请您及您的家人礼貌接待,认真填写问卷,选择对我们最有利的选项,用实际行动为南开的未来加分。相关事项提示如下:一、如何开展全国文明城区测评入户调查问

    2025年10月22日
    24
  • 六年级英语单词人教版

    Unit1by(经,乘)foot(脚)bike(自行车)bus(公共汽车)train(火车)plane飞机ship船;舰subway地铁how(怎样)gotoschool(上学)fifth第五traffic(交通)trafficlight(交通灯)trafficrul

    2025年10月24日
    11
  • 勤俭节约从我做起主题班会

    勤俭节约从我做起主题班会6篇 上学的时候,许多人都参加过一些经典主题的主题班会吧?主题班会形式活泼生动,安排紧凑,气氛和谐。主题班会需要准备哪些内容呢?以下是我帮大家整理的勤俭节约从我做起主题班会,供大家参考借鉴,希望可以帮助到有需要的朋友。勤

    2025年10月27日
    18

发表回复

本站作者后才能评论

评论列表(4条)

  • 薛瑞丽
    薛瑞丽 2025年10月09日

    我是博利网的签约作者“薛瑞丽”!

  • 薛瑞丽
    薛瑞丽 2025年10月09日

    希望本篇文章《浅谈生存分析》能对你有所帮助!

  • 薛瑞丽
    薛瑞丽 2025年10月09日

    本站[博利网]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享

  • 薛瑞丽
    薛瑞丽 2025年10月09日

    本文概览:在生物医学研究中,生存分析是非常重要和常见的分析方法。本文对生存分析中的Kaplan–Meier模型、Cox比例风险模型进行简要的介绍,帮助大家更好地理解生存分析等相关概念。...

    联系我们

    邮件:博利网@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们