设为首页收藏本站

女知爱中华专业妇产科网站|中国妇产科学术中心|中国女性健康科普

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 7696|回复: 3

随访资料分析方法简介

  [复制链接]

457

主题

11

好友

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

admin 发表于 2011-5-19 22:00:23 |显示全部楼层
随访资料分析方法简介


摘自http://doctor.51daifu.com/2007/0305/89E84EC9C949T125671.shtml
中华放射肿瘤学杂志
作者:孙可淳 秦小棋
单位:100034 北京医科大学第一临床学院医学统计室
  病例随访资料的分析方法是医学统计学的一个分支,是以生存时间为观察指标,研究生存期的统计方法。常用生存期分析可分为非参数法、参数法和多元分析方法。生存期分析方法是肿瘤疾病科研最常用的方法之一。
  临床疗效的观察常选用治愈率,有效率和病死率等指标,这些指标可用于预后在较短的时间里能够确定的疾病,例如,目前常用洛塞克治疗溃疡病,很快可以见到其治疗效果,经过一个疗程后,统计治愈、好转、无效的人数,计算治愈率,有效率。但是,肿瘤疾病的病死率不是手术后很快能观察到的,必须经过一定时间跟踪随访才能知道。肿瘤临床疗效的指标常选用生存率、复发率、中位生存时间和平均生存时间。生存率或复发率随着时间延长而改变,例如某肿瘤手术后1年生存率0.980,2年生存率0.889…,往往时间越长生存率越低,复发率越高。


  随访病例,要有一个明确的标准起始时间,如诊断、手术后第1天、放射治疗结束后第1天等为开始时间,并有同一个截止时间,如1997年12月31日。随访的结果有4种情况:(1)死(或复发)于本病或死于本病的并发症。(2)死于其他疾病。(3)观察到截止日期还活着。(4)随访中失去联系。以上4种情况观察值均未能观察到预定的观察点,都不能提供完全信息,这种观察值称为终检值。失访病例由于没有提供完全的信息,不能按死亡处理。例如,乳癌术后生存,以手术后第1天开始,观察到1997年12月31日。某患者1991年12月手术,1995年12月死于乳癌的并发症,她的随访时间是48个月,结局死亡,属于非终检值。另一患者1996年1月手术,1997年12月还生存,随访时间24个月,结局生存,属于终检值。从开始观察到出现结果(死亡或复发)称为生存(或复发)时间。临床工作者为了解肿瘤治疗效果,计算生存率,往往还要知道生存率与各种影响因素,如性别、年龄、手术后开始放射治疗时间、放射治疗剂量、淋巴结是否有转移、病理类型等的关系。下面就这两个问题进行讨论。
  1 生存率的计算
  计算生存率有两种方法:直接法和生存率法。
  1.1 直接法
  以计算放射治疗5年生存率为例,以放射治疗后第1天为开始时间,分子是活过5年病例数,分母是期初的观察数,应包括放射治疗后活过5年的病例数和5年内死亡的病例数。例如,病理分级3级的子宫内膜癌生存率的计算,原始资料见表1。
表1 子宫内膜癌原始资料

患者编号1234567891011121314
随访时间(个月)69121221242627343640484860
结局*11101111111111

  注:*:1为非终检值,0为终检值  1年生存率:11/14×100%=78.6%,2年生存率:9/13×100%=69.2%,3年生存率:5/13×100%=38.5%,5年生存率:0/13×100%=0。
  直接计算生存率法的优点是方法简单,在样本含量较大的情况下,可以得到满意的结果。由于病例要求必须观察满n年,未满n年的病例则必须剔除,丢掉了部分信息。本例中第4例患者因为是终检值,在计算2,3,5年的生存率时不能参与计算。还可能出现不合理的情况,如在计算几个不同年限的生存率时,有时会出现后1年的生存率比前1年的生存率高的不合理的现象,这可能与例数少有关。临床科研中病例数相对较少,终检值多,一般不采用直接计算法。
  1.2 生存率曲线
  生存率曲线又分为积极限(PL)法和寿命表法,属于非参数法。
  积极限(PL)法或称Kaplan-Meier估计法。其图示为生存曲线,它是以时间t为横坐标,生存(或缓解)率为纵坐标,表示时间与生存率函数曲线。根据曲线图可以对某一病例预期生存大于t的概率做出估计。仍以上例如某癌手术后病理分级为3级的生存率计算见表2。
表2 生存率的计算

随访时间(个月)例数随访结果期初人数时点生存概率生存率生存率标准差
611140.928 60.928 60.068 8
911130.923 00.857 10.093 5
1211120.916 60.785 70.109 7
1210111.000 00.785 70.109 7
2111100.900 00.707 10.123 6
241190.888 80.628 60.132 5
261180.875 00.550 00.137 3
271170.857 10.471 40.138 3
341160.833 30.392 80.135 7
361150.800 00.314 20.129 3
401140.750 00.235 80.118 5
482130.333 30.078 60.075 3
60111000

  上表计算方法:首计算各时点的生存概率,例:随访6个月时共有14人(后面的每个人都经过6个月这一时点且生存),死亡1例,生存13例,时点的生存概率0.928 5,9个月时点共有13人,死亡1例,生存12人,时点的生存概率0.923 0,12个月时点共有12人,死亡1人时点的生存概率0.916 6,48个月共有3人死亡2人,生存概率0.333。然后将各时点生存概率求积,就是该点的生存率,又称累积生存率。6个月0.928 5,9个月0.928 5×0.923 0是0.857 1,12个月0.857 1×0.916 6是0.785 6…。生存率曲线计算方法的优点:不论是死亡、失访、死于他病、截止时还活着的病例都能参加生存率的计算,因而能够最充分利用了每1例病人的信息。此种方法特别是终检值较多时是临床随访资料常用的方法。
  根据不同要求,如按不同年龄、不同性别、不同危险度等,可以计算不同的生存率曲线(Kaplan-Meier曲线)。
  2 不同样本的生存率的比较
  临床科研工作者需要探讨影响生存率的因素,即对不同样本生存率的比较,有终检值时,常用gehen比分法、Log-rank检验、wilcoxon比分法检验。这些检验方法是对某一个因素的检验,单因素方法。这些方法属于非参数方法。现以Log-rank法(又称时序检验)说明其意义。
  例如某癌手术后病理分级2,3级比较,病理2级1,3,5年生存率0.833 3,0.694 0,0.574 0。3级1,3,5年生存率为0.785 7,0.314 2,0.0。用Log-rank检验是对两条生存率曲线做检验,虽然选用χ2统计量,但是与一般的四格表两个率的χ2检验计算过程不同。计算方法从略,结果见表3。
表3 Log-rank检验

级别病例数实际死亡数理论死亡数
2241016.34
314136.66

  经Logr-ank检验χ2=8.49,P=0.003。根据以上检验结果可以认为病理分级不同生存率也不同。病理分级2级生存率高于3级。
  3 Cox回归模型
  上面不同样本生存率的检验方法只能用于单因素分析,不能用于多因素分析,Cox回归模型是用于随访资料的单因素和多因素统计分析,Cox回归模型是一种比例风险函数,属于半参数方法。基本公式如下:
h(t)=h0(t)e(β1x1+β2x2+…βkxk)                    (1)
  如果以死亡作为风险度,h(t)表示某患者在t时点出现的死亡率,t指生存时间;h0表示某患者在t的本底死亡率(即x1 x2 …xk为0时);x1 x2 …xk表示可能与生存率有关的个体特征变量,如年龄,病理类型等;β1β2…βk 表示Cox模型的回归系数,根据资料的实际数据计算而得;β1x1:表示第一个因素x1如(年龄)所产生的作用,使病死率由h(t)增加至h0(t)eβ1x1,常数e=2.718。从式(1)可见死亡风险度与βixi有关,当βi为正数时增加死亡风险度,当βi为负数时降低死亡风险度。
  4 Cox回归模型的用途
  4.1 对生存率危险因素的筛选,计算Cox模型的回归系数(β1β2…βk)。并进行显著性检验,可以在众多的影响预后的因素中挑选出有显著性的因素。
  4.2 对病人的预后预测预报,由式(1)可见β1x1+β2x2+…βkxk直接影响到危险度,其值大病死率高预后差,其值小病死率低预后好。可以反映预后,称为危险度,又称预后指数(PI)。
PIβ1(x1-1)/S1+β2(x2-2)/S2+…βk(xkk)/Sk        (2)
  式中i为xi的平均数,Si为标准差,β1β2…βp为有显著性的回归系数值。根据式(2)可以计算出全部病人的PI值,根据PI值可将病人分为3~5组分别计算不同PI值组别的生存率,可用Breslow法(Cox模型)或Kaplan-Meier法。
  4.3 计算相对危险度(PR)
PRkeβk             (3)
  上面公式适合变量值xi是0和1的资料。
  现用83例子宫内膜癌为例,对Cox回归模型结果做解释,见表4。
表4 83例子宫内膜原始数据

患者编号x1x2x3x4x5x6x7x8timecen
14101210222760
25411100212620
83525121134421

  表中x1年龄,x2手术方法,x3病理类型,x4病理分级,x5肌层浸润,x6颈管累及,x7临床分期(旧法),x8临床分期(新法),time随访时间,cen随访结果。1号患者年龄41岁,手术方法为子宫全切,病理类型属腺癌,病理分级属2级,无肌层浸润,未累及颈管,临床分期(旧法)属于
  Ⅰa,临床分期(新法)属于Ⅰa,随访时间276个月,随访结果:生存(或死于其他疾病,或失访)影响子宫内膜癌生存率的8个影响因素,通过Cox回归模型回归分析,计算回归系数,并对回归系数进行显著性检验,筛选出生存率的影响因素,结果见表5。 表5 Cox回归模型的筛选结果

因    素xs
病理分级(x4)1,2,31.630.76
肌层浸润(x5)0,1,21.070.71
临床新法分期(x8)1~52.781.47
因    素回归系数
  (β)
标准误
病理分级(x4)1.174 50.385 9
肌层浸润(x5)1.354 20.495 8
临床新法分期(x8)0.600 80.214 4
因    素tP
病理分级(x4)3.0420.003
肌层浸润(x5)2.7310.008
临床新法分期(x8)2.8020.006

  表5可见生存率与病理分级,肌层浸润、临床新法分期有关(P<0.05),回归系数值均为正数,显示出正相关关系。病理分级越高、肌层浸润越深、临床新法分期越高,预后越差,病死率越高。
  从表5显示出的回归系数可得到预后指数公式。
PI=1.174 5×(x4-1.63)/0.76+1.354 2×(x5-1.07)/0.71+0.600 8×(x8-2.78)/1.47
  根据上式,可计算出每1例患者的PI值。例如某患者x4=1,x5=0,x8=1,PI=-3.74。83例患者的PI值范围在-3.74至4.80,以PI值为0时为界,将全部资料分为两个组,PI<0共43例,其中随访时间最短24个月,最长278个月,无1例死亡。PI≥0,40例,最短3个月,最长278月,死亡24例。用Kaplan-Meier计算生存率,并绘制生存曲线。见表6及图1。 表6 不同PI值子宫内膜癌生存率

时间(年)PI<0PI≥0
01.0±0.01.000±0.00
11.0±0.00.825±0.06
21.0±0.00.696±0.07
31.0±0.00.545±0.08
41.0±0.00.417±0.08
51.0±0.00.341±0.08
61.0±0.00.341±0.08
71.0±0.00.299±0.08
81.0±0.00.299±0.08
91.0±0.00.299±0.08
101.0±0.00.299±0.08

图1 生存率曲线
  从表6,图1可见子宫内膜癌手术治疗后,生存率与病理分级、肌层浸润、临床分期(新法)有关。以PI是0为界将资料分为两组:PI<0,观察43例,无1例死亡,1,3,5年生存率为1.000;PI≥0时,观察40例死亡24例,1,3,5年生存率分别为0.825,0.545,0.341。对于新病例先计算PI值并估计其预后。所以Cox回归模型的分析在临床中得到广泛的应用。
  计算机的通用统计软件如SPSS,SAS,STATA软件包均有生存分析的程序,可用于Cox回归模型分析,以上资料分析用STATA软件完成。

回复

使用道具 举报

125

主题

3

好友

737

积分

高级会员

Rank: 4

家有儿女 发表于 2011-5-19 23:26:38 |显示全部楼层
回复 admin 的帖子

六、随访要注意的问题
1、随访期 开始随访和终止随访的日期均应明确。确定随访期应了解疾病的诱导期和潜伏期,并据之做出假设。随访时间的长短取决于暴露与疾病的联系强度,以及疾病潜伏期的长短。暴露因素作用越强,随访时间越短;潜伏期越长,随访时间也越长。
2、研究对象的随访随访目的 ①确定研究对象是否仍处于观察之中,即确定分母信息;②确定研究人群中的结局事件,即确定分子信息;③进一步收集有关暴露和混杂因素的资料,以备分析时用。
3、随访的方法 ①利用记录或档案:利用常规登记的人群和疾病资料来随访研究对象。②进行特殊安排的随访:访问研究对象或其他能够提供信息的人,定期家庭访视、电话询问或通信等。对研究对象进行测定或检查,如做体格检查或测定他们的血压、血脂、血糖等。③有时需对环境做调查与检测,以确证一项暴露。如对水质进行化验、测定环境污染、食物成分等。须注意在测量结局时要用统一的标准、统一的仪器、试剂、测量员等,以防止发生测量偏倚。
4、观察终点与终止时间 观察终点(end-point)指观察对象出现了预期的结果,至此就不再继续观察该对象了。观察的终止时间是指整个研究工作可以得出结论的时间,也可说此时整个研究工作到达了终点,应以暴露因素作用于人体至产生结局的一般潜伏期作为确定随访期限的依据。 观察终点常为规定疾病的发生或死亡。但如果研究对象在未到观察终点之前死于其他疾病,尽管不能对其继续随访,仍不能按到达随访终点对待,这是也是失访的一种。
5、调查员的培训 应当由经过严格培训和考核合格的调查员进行随访。凋查员的工作作风、科学态度以及调查的技巧和技术,直接影响到调查结果的真实性和可靠性。观察终点需要有经验的临床医师来判断。研究者不一定亲自参加随访,因为研究者易于带有主观的偏性。   
回复

使用道具 举报

457

主题

11

好友

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

admin 发表于 2011-5-22 19:17:00 |显示全部楼层
筛检试验和诊断试验
2009-7-10 19:39 【大 中 小】【我要纠错】
  (一)筛检试验和诊断试验概念、目的与应用原则

  1.筛检与筛检试验概念、目的与应用原则

  (1)筛检(screening)是运用快速、简便的检验、检查或其它措施,在健康的人群中。发现那些表面健康,但可疑有病或有缺陷的人。筛检所用的各种手段和方法称为筛检试验(screening test)。

  (2)筛检的目的:

  ①早期发现可疑患者,做到早诊断、早治疗,提高治愈率。实现疾病的二级预防。

  ②发现高危人群,以便实施相应的干预,降低人群的发病率,实现疾病的第一级预防。

  ③了解疾病自然史。④进行疾病监测。

  (3)筛检的应用原则:

  ①被筛检的疾病或缺陷是当地重大的卫生问题;②对被筛检的疾病或缺陷有进一步确诊的方法与条件;③对发现并确诊的患者及高危人群有条件进行有效的治疗和干预,且标准应该统一规定;④被筛检的疾病或缺陷或某种危险因素有可供识别的早期症状和体征或测量的标志;⑤了解被筛检疾病的自然史,包括从潜伏期发展到临床期的全部过程;⑥筛检试验必须要快速、简便、经济、可靠、安全、有效及易为群众接受;⑦有保证筛检计划顺利完成的人力、物力、财力和良好的社会环境条件⑧有连续而完整的筛检计划,能按计划定期进行;⑨要考虑整个筛检、诊断和治疗的成本和收益问题;⑩筛检计划应能为目标人群接受,有益无害,尊重个人的隐私权,制定保密措施;公正、公平、合理地对待每一个社会成员。

  2.诊断与诊断试验的概念、目的与应用原则

  (1)诊断(diagnosis)是指在临床上医务人员通过详尽的检查及调查等方法收集信息、资料,经过整理加工后对患者病情的基本认识和判断。用于诊断的各种检查及调查的方法称诊断试验(diagnostic test)。

  (2)诊断的目的:

  ①对患者病情做出及时、正确的判断,以便采取相应有效的治疗措施。

  ②可应用诊断试验进行病例随访,确定疾病的转归、判断疗效和估计预后以及监测治疗的副作用等。

  (3)诊断的应用原则:

  ①灵敏度、特异度要高;②快速、简单、价廉、容易进行;③安全、可靠、尽量减少损伤和痛苦。

  3.筛检试验和诊断试验的区别

  (1)目的不同:筛检试验是用以区别可疑患者与可能无病者。诊断试验是用来区别患者与可疑有病但实际无病的人。

  (2)观察对象不同:筛检是以健康或表面健康的人为观察对象。诊断试验是以患者或可疑患者为观察对象。

  (3)试验的要求不同:筛检试验要求快速、简便、灵敏度高,最好能检出所有患者诊断试验要求科学、准确,特异度高,最好能排除所有非患者。

  (4)所需费用不同:诊断试验常常使用医疗器械或实验室方法,一般花费较高;筛检试验则应使用简单、价廉的方法。

  (5)结果的处理不同:筛检试验阳性者须作进一步的诊断或干预,而诊断试验阳性者要给予治疗。

  (二)筛检试验和诊断试验的评价方法和评价指标

  1.评价的方法

  筛检试验和诊断试验的评价方法基本相同,除考虑安全可靠、简便快速及经济可行外,还要考虑其科学性,即该方法对疾病进行诊断的真实性和价值,具体与标准诊断方法即“金标准”进行比较。评价的步骤有:①确定金标准(目前被公认的最可靠、最权威的、可以反映有病或无病实际情况的诊断方法称为金标准);②选择研究对象;③确定样本含量;④盲法同步测试;⑤整理分析资料;⑥质量控制。

  2.评价的指标

  评价主要从真实性、可靠性和收益三方面进行。

  (1)真实性(validity):也称效度或准确性(accuracy),是指测量值与实际值(金标准的测量值)符合的程度,即正确地判定受试者有病与无病的能力。评价试验真实性的指标有灵敏度、特异度、假阳性率、假阴性率、约登指数和粗一致性。

  1)灵敏度:指金标准确诊的病例中被评试验也判断为阳性者所占的百分比。

  2)特异度:指金标准确诊的非病例中被评试验也判断为阴性者所占的百分比。

  3)假阳性率:指金标准确诊的非病例中被评试验错判为阳性者所占的百分比。

  4)假阴性率;指金标准确诊的病例中被评试验错判为阴性者所占的百分比。

  5)约登指数:是灵敏度和特异度之和减l. 6)粗一致性:是试验所检出的真阳性和真阴性例数之和占受试人数的百分比。

  (2)可靠性(reliability):亦称信度或重复性(repeatability)、精确性(precision),是指一项试验在相同条件下重复检测获得相同结果的稳定程度。影响试验可靠性的因素有:①受试对象自身生物学差异;②观察者差异;③试验方法的差异。评价试验可靠性的指标有:

  1)变异系数(coefficient of variance):该指标适用于作定量测定试验的可靠性分析。

  2)符合率:适用于作定性测定试验的可靠性的分析。它是两次检测结果相同的人数占受试者总数的百分比。

  3)Kappa值:适用于定性资料的可靠性分析,该值表示不同观察者对同一批结果的判定和同一观察者在不同情况下对同一批结果的判定的一致程度。

  (3)评价试验的收益:试验收益的评价可从个体效益和社会效益的生物学、社会经济学效益等方面进行评价。间接反应试验收益的主要指标有:

  1)预测值(predictive value):表示试验结果判断正确的概率,它表明试验结果的实际临床意义。包括:①阳性预测值(positive predictive value)指试验结果阳性人数中真阳性人数所占的比例;②阴性预测值(negative predictive value)指试验结果阴性人数中真阴性人数所占的比例。

  2)似然比:指患者中某种试验结果出现的概率与非患者中该试验结果出现的概率之比。包括:①阳性似然比:是试验结果真阳性率与假阳性率之比,说明患者中出现某种试验结果阳性的概率是非患者的多少倍;②阴性似然比是试验结果假阴性率与真阴性率之比,说明患者中出现某种试验结果阴性的概率是非患者的多少倍。

  确定试验判断标准

  判断标准即截断值(cut off value),是判定试验阳性与阴性的界值,既确定某项指标的正常值,以区分正常与异常。确定截断值的方法在常规情况下,即灵敏度、特异度均很重要的情况下,最常用的是受试者工作特征陷线法。受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)是以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标所做的曲线,以表示灵敏度与特异度之间相互关系的一种方法。

  (三)提高试验效率的方法

  在实际工作中,一般可通过优化试验方法、联合试验的应用和选择患病率高的人群作为受试对象来提高试验的效率。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

Archiver|手机版|女知爱中华专业妇产科网站|中国妇产科学术中心|中国女性健康科普   

GMT+8, 2018-8-20 01:23 , Processed in 0.096790 second(s), 20 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部