下肢截肢患者的结局测量
总体介绍[|]
结果测量可以用于许多不同的目的。预测性措施应该能够根据一组预先定义的类别对个体进行分类,例如,截肢者是否能够成功地使用假肢[1][2]。检测人与人或群体之间的差异表明了结果测量的区别价值,例如,能够确定经胫骨或经股骨截肢者的不同能力,或根据记录的分数或时间确定假体部件之间的差异[3]。
而评估性措施应该能够发现变化,通常在一段时间内在个人或群体。评估性结果测量也可以检测到某种干预措施(如治疗方案)后发生的变化[4]或提供假体部件。一些结果测量被设计为只做上述的一种,而另一些可能做组合,尽管这些不同类型的结果测量的一些要求是相互竞争的[5]。无论它的设计目的是什么,结果测量的心理测量属性都需要报告,以使用户满意,它适合他们希望使用它的人群[6]。
结果测量的心理测量特性是在信度、效度和反应性方面表达其充分性的特征。另一个经常使用的术语是临床计量性质。虽然临床计量学与心理测量学有着相似的起源,但它被描述为通过量表、指数和其他定量工具评估或描述症状、体征和实验室结果的实践,所有这些工具都应该具有足够的心理测量学特性[7][8]。
在康复的初始阶段,重要的是使用结果测量来帮助预测患者使用假肢行走的能力,并确定哪种假肢组件最适合患者[9]。
选择结果测量之前的考虑[|]
如果你正在考虑对截肢者使用结果测量方法,那么你有必要问问自己在Physiopedia (可靠性[|]
可靠性通常通过类内相关系数(ICC)来衡量,并以0(不一致性)到1(完全一致性)之间的数字表示。[10] 测量误差:这是无论谁执行或评分测试,分数或评级都相同的程度,可以使用测量标准误差(SEM)或最小可检测变化(MDC)进行报告,这与最小可检测变化(SDC)相同。[12]。 内部一致性:这种可靠性属性是为只测试一个概念而设计的结果测量保留的。内部一致性评估结果测量中所有项目或问题涉及相同基本概念的程度,例如,在流动性量表中,所有项目都应涉及流动性[5]。 内容/面效度:这是结果测量的内容充分反映要测量的结构或概念的程度(5)。它通常由临床医生专家组协商一致,可以而且应该包括患者代表。例如,测量年轻运动员活动限制的仪器不仅应该包括步行,还应该包括跑步、跳跃和攀登。 结构效度:这指的是结果测量的分数是否充分反映被测量结构的维度或因素的程度[5]。它可以通过执行因子分析来测量,结果表明,如果>50%的数据涉及一个因素,这证实了结果测量是测量一个因素/维度。低于这一数值表明正在评估的因素不止一个。拉什分析也可用于结果测量单维性,即是否测量一个或多个因素或维度。 建构效度:这是结果测量的分数与预先定义的(先验的)假设相一致的程度,这些假设概述了与其他工具分数的关系,或组间差异。如果超过75%的假设被证明,这是一个良好的有效性的迹象[19]。 因此,证明了L检验能够像假设的那样区分所有组[13]。 效标效度:这是衡量结果的分数能否充分反映“黄金标准”的程度。然而,在康复中很少有这种金标准测试存在的情况。如果没有可用的黄金标准,那么用比较度量来测试假设的关系可能是合适的。 内部响应性是度量在指定时间范围内变化的能力。这将取决于所研究的特定人群,在时间框架内发生的治疗或干预措施以及用于确定任何变化的结果测量[5]。 其他考虑因素(用于下肢截肢者验证的结果测量方法列表[|]
在使用结果测量之前,请记住考虑上述问题。 以下结果指标包含在最新版本(2014年)的英国截肢者康复特许物理治疗师协会(BACPAR)结果测量工具箱 上面列出的结果测量方法可以用于高水平活动截肢者,但应该注意的是,可能会看到天花板效应,即截肢者在使用顺序量表时将获得最高分数,无论是观察到的还是自我报告的。 一个综合高水平活动流动性预测器(CHAMP)用于评估需要恢复高水平活动的肢体丧失患者。在沃尔特里德医疗中心,这种结果测量方法被发现是安全可靠的,适用于具有高活动性和创伤性下肢截肢的受伤军人。[25] BACPAR结果测量项目小组进行了一项叙述性综述,研究了在急性期或假体前期对下肢截肢者(LLAs)使用结果测量的证据。该综述发表在2014年春季BACPAR期刊上bacpar.csp.org.uk /。2013年5月对MEDLINE、CINAHL和PsychINFO进行检索,检索词为“急性护理”和“结果测量”,检索词为“下肢截肢者”或“下肢截肢者”,共检索到26篇文章,经过筛选,产生了两篇值得进一步阅读的文章。从这些文章中,只有功能独立性测量(FIM)被确定为潜在的兴趣,并进行了进一步的搜索,添加了特定的FIM标题。虽然有证据表明FIM用于LLAs的急性和/或早期康复阶段,并且可以证明在入院和出院之间有所改善,但证据不足。没有证据表明FIM总分是有效的预测工具,但在一项研究中,运动分量表与假肢预后有很好的相关性。
Intra-rater可靠性:这表明评分者管理和评分结果的一致性。
两分的可靠性:这表明两个评分者在他们管理和评分结果的方式上有多一致。
两次试验法的可靠性:如果一个人完成了自我报告调查,然后在没有变化的情况下第二次重复调查,结果应该是相似的。
有两种主要方法用于报告内部一致性。经典测试理论使用cronbach alpha (α)来表示结果测量作为一个整体的可靠性。和的项目反应理论使用拉希分析通过查看结果测量中的每个项目来评估内部一致性[15]。
有效性[|]
它也可以被称为:同时效度-表现出区分不同群体的能力(例如,老年和年轻下肢截肢者),这通常通过测试假设来衡量,或;聚合效度-表明应该相关的测量是相关的,也可以使用类内相关系数(ICC)测量,值高表明效度好。
标准效度的估计取决于数据的类型。如果两个工具(结果工具和比较工具)都有连续的分数(例如时间,距离等),则使用类内相关性,并且结果最好高于0.70。如果结果工具的评分是连续的,而比较者的评分是二分的(如是/否),那么受试者操作特征(ROC)下的面积是首选方法。同样,建议采用0.70的标准[19]。
响应性[|]
标准效应量是基线平均评分与随访评分之差,除以基线标准差(SD)。如果基线评分相对于平均变化评分有较高的可变性,则效应大小较小,结果测量检测有意义变化的能力也较小。一个小的影响将是0.2,代表基线SD的大约1/5的变化,0.5被认为是中等的,超过0.8,或者至少基线SD的4/5的变化被认为是大的[22]。
配对t检验是一种统计检验,可用于检测两个时间点平均得分的变化,但取决于所使用的结果测量的样本量和可变性/可靠性[15]。
在Devlinet al(2004)的一项研究中,霍顿量表平均得分从出院到随访的变化计算的效应量为0.60,表明存在中等差异[23]。
其他的考虑[|]
Post-amputation[|]
假肢康复[|]
假体前和/或即刻术后期[|]
当工具箱于2014年10月更新时,决定不将FIM或任何其他特定结果测量纳入该人群的工具箱,因为当前证据不够有力。工具箱中包含的其他结果测量方法均有较大样本量的良好证据。此外,FIM在使用前需要进行培训,并被建议作为MDT工具,因此不符合“易于使用”的标准。资源[|]
参考文献[|]