(Preliminary Evaluation of Quantitative Clinical Laboratory Measurement Procedures)
1. 范围
在体外诊断中,开始一个完整的新的测量步骤、试剂盒或者仪器的评估前,通常情况下需要做出一个关于可接受性能的预判断。这些最初的性能检查并不是指针对于步骤长时期的演示严密的科学调查,也不是指一个对由实验装置而引起的诸多可以影响结果的因素的评估。这个文件的最主要目的是帮助发现问题,并立即予以纠正,或咨询制造商,或进一步评估。 认证机构可对核查或验证超过此文件的程序的要求。
制造商也可从执行这项协议中获益,可从检测的开发或者验证。实行超过5次的批次,制造商可以推测出由EP10估算出的趋势。
2.介绍
本文描述了一个预实验评估的步骤,包括线性,比例,恒定误差(constant bias),线性漂移(linear drift),交叉污染sample carry-over),并且描述了临床实验室精密测量程序。在新的程序用来测量病人样本和做出任何步骤改变时,必须进行初步评价。
这个指导方针是基于连续分析得出的一个协议和步骤。推荐这个协议的理由被解释在13.1部分。这个实验为自动化的仪器准备, 但是也同样适应于试剂盒(kit),手工步骤,和其他的体外诊断装置。通过一连串的重复10个样品,特性可在数据绘图和进行一些简单的计算中评价出来。应用统计学中的多线性回归分析(multiple linear regression analysis),可进一步得到影响不精密度因素的信息(比如交叉污染, 线性漂移, 非线性)。操作指南被给予简单的数据分析形式,以防无法使用计算机。
这个实验意在提供一个对可以用来决定装置最大程度的可接受性的特性(performance characteristics)的一个初步估计。这个结果只能被用于来决定装置是否有非常不能接受的性能。
接下来的章节列出了需要用到的材料和步骤。在实验的基础上是可以有很多变量的(例如:延长反应的天数 或者除去适当的底子样品(priming sample))。变量应该被装置的复杂性,特定特性的测量步骤,和使用物品的来源指示出。
3.标准预防措施
由于经常不可能知道哪一个样本时有可能传染的,所有病人和实验样本被认作是可以传染 性的并且按照“标准预防措施”处理。标准预防措施是结合“普遍预防措施和身体物质隔离” 重要特征的实践的一项指导方针。标准预防措施涵盖了所有传染性物质,因此比起普遍的预防措施更为广泛,因为普遍预防措施只能够应用在血源性病原体中。标准和普遍预防措施可从美国疾病控制和预防中心得到。
4.专用术语
4.1 专用术语的注释
CLSI,标准化建立的世界权威机构,尽最大能力建立世界一致化标准。一致化是从认识,
明白和解释不同点到采取步骤的达到全球统一化的一个过程。CLSI发现医疗公约在全球计量范围内,美国、欧洲和另外一些地方存在着不同之处,这些不同处在CLSI、ISO和欧洲组织的CEN文件中有所体现。所以合法的使用术语,地域使用,不同的时间达成共识,这些都是一致化的障碍。有鉴于此,CLSI认识到统一术语会有利于全球应用标准并且成为一个值得注意的领域。解释这项必须在一个新的项目或者调整以存在的文件中逐步发展和教育的过程。
特别的,在EP10,以下的术语被改变为可接受的国际用语:正确性(accuracy)改为真值(trueness);分析物(analyte)被改为被测物(measurand),分析方法(analytical method)被改为测量步骤(measurement procedure);总误差(total error)被改为误差(error of measurement);精密度(precision)被改为不精密度(imprecision)(表示定量).
4.2 定义
可接受性-基于的标准,对每一个特定测量程序设置最低限度操作特性。
可接受的参考值-一个用来比较的公认的参考数值。 这个数值的建立是基于a)科学原则的理论或者建立的数值; b)一个指定的或认证的数值,基于一些国内和国际组织之间的实验工作;c)一个一致同意的或认证的数值,基于赞助的科学或者工程学团队联合完成的实验工作;d) 当a),b),c) 不可用的情况下,预期的可测量的数值,比如:一个特定群体测量的平均值。
准确性(可测量的)-在测量结果和真实的数值精密的一致。注1:在实践中,一个公认的可接受的参考数值被真值代替;注2:准确性是真值和精确值的结合。
调整差异:用一个统计的操作(去减去他来源的变异)来校准测量差异。注1:例如:之间运行(between-run)差异通过减去等运行(within-run)的变量来调整。注2:附录C描述了一个如何决定调整差异的测量步骤。
分析物:代表组成的一个可衡量的数量名称。注:从前在这个文件中,分析物被用来描述一个单一的组成物并且分析物在其特定的基质中(被测变量)。
指派数值:数值归因于一个特定的数量和公认的,有时按照惯例,用一个既定的目标,选择 一个具有不确定适当的值。
偏倚-期望的检测值与可接受的参考值之间的差值。注:偏差是可用数值表示的与真值的互补。
校准:在特定的条件下,设置一套与由一个测量工具或者测量系统显示出的数量值,或者由材料测量或者可参考物质得出的数值,和标准相一致的数值相关联的操作。注:根据美国联邦法典,校准是一个测量和校正仪器,配套设备,或者测量系统的过程, 用来提供测量反应与按照测量步骤测出物质的实际值的关系。
交叉污染:测量系统从一个样品的反应中应用于随后的样品反应中得出分析物的离散量,从而在随后的样品中错误的影响目前的数量。
系数:在定量的临床实验室测量步骤的背景下,通过多元线性回归方程计算出B值(脚注的0到4。注:在下方为多元线性回归方程。
变异系数:对一个非负特性而言,标准差和平均值的比例。注:这是一个对相对不精确性的测量,习惯性乘以100并用百分比来表示,缩写为CV%. 互换性:从不同的测量工具得出可显示出对可参考的物质和可代表性的样本数学等价关系的结果。
注:这是和ISO定义是相等的。例如:从两个测量步骤得出表示测量的特定物质的测量结果的数学关系和从常规样本得出的定量数学关系的紧密度联系。
比较方法:通过两个不同的实验步骤配对分析相同的样本得出的数据的一个统计步骤。注:理想中,其中一个步骤是广泛倍接受的或者可供参考的测量步骤,有时被称做是“金标准”。 装置:一个运用电动或者机械的测量元素,化合物,溶液等等并给出分析结果的仪器。注:测量经常在化学或者物理反应中进行;由此产生的测量可给出一个最终分析结果。
差异坐标图:用y轴表示测量值和可参考浓度之间的差异,用x轴表示可参考浓度。注1:用一个虚线表示0差异;注2:可参考浓度一般指测量结果的平均值;注3:差异也可以用相对的可参考浓度表示。
总平均:在多次运行或天数的分析后计算出大体的平均值。
不精确度:在特定条件下得出的测量结果的分散性。注:通常用数字以标准差(SD)和变异系数(CV)形式表示出。
线性漂移:测量数据随时间改变的比例。
线性:在测量样本中可提供分析物直接的,与浓度成比例的(数量)的结果的能力(在一个特定的范围)。注:线性经常表示在总体系统反应。(例如:最终分析结果而不是原始仪器输出。) 基质:物质系统的所有成分,除了分析物。
被测:受测量的特定的数量。注1:比如说,在血清中乳酸脱氢酶同工酶1(lactate dehydrogenase isoenzyme 1)的催化浓度,lactate dehydrogenase isoenzyme 1为分析物。 长词组被指定为倍测量物(measurand), 注2:特定的被测物需要声明时间,温度和压力。 测量错误:一个被测物的测量值减去真值。
测量步骤:明确的描述用特定的方法的专门测量的操作设置。
测量区间:在一定的范围内设置由测量工具的错误造成被测物的值。 多元线性回归:尝试有线性公式的方法建立两个或两个以上的或者可解释的变量和一个相依赖的反应(Y)的关系,从而得出数据。注:公式为:Y=B0+B1﹒X1+B2﹒X2+„+Bk﹒XK 其中,Y是由依赖的变量推测出的这值,对一个专门设置的可解释的变量X1,X2,„,XK;B0是一个恒定术语。(Y的截距值当所有的X都是0的时候) 异常值:由一个样品观察到的,显示出一个与其他剩余样品分离的值,指示这是一个来自不同测量群体的数值或者是一个由测量得出的错误结果。
Pooled within-run variance-整体区间运行变量;注:在这个过程中,由于所有的天数都有相同的数据点,所以每日的区间运行差异(within-run variances)为平均值。
精确度(precision):在规定的条件下的测试结果的亲密度的统一性。
注:精确度可以用好,中,差;在表示定量是用非精确性(imprecision)表示---在一个复制的测量中得到的标准差或变异系数的结果。
回归乘数:由实验设计和应用过程中得出的因素乘以观察到的数据。 重复性:在相同测量条件下,连续测量相同被测物的紧密度的统一性。
Run: 制造商推荐的,一个测试系统中真值和精确值可达到预期的稳定范围。注:在这个草案中,run 被定义为一系列的连续不中断的样本分析,除非一个推荐的操作要求这样的中断。 特别的,不应该有任何的重新校准在推荐的程序中。
样本:一个或多个系统中的部分,意在系统中提供信息,经常在系统中作为一个决定的基础。注:举个例子,从一个很大体积的血清中一体积的血清。
刻度因素:在这个草案中,样本1的标记值(低浓度)和样本2(中浓度)的不同。
标注差:一个对变异/分散的测量,是群体变量的的正平方根。注:有很多计算标准差的公式,应用这个草案应应用在附录C中的公式。
真值:从一系列大的测试结果得出的在平均值和一个可接受的参考值亲密度的统一性。 t测试:是student’s t-test 的缩写,一个基于统计学Student’s t-distribution. 注:student’s t-test 可被应用于和不的变量在相等或不相等的变量中。因此,一个健全的统计,高斯分布曲线被设定。
验证:通过提供要求的具体目标证据或者应用被完成(ISO 9000)来证实;注1:WHO定义验证为一个提供步骤,过程,系统,仪器,或者方法的预期结果。注2:验证的成分主要指质量控制,能力测试,验证员工的能力,仪器校正,临床关联性。
证实:通过提供特定要求的以完成的目标证据来证实(ISO 9000); 注:一步法完整的决定或者证实测量特性在测试系统用于病人测试之前。
5 实验材料
需要三个稳定的混合血清包括声明测量范围和医学相关区间(不要超过声称区间)的测量步骤。这些材料可以通过商业的方法得到(例如,控制物),也可以从病人样品得到。中层混合血清的浓度必须是准确地在高和低浓度的中间。一个有效地来建立中层浓度的方法是混合相同量的高和低浓度。为使每一次运行都充分的准备好装置,需要更多的中层混合血清。
根据测量要求,样本基质必须是可被替代的。如果应用不当的基质,可能会引起干扰。照制造商样本基质指南手册选择适当的基质。如果高,低混合血清不能恰当的分布于有效的区间,可适当增加高水平的混合血清,或者稀释低水平的混合血清,但应注意潜在的基质效应。
在试验过程中,选择高和低水平混合样品要注意其稳定性。如果被测物很稳定,可准备充足量的三种混合样品,使之可以持续在整个试验工程中使用。如果材料不稳定,那么可以采取冷冻分装或者每日复溶控制品。
参考步骤:
严格的来说,参考过程是不需要的。在这3个混合样本中,不精确性,线性漂移,样品交叉污染,和非线性可被评价即使不使用参考值。因此,如果需要评价偏倚,那么,参考的步骤是必须的。建议,这三种混合样本的数值应尽可能的被设定为可追溯的参考过程中。度量衡学的可追溯性被详细描述在ISO175115b 和CLSI report X5-度量衡学可追溯性及实施。
在一批中校准和样本的顺序:
本试验包括在数日内由一系列的分析批。第一个样本是用来预试系统的,此样品在顺序中第三个样品可产生恒定的交叉污染,并且这个样品不用于计算。样本交叉污染可以用数学分析方法得出。从第二个样本的结果,被用来做每一批的数据分析。以下特定的顺序必须被分析并且不能改变,中断或者插入样品:中,高,低,中,中,低,低,高,高,中。如果任何最后9个样本被拒绝,丢失,或未报告,整批结果需要重做。当必要的从不完整批次中丢弃所有的数据,必须努力的寻找拒绝的原因。这个顺序被特别的设计为评价非线性,样本交叉污染,比例,恒定偏倚,线性漂移在允许相近无关联的影响。 需要注意的是,多元回归步骤被设计出用于分析样本交叉污染。当今许多现代的分析仪是随机分析仪(例如,上述要求的顺序不会在批次模式中进行)。此时用于多元回归的假设将会无效,可能导致无效的结果。这个草案和多元回归步骤可以被调整从而用于估测试剂交叉污染和样本较差污染,但已超出了本文件的范围。
实验的天数和批数:在临床实验室,至少在5天内,每天做一批。对于制造商来说,被建议
20或更多的批次。EP-10 可能会运行在整个实验的设计阶段。从增加的天数或者批次合并数据,可以用附录C .使数据分析简单话,每天应做相同数量的批次。本文件的例子是5天内每天做一批,是临床试验室的最低要求。
8 初步试验
在开始实验之前,所有操作设备的实验人员应熟练操作。要熟练练习开机,校准,找出误差,清洁,关机,准备试剂,和其他必要的操作因素在开始做可接受性检查之前。若有可能的话,在开始本方案前厂商应完成仪器的培训和安装。
9 数据的收集和记录
附录A包含数据收录表纸样。他们可以通过目测来确定样本按照正确的顺序来分析,并且记录三个3个水平观察到的平均值。使用这些表格或者做出适当的修改大大的有利于数据的分析。在数据总结表#1,完整的10个样本被记录。第一个样本是用来做预试,只有9个按照顺序的样本结果被分析。
10初步数据绘制和检查:
从这次试验中得到的数据可以用很多种方法分析。但首先是点化数据,观察每个浓度下测定值的离散图,同时审核三个水平的所有结果。图标上可表达不精密度,真值,和非线性。目测评估数据时必要的,因为对这样小的数据组,因为任何统计归纳的效率都很差。 10.1数据对浓度的差值散点图:
图一为数据的散点图,X轴表示预期的(标记)的浓度。Y轴表示测定值与参考值的差值。图中差值零线表示参考值。每一个的点(15在不同的水平)都应被绘制出。绘制出百分比差值对预期浓度是被推荐的,就像表2表示的一样。
10.2 目测检查离群点
仔细检查数据中的离散点(即在某浓度水平下,偏离主群点的单点),并作出判断。当出现一个很难决定是否为离散点时,应该留下来做数据分析。对离散点的处理非常的重要对于很小的实验,因为一个分散点能够很大的影响数据的分析。 如果一个分散点被找到,要通过最大的努力来决定导致他的原因;它可能指示出一个基本的问题。如果离群点在多批次中出现,正确的应对措施是:(1)排除故障;(2)保留现今有问题的点,在以后的一系列分析中; 或者(3)终止初步评估,对错误的来源进行扩大的评估。如果离散点被包含在数据分析中,这个分析的结论由于离散点而极大的不成比例。如果仅在一批中发现这个离散点,可以用另一批替换掉。在图一中,观察到的9在第5 批次中(中间水平浓度)被评价为一个离散点,因此另一批被执行(6批次)来代替5批次。 10.3 线性目测检查:从差值图中可检查出有无非线性的表现。举一个例子,在图一显示出的数据表示出非线性,应为中等水平的结果通常高于低水平或高水平结果。如果数据还是不能表现出线性,这时最适合评价 这个多元线性回归分析系数(B3)(包括每张计算表)在多于一批次中或者在一个对所有批次并深入研究的总结性分析中是不是最显著的,从而完成一个对线性完整的评价(被详尽的描述在最近出版的CLSI/NCCLS 文件中 EP-6-评价线性在在定量测量步骤中)。再一次强调,由于只有很少的数据被记录,在初步实验中,只有重要的非线性可被发现。这写非线性的可接受度有单独的实验室来决定。
11 分析不精密度的数据
实验的不精密度可以用两种方法评估出来。第一个比较简单的方法是计算每个浓度下所有测定值的标准差。这个标准差用来测定实验的不精密性。
“标准”的总标准差估计计算,可由批内,批间(如果每天做一批以上),天间因素
(between-day factors),根据在附录A和C 提供的公式和步骤估计出来。然后相加这些变量,开方计算出“正确”的实验不精密度。方差成分的相对大小可以用来研究不精密度的来源。
“简单”的对每个水平标准差的估算,经常导致估算值低于总标准差(以上提到的方法)。一个用来计算两种方法的差值的公式是可以被找到的。 对各种方差成分使用的进一步讨论已经超过了本文件的范围。
11.1解释:
实验室需要提供三个水平不精密度目标。实验室可以比较估计的SDL 和每个水平的目标值。实际的比较是拒绝大于目标值的值,接受低于目标值的值(举个例子,看数据 总结表#3,在31页)。为了帮助定义不精确目标,实验室应用于以存在的,相近的分析物或者由厂家标记声明的。
12 初步评价偏倚:
以每个浓度的测定均值和设定值间的差异来度量偏倚。 12.1 设定值:
偏倚可以被很好的评价出来当混合血清中所有的样本都尽可能的被测试并且真值被分配到混合血清中。
12.1.1 混合病人样本
当分析分装的样本时,应用一个正确的测量过程(有参考的方法是最理想的)。 从多个样本中计算出平均值用来决定设定值。
12.1.2 控制品:
这些液体可能不和病人的样本成分一样,所以不能成为偏倚和真值的有效指示。但是,他们可以用来核实制造商在测量过程中得到连续的预期结果。
如果厂商设定了值,如果条件允许,一个同年龄群体的平均值在系统中应被应用到。不能用比较其他测量步骤来设置值,因为潜在的基质效应可以互相影响。
12.2 计算偏倚:
测定值可以从数据总结表#2(30页)中计算出。将三个浓度水平的每一个测定均值减去设定值得到估计偏倚: 偏倚=平均测量值-设定值
12.3 解释:
测定值的差异可能有一个或多个因素造成的,包括方法误差,标准化不正确,不精密度,干扰,基质效应,漂移,样品交叉等因素。 估计偏倚应和偏倚允许的目标相比较。如果估计的偏倚比目标值要大,那么就没有达到性能的要求。
13 所有数据分析步骤:
实验的设计可用于估计斜率(比例偏倚),截距(恒定偏倚),样本交叉污染,非线性和线性漂移。 第11部分和附录C 可以用来评估这些变量。附录C 还包括了一个多元回归步骤, 当在测量步骤中初始数据分析显示出不可接受的可能性,可以被用到。这个多元回归过程所包含的公式在附录C 中,还有数据总结表#4,#5,#6。但是,只有需要详细了解各个因素对不精密度的影响时,才有必要掌握此法。
13.1 对模型的评论
EP10最初设计的目的是在连续流动分析仪中发现向样本交叉污染的问题。但是随着一起的发展,很多现代化的仪器应该避免交叉污染。应用EP10的设计还是很有价值的即使样本交叉污染不是很明显。从一个标准的计算模型来说,影响是否明显都是无关紧要的。因为所有在模型中的参数都是自动(数学化)估算出来的。所以,数据中的变量可以被解释为非零参
数因素或者不精确度(剩余误差)。还有一种可能(已经在总结了上百个数据库发现这种情况),一些之前不被考虑为样本交叉污染的因素,在模型中被认定为样本交叉污染。一个样本交叉污染的指示应该激发评估员调查误差的来源。
13.2 总结5批次:
t骤被用于前一版的EP10来总结5个批次已经被修改。在只有5个批次中,从批次间估算出一个参数的变量可能是由于取样变量(暗示参数是一个恒定的,不能在10个样品中很好的估计出来)或者是参数是确实的在每一个批间都改变。可能总结批次的方法,这个工作的团队选择‘一样品符号测试’。在很多情况下这种方法是很显著的因为他要求所有估计的值在5个批次内都有相同的符号(恒定的1.0 是从斜率估计中减去的)。
如果一个结果被发现有统计学显著性的,那个这个结果可能还是没有应用学重要意义,因为他很可能来源于错误的来源。使用者必须决定允许对于每一个错误来源错误值的范围。 14可替代的方法:
该协议可被修改,允许评估三个干涉的物质加上其余的已被估计的参数。
15制造商使用EP-10
在使用EP文件时,制造商唯一的不同之处是批次。对临床试验室来说,建议5批次。对制造商来说,建议20次或更多次。EP10可以用在实验设计阶段。在这么多批次中,分析物可以检测每一个五批次的EP参数的分布,或者绘制出他们vs.时间或者其他科解释的变量。举个例子,20个交叉污染评估可以被绘制出vs做实验的天数。在评估中一个期望的随机分散vs天数。
16 在EP-10中如何在EXCEL中使用多元回归
这个部分描述了怎么在Microsoft Excel 中使用多元回归的计算。注:用乙醇数据做例子。 为了在Excel中使用回归(regression),分析工具(Analysis Toolpack)必须有效。在工具栏的Add-ins中,检查Analysis Toolpack 是否被检查过。注:Analysis Toolpack 是EXCEL的一个功能,不需要单独购买。
在多元回归中表中,Y轴表示从每一个批次中得出的数据,X轴表示设计的变量:水平,调整的水平平方,时间(线性漂移),和样本污染。注:截距自动的加上。
设置这个过程,在A1:E10中输入数据,在F1:I10 中输入设计变量。标记在第一排。注意调整的水平平方(adjusted level squared)是从水平平方(level squared)计算出来的,它的值从公式:=J2-$J$11
为了实现第一组数据(第一批次)的回归,点击工具栏(Tools),然后是数据分析(Data Analysis),然后是回归(Regression), 然后是OK. 输入的Y范围为$A$1:$A$10.输入的X范围是$F$1:$I$10.检查标记盒(Lable box). 在输出选项中(Output Options),点击输出范围(Output Range)并且输$A$13.点击多次期望的剩余和正常概率下的项目。然后点OK.
结果显示在A30:A33的系数应与数据总结表#4a在Total/678中的数据一样。 在其他批次中重复做以上的操作。
第一批的输出的数据显示在表格一。
用来计算这个批次的t statistics(见表2),继续上一个工作表(假设数据和结果是表一的数据)。
之前,第一排被标记过,在K1:K4,加入三个参考值(从低到高)。 在L1:L6,加入回归参数的标记。
在M1:M6,计算出调整回归系数(adjusted regression coefficients),计算过程如下: B0,截距:“=B29-(M3*K3)” B1,斜率:“=B30/(K3-K2)”
B2,样本交叉污染:“=(B33/B30)*100” B3,非线性:“=B31/(K3-K2)*(K3-K2) B4,线形漂移:“=B32” 标准误差由以下计算出: B0,截距标准误差:“=C29”
B1,斜率标准误差:“=C30/(K3-K2)” B2,样本交叉污染标准误差:“=C33”
B3,非线性标准误差:“=C31/(K3-K2)*(K3-K2)” B4,线性漂移标准误差:“=C32”
T statistics 计算过程如下: B0,截距t statistic: “=M2/N2”
B1, 斜率 t statistic: “=(M3-1)/N3” 注意在这里,1已经从斜率中减去,期望值为0测试偏倚。 B2,样本交叉污染t statistic:“=(B33)/N4” B3,非线性t statistic:“=M5/N5” B4,线性漂移t statistic:“=B32/N6”
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- stra.cn 版权所有 赣ICP备2024042791号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务