在進(jìn)行分層分析時(shí),所分層的因素一般分為兩類,包括“混雜因素”和“感興趣因素”。這兩類因素雖然都可以作為分層的依據(jù),但因素的來源及意義完全不同。本文將對這兩類分層分析進(jìn)行歸納總結(jié),以供參考。
對體外診斷試劑臨床試驗(yàn)數(shù)據(jù)進(jìn)行分析時(shí),一般會對數(shù)據(jù)進(jìn)行整體的統(tǒng)計(jì)分析,得到總受試人群中試劑的臨床性能。此外,我們還會根據(jù)某些因素將總的受試人群分成若干“層”以進(jìn)行分層分析,表明在具有某一特征人群中的試劑性能,有時(shí)也稱其為亞組分析。在進(jìn)行分層分析時(shí),所分層的因素一般分為兩類,包括“混雜因素”和“感興趣因素”。這兩類因素雖然都可以作為分層的依據(jù),但因素的來源及意義完全不同。本文將對這兩類分層分析進(jìn)行歸納總結(jié),以供參考。
一、基于混雜因素的分層分析
在了解基于混雜因素的分層分析之前,首先應(yīng)了解“混雜因素”的定義?!盎祀s因素”來源于流行病學(xué),又稱干擾因子、干擾變量,是指與研究因素和研究疾病均有關(guān)的因素,若在比較的人群組中分布不勻,可以歪曲(掩蓋或夸大)因素與疾病之間真正聯(lián)系。也就是說混雜因素的存在,可以直接導(dǎo)致整體臨床數(shù)據(jù)出現(xiàn)波動,使所得到的統(tǒng)計(jì)結(jié)果無法反映真實(shí)的臨床性能。因此通常通過分層分析的方法對混雜因素的每個分類進(jìn)行單獨(dú)統(tǒng)計(jì),從而消除該因素各分類的之間的比例不平衡對整體性能評價(jià)的影響?;祀s因素一般通過科研結(jié)果、小范圍試驗(yàn)、文獻(xiàn)檢索、臨床經(jīng)驗(yàn)等方面獲得。體外診斷試劑臨床試驗(yàn)中,常見的混雜因素一般包括來自于受試者年齡、病程、疾病分型、病毒載量、樣本等。
例如,在新型冠狀病毒抗原檢測試劑臨床試驗(yàn)中,試劑的整體臨床性能并不是很好,即使跟核酸結(jié)果去比,性能也不是很理想,同時(shí),各家數(shù)據(jù)也沒有可比性。通過對檢測原理的分析及閱讀文獻(xiàn),抗原檢測試劑的檢測結(jié)果會受到樣本的病毒載量的影響。病毒載量既與受試者的疾病狀態(tài)相關(guān),同時(shí)也影響著檢測結(jié)果。因此,我們將病毒載量作為混雜因素,以核酸結(jié)果的CT值作為病毒載量的分層依據(jù)進(jìn)行分層分析。當(dāng)進(jìn)行高、低載量分層后,試劑顯示出了與高載量核酸檢測結(jié)果很好的一致性,同時(shí)各家數(shù)據(jù)也顯示出了相同的模式。據(jù)此,我們對抗原試劑的預(yù)期用途進(jìn)行了合理的限定。
以上這個例子是在整體臨床性能結(jié)果不好的情況下,為了解釋結(jié)果所進(jìn)行的混雜因素的分層分析。除此之外,在臨床性能可接受時(shí)也需要進(jìn)行分層分析,使臨床試驗(yàn)的結(jié)果更加穩(wěn)定。例如,在進(jìn)行新冠抗體檢測試劑臨床性能評價(jià)時(shí)需根據(jù)受試者病程進(jìn)行分層分析,其中發(fā)病0至7天為疾病早期,8到14天為疾病的中期,15天以后進(jìn)入疾病的后期。在這個過程中,抗體水平會根據(jù)病程呈現(xiàn)相對固定的變化趨勢。IgG抗體的水平會持續(xù)升高,IgM抗體水平會呈現(xiàn)疾病早期低、中期高、后期逐漸降低的趨勢(如圖A)。我們在對于一個試劑的臨床試驗(yàn)數(shù)據(jù)進(jìn)行審評時(shí)發(fā)現(xiàn),這個試劑所展現(xiàn)的抗體水平與所認(rèn)知的一般性能完全不符,兩種抗體水平均呈現(xiàn)早、晚高,中期低(如圖B)。但這個試劑整體臨床性能卻相當(dāng)不錯。這是因?yàn)樗虢M了較多的早期和后期受試者,從而提高了整體臨床性能數(shù)據(jù)。如果僅進(jìn)行整體入組人群的靈敏度、特異度分析是很難發(fā)現(xiàn)這樣的問題的。
從以上兩例子可以看出,進(jìn)行混雜因素的分層分析的目的就是要對試劑的檢測性能以現(xiàn)有的認(rèn)知進(jìn)行全面、準(zhǔn)確的評價(jià)。
二、基于感興趣因素的分層分析
在進(jìn)行體外診斷試劑的臨床性能評價(jià)時(shí),還需要對于臨床實(shí)踐中關(guān)心的特定人群的分析。所感興趣的因素與檢測結(jié)果在臨床診療、患者管理中的應(yīng)用有關(guān)。一般這類因素包括年齡、性別、病程、基因型等。這類因素在進(jìn)行分析時(shí)通常需要與臨床醫(yī)生進(jìn)行充分的溝通,同時(shí)也可以通過臨床閱讀診療指南、文獻(xiàn)總結(jié)得到。
比如對于新冠抗體試劑來說,在疫情初期我們就是要準(zhǔn)確地找到新發(fā)的新冠患者,因此對于早期病例,也就是發(fā)病后0-7天的患者進(jìn)行單獨(dú)的性能分析,以證明試劑在新發(fā)病例中的檢測性能。另外,對于新發(fā)病原體,我們要了解標(biāo)志物的變化模式。因此在新冠抗體試劑審評要點(diǎn)中要求了納入連續(xù)病例,通過圖示法對標(biāo)志物檢測結(jié)果進(jìn)行展示、分析,了解試劑檢測結(jié)果的變化,并將其與該標(biāo)志物的一般認(rèn)知以及不同產(chǎn)品間所顯示的變化趨勢進(jìn)行比較和評價(jià)。
有時(shí)所關(guān)心的亞組性能不理想也并不能說明試劑在這個亞組中的性能出現(xiàn)了問題,而應(yīng)該分析具體原因。在一個基于熒光PCR法的乙型肝炎病毒核酸定量檢測試劑盒的臨床評價(jià)中,針對乙肝病毒的基因型這一感興趣的因素進(jìn)行了分層分析。對于臨床較罕見的乙肝病毒D基因型的核酸定量性能進(jìn)行評價(jià)時(shí)發(fā)現(xiàn),考核試劑對D基因型的定量水平與對比試劑出現(xiàn)了嚴(yán)重的偏差(大于2個數(shù)量級)。經(jīng)過實(shí)驗(yàn)室驗(yàn)證、臨床試驗(yàn)數(shù)據(jù)及操作記錄重新核驗(yàn)后發(fā)現(xiàn),并不是試劑對于D基因型的定量性能出現(xiàn)了問題,而是由于D基因型屬于稀缺的基因型,在臨床試驗(yàn)中采用了富集研究,針對這部分樣本進(jìn)行了較為集中的檢測。而在試驗(yàn)操作中此部分檢測由于熒光閾值調(diào)整出現(xiàn)了批次間不一致導(dǎo)致。通過對熒光閾值進(jìn)行標(biāo)準(zhǔn)化標(biāo)定后,D基因型的定量水平與對比試劑之間不存在顯著的差異。同時(shí),也根據(jù)臨床試驗(yàn)中出現(xiàn)的問題在說明書中加入了對熒光閾值設(shè)定的標(biāo)準(zhǔn)化標(biāo)定步驟及注意事項(xiàng)內(nèi)容。
分層分析的本質(zhì)就是對特定的亞組進(jìn)行分析,但亞組需要科學(xué)的設(shè)置和選擇。這里面包括為準(zhǔn)確評價(jià)試劑檢測性能的基于混雜因素的分層分析,以及為準(zhǔn)確評價(jià)試劑臨床應(yīng)用性能的基于感興趣因素的分層分析。在進(jìn)行試劑的臨床性能評價(jià)時(shí),要將兩種分層分析的方式有機(jī)的結(jié)合,才能對試劑的臨床性能進(jìn)行全面、準(zhǔn)確的評價(jià)。