2020年11月26日,國家藥監(jiān)局發(fā)布《關(guān)于真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)的通告》(2020年第77號),詳見正文。
引言:2020年11月26日,國家藥監(jiān)局發(fā)布《關(guān)于真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)的通告》(2020年第77號),詳見正文。
真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)
本指導(dǎo)原則旨在初步規(guī)范和合理引導(dǎo)真實世界數(shù)據(jù)在醫(yī)療器械臨床評價中的應(yīng)用,為申請人使用醫(yī)療器械真實世界數(shù)據(jù)申報注冊以及監(jiān)管部門對該類臨床數(shù)據(jù)的技術(shù)審評提供技術(shù)指導(dǎo)。本指導(dǎo)原則中提及的醫(yī)療器械包括體外診斷試劑。
本指導(dǎo)原則是供申請人和審查人員使用的技術(shù)指導(dǎo)文件,不作為法規(guī)強制執(zhí)行,應(yīng)在遵循相關(guān)法規(guī)的前提下使用本指導(dǎo)原則。真實世界數(shù)據(jù)和真實世界研究處于快速發(fā)展階段,本指導(dǎo)原則基于現(xiàn)有認知水平制定,需根據(jù)科學(xué)發(fā)展不斷完善和修訂。
一、概述
(一)真實世界數(shù)據(jù)與證據(jù)
本指導(dǎo)原則所述真實世界數(shù)據(jù)是指傳統(tǒng)臨床試驗以外的,從多種來源收集的各種與患者健康狀況和/或常規(guī)診療及保健有關(guān)的數(shù)據(jù)。
圍繞相關(guān)科學(xué)問題,綜合運用流行病學(xué)、生物統(tǒng)計學(xué)、循證醫(yī)學(xué)等多學(xué)科方法技術(shù),利用真實世界數(shù)據(jù)開展的研究統(tǒng)稱為真實世界研究。真實世界研究通過系統(tǒng)性收集真實世界數(shù)據(jù),運用合理的設(shè)計和分析方法,開展前瞻或回顧性研究。
真實世界證據(jù)指的是,通過分析真實世界數(shù)據(jù),形成醫(yī)療器械使用、風(fēng)險/收益相關(guān)的臨床證據(jù),可能作為有效的科學(xué)證據(jù)用于監(jiān)管決策。由于真實世界數(shù)據(jù)來源不同,數(shù)據(jù)質(zhì)量可能存在較大差異,并非所有的真實世界數(shù)據(jù)都能產(chǎn)生有效的真實世界證據(jù)。
(二)真實世界研究的優(yōu)勢與局限性
相比于傳統(tǒng)臨床試驗,一般來說,真實世界研究在現(xiàn)實環(huán)境下開展,對納入患者限定相對更少,樣本量可能較大,更可能獲得長期臨床結(jié)局,研究結(jié)果的外推性可能較好。真實世界研究可使用多種數(shù)據(jù),如醫(yī)院病歷數(shù)據(jù)、登記數(shù)據(jù)、醫(yī)療保險數(shù)據(jù)等。真實世界研究還可用于觀察罕見嚴重不良事件,回答罕見疾病診療相關(guān)問題,評價臨床結(jié)局在不同人群、不同醫(yī)療環(huán)境、不同使用方法之間的差異等。
真實世界研究的局限性包括但不限于,真實世界數(shù)據(jù)來源眾多,數(shù)據(jù)質(zhì)量有待評價;真實世界研究通常存在較多的偏倚和混雜(包括選擇偏倚、信息偏倚、混雜等),研究結(jié)論可能存在挑戰(zhàn)。
二、常見真實世界數(shù)據(jù)來源
常見的真實世界數(shù)據(jù)包括但不限于登記數(shù)據(jù)、醫(yī)院病歷數(shù)據(jù)、區(qū)域健康醫(yī)療數(shù)據(jù)、醫(yī)療保險數(shù)據(jù)、健康檔案、公共監(jiān)測數(shù)據(jù)、患者自報數(shù)據(jù)、移動設(shè)備產(chǎn)生的數(shù)據(jù)等。此外,真實世界數(shù)據(jù)還可包括在醫(yī)療器械生產(chǎn)、銷售、運輸、存儲、安裝、使用、維護、退市、處置等過程中產(chǎn)生的數(shù)據(jù)(如驗收報告、維修報告、使用者反饋、使用環(huán)境、校準記錄、運行日志、影像原始數(shù)據(jù)等)。
真實世界數(shù)據(jù)依其來源及特征,包括但不限于以下情形:
(一)產(chǎn)生于健康醫(yī)療服務(wù)的提供和付費過程,基于管理目的生成,如醫(yī)院電子病歷數(shù)據(jù)、醫(yī)保數(shù)據(jù)、健康檔案等。
(二)基于數(shù)據(jù)庫建立時的研究目的,設(shè)立統(tǒng)一的數(shù)據(jù)標準和數(shù)據(jù)收集模式,在常規(guī)臨床實踐中形成并建立的數(shù)據(jù)資源,如器械登記數(shù)據(jù)等。
三、真實世界數(shù)據(jù)質(zhì)量評價
良好的真實世界數(shù)據(jù)質(zhì)量是開展真實世界研究的基礎(chǔ),直接影響真實世界研究生成的證據(jù)強度。真實世界數(shù)據(jù)質(zhì)量評價,在遵循倫理原則,符合法規(guī)要求,保障數(shù)據(jù)安全的基礎(chǔ)上,需關(guān)注數(shù)據(jù)的相關(guān)性和可靠性。數(shù)據(jù)的相關(guān)性,指的是數(shù)據(jù)是否可充分回答與研究目的相關(guān)的臨床問題,包括數(shù)據(jù)是否涵蓋研究人群數(shù)據(jù),是否能形成相對統(tǒng)一或標化的干預(yù)/暴露,是否可設(shè)置可比的對照,是否包含研究所需的結(jié)局變量及測量結(jié)果,是否可獲得混雜因素的相關(guān)數(shù)據(jù)。數(shù)據(jù)的可靠性,指的是數(shù)據(jù)采集的準確性,包括采集前確定采集范圍、采集變量,制定數(shù)據(jù)詞典、規(guī)定采集方法、采集數(shù)據(jù)的流轉(zhuǎn)方式、儲存介質(zhì)格式等,充分保障數(shù)據(jù)的真實性和完整性等。評價真實世界數(shù)據(jù)質(zhì)量,具體可從以下方面進行考慮:
(一)代表性
數(shù)據(jù)所包含的人群是否涵蓋研究的目標人群。
(二)完整性
數(shù)據(jù)被收集和獲取的程度,即相對于研究目的,數(shù)據(jù)是否完整,如研究變量的缺失是否影響研究結(jié)局的評估,樣本量及隨訪時間是否足以回答研究問題等。
(三)準確性
數(shù)據(jù)對患者健康狀況、診療及保健反映的準確程度,如患者年齡、使用器械、手術(shù)類型是否準確。準確性評價包括原始數(shù)據(jù)記錄的準確性,數(shù)據(jù)采集的準確性(如是否建立規(guī)范統(tǒng)一的數(shù)據(jù)采集方法,是否核查不同來源數(shù)據(jù)的準確性等),以及數(shù)據(jù)治理的恰當(dāng)性(如是否建立規(guī)范統(tǒng)一的數(shù)據(jù)治理流程,包括數(shù)據(jù)安全性處理、數(shù)據(jù)鏈接、數(shù)據(jù)清洗、數(shù)據(jù)編碼、數(shù)據(jù)結(jié)構(gòu)化、數(shù)據(jù)傳輸?shù)龋欠窈瞬閿?shù)據(jù)治理算法的正確性)。
(四)真實性
醫(yī)療器械可被唯一標識以及唯一標識被記錄的程度,以識別和分析該器械的全部使用過程。
(五)一致性
數(shù)據(jù)采集遵循相同的過程和程序的程度,包括統(tǒng)一的數(shù)據(jù)定義和穩(wěn)定的病例報告表或版本受控的其他數(shù)據(jù)收集表。
(六)可重復(fù)性
變量可重復(fù)的程度。例如,對同一患者,結(jié)局變量測量和分類的一致性。
四、真實世界研究設(shè)計常見類型及統(tǒng)計分析方法
真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價時,應(yīng)基于具體研究目的,進行策劃和設(shè)計,遵循倫理原則,符合法規(guī)要求,保障數(shù)據(jù)安全。
研究策劃包括明確研究問題,確定數(shù)據(jù)來源及收集方式,以及組建研究團隊等。研究設(shè)計包括確定設(shè)計類型,明確研究對象和研究變量,識別混雜及偏倚的來源并制定相應(yīng)措施進行合理控制,以及事先制定統(tǒng)計分析計劃等。
(一)真實世界研究設(shè)計常見類型
真實世界研究設(shè)計類型主要分為試驗性研究和觀察性研究。
1.試驗性研究
實用性臨床試驗是在常規(guī)或接近常規(guī)的臨床實踐中開展的臨床試驗,實效性隨機對照試驗是實用性臨床試驗的一種重要類型。
實用性臨床試驗關(guān)注干預(yù)措施在常規(guī)臨床實踐中的效果,其研究對象是在常規(guī)臨床實踐中應(yīng)用干預(yù)措施的患者群體,可能存在多種合并癥;干預(yù)措施由于與常規(guī)臨床實踐保持較好一致,從而受干預(yù)者技能和經(jīng)驗的影響。因此,研究設(shè)計需基于其特點進行全面考慮。
實用性臨床試驗通常選用常規(guī)治療、標準治療或公認有效的治療措施作為對照,觀察指標通常選擇對患者或研究結(jié)果的使用者具有重要臨床意義的指標,根據(jù)研究目的不同,可包括安全性、有效性、治療依從性、衛(wèi)生經(jīng)濟等方面,因其注重評價遠期結(jié)局,隨訪時間較長,隨訪頻率通常與常規(guī)臨床隨訪一致。
2.觀察性研究
觀察性研究包括隊列研究、病例-對照研究、橫斷面研究、病例系列等設(shè)計類型。申請人可根據(jù)研究目的,選擇恰當(dāng)?shù)难芯吭O(shè)計。由于觀察性研究更可能出現(xiàn)偏倚及混雜,需預(yù)先進行全面識別,并采取有效的控制措施。
3.其他
在單組試驗中,使用真實世界數(shù)據(jù)作為外部對照,是形成臨床證據(jù)的一種特殊設(shè)計類型。外部對照需充分考慮試驗組和對照組的可比性,如研究人群、臨床實踐、診斷標準、測量和分類等。
(二)統(tǒng)計學(xué)分析方法
在真實世界研究中,研究者需要根據(jù)研究目的、數(shù)據(jù)以及設(shè)計類型,選擇合理的統(tǒng)計學(xué)方法,常見的統(tǒng)計分析方法見附錄。
試驗性研究的統(tǒng)計分析方法與傳統(tǒng)臨床試驗相似,其統(tǒng)計分析計劃包括數(shù)據(jù)集定義、分析原則與策略、缺失數(shù)據(jù)處理、分析指標與分析方法、亞組或分層分析、敏感性分析、補充分析和結(jié)果報告等。統(tǒng)計分析的基本原則亦為意向性治療分析原則。觀察性研究由于更容易產(chǎn)生偏倚和混雜,數(shù)據(jù)分析的關(guān)鍵是采用統(tǒng)計分析技術(shù)最大限度的控制混雜產(chǎn)生的偏倚,可用的分析技術(shù)除傳統(tǒng)的分層分析、多變量分析外,還包括傾向性評分等。
五、可考慮將真實世界證據(jù)用于醫(yī)療器械臨床評價的常見情形
基于真實世界數(shù)據(jù)形成的真實世界證據(jù)可支持醫(yī)療器械全生命周期臨床評價,涵蓋上市前臨床評價及上市后臨床評價。真實世界證據(jù)用于醫(yī)療器械臨床評價的常見情形如下:
(一)在同品種臨床評價路徑中提供臨床證據(jù)
同品種臨床評價路徑主要基于同品種醫(yī)療器械的臨床數(shù)據(jù)開展臨床評價,需要的臨床數(shù)據(jù)包括同品種產(chǎn)品的臨床數(shù)據(jù)和/或申報產(chǎn)品的臨床數(shù)據(jù)。
對于同品種產(chǎn)品的臨床數(shù)據(jù),真實世界數(shù)據(jù)是其重要來源,其有助于確認產(chǎn)品在常規(guī)臨床實踐中的安全有效性;識別產(chǎn)品的潛在風(fēng)險(如罕見的嚴重不良事件);甚至通過獲知同類產(chǎn)品在不同人群中的實際療效,明確最佳使用人群;通過知曉同類產(chǎn)品的行業(yè)水平,為申報產(chǎn)品的上市前風(fēng)險/收益評價提供信息。申報產(chǎn)品合法使用獲得的真實世界數(shù)據(jù),可用于確認申報產(chǎn)品與同品種器械間的差異,不對申報產(chǎn)品的安全性有效性產(chǎn)生不利影響。
(二)用于支持產(chǎn)品注冊,作為已有證據(jù)的補充
由于全球法規(guī)尚待進一步協(xié)調(diào)以及產(chǎn)品上市策略等因素影響,部分醫(yī)療器械尚未實現(xiàn)全球同步上市。注冊申請人可綜合考慮產(chǎn)品設(shè)計特點及適用范圍,已有的臨床證據(jù),各監(jiān)管國家或地區(qū)對于臨床證據(jù)要求的差異等情況,在已上市國家或地區(qū)收集真實世界數(shù)據(jù)并形成真實世界證據(jù),作為已有臨床證據(jù)的補充,支持在中國的注冊申報,可避免在原有臨床證據(jù)不足時在中國境內(nèi)開展臨床試驗。
(三)臨床急需進口器械在國內(nèi)特許使用中產(chǎn)生的真實世界數(shù)據(jù),可用于支持產(chǎn)品注冊,作為已有證據(jù)的補充
根據(jù)國家相關(guān)規(guī)定,在部分區(qū)域指定醫(yī)療機構(gòu)內(nèi),特許使用的臨床急需進口醫(yī)療器械,按照相關(guān)管理制度和臨床技術(shù)規(guī)范使用產(chǎn)生的真實世界數(shù)據(jù),經(jīng)過嚴格的數(shù)據(jù)采集和系統(tǒng)處理、科學(xué)的統(tǒng)計分析以及多維度的結(jié)果評價,可用于支持產(chǎn)品注冊,作為已有證據(jù)的補充。特別是通過境外臨床試驗進行臨床評價,有證據(jù)表明/提示將境外臨床試驗數(shù)據(jù)外推至中國人群可能受到境內(nèi)外差異的影響時,可考慮使用該類數(shù)據(jù)作為支持。
(四)作為單組試驗的外部對照
在單組臨床試驗設(shè)計中,可從質(zhì)量可控的真實世界數(shù)據(jù)庫中提取與試驗組具有可比性的病例及其臨床數(shù)據(jù),作為外部對照。外部對照通常來源于具有良好質(zhì)量管理體系的登記數(shù)據(jù)庫,其可接受申辦者和監(jiān)管方等的評估,以確認其數(shù)據(jù)的相關(guān)性和可靠性。建議采用同期外部對照,如使用歷史數(shù)據(jù)進行對照,將因為時間差異引入多種偏倚,降低臨床試驗的證據(jù)強度。
(五)為單組目標值的構(gòu)建提供臨床數(shù)據(jù)
目標值是專業(yè)領(lǐng)域內(nèi)公認的某類醫(yī)療器械有效性/安全性評價指標所應(yīng)達到的最低標準,包括客觀性能標準和性能目標,是在既往臨床數(shù)據(jù)的基礎(chǔ)上分析得出,用于試驗器械主要評價指標的比較和評價。真實世界數(shù)據(jù)可作為構(gòu)建或更新目標值的數(shù)據(jù)來源。
(六)支持適用范圍、適應(yīng)癥、禁忌癥的修改
醫(yī)療器械上市后,基于所在國家或地區(qū)的相關(guān)法規(guī),在合法使用的前提下,獲得的真實世界數(shù)據(jù)可用于支持適用范圍、適應(yīng)癥及禁忌癥的修改。可能的情形包括發(fā)現(xiàn)額外的療效、潛在的獲益人群、慎用人群、產(chǎn)品遠期安全性確認等。
(七)支持在說明書中修改產(chǎn)品的臨床價值
醫(yī)療器械上市后的真實世界證據(jù),可用于支持修改說明書中修改產(chǎn)品的臨床價值。例如,對于測量、計算患者生理參數(shù)和功能指標的醫(yī)療器械,部分生理參數(shù)和功能指標在上市前評價時主要關(guān)注測量和計算的準確性,未充分發(fā)掘其臨床價值。真實世界數(shù)據(jù)可用于構(gòu)建生理參數(shù)和功能指標,或者基于其做出的臨床治療決定與臨床結(jié)局之間的因果推斷,從而修改說明書中產(chǎn)品的臨床價值。
(八)支持附帶條件批準產(chǎn)品的上市后研究
對用于治療罕見病、嚴重危及生命且尚無有效治療手段的疾病和應(yīng)對公共衛(wèi)生事件等急需的醫(yī)療器械,附帶條件批準上市后,可利用真實世界數(shù)據(jù)開展上市后研究,以支持注冊證載明事項的完成。
(九)用于高風(fēng)險植入物等醫(yī)療器械的遠期安全性和/或有效性評估
高風(fēng)險植入物等醫(yī)療器械,特別是市場上首次出現(xiàn)的高風(fēng)險植入物,在上市前臨床評價中,難以確認產(chǎn)品的遠期療效和風(fēng)險,識別罕見嚴重不良事件。可利用真實世界數(shù)據(jù)進行該類產(chǎn)品的上市后研究,評估產(chǎn)品的遠期安全和/或有效性,完成產(chǎn)品的全生命周期臨床評價。
(十)用于治療罕見病的醫(yī)療器械全生命周期臨床評價,加快其上市進程,滿足患者需求
真實世界數(shù)據(jù)可在多維度支持治療罕見病的醫(yī)療器械快速上市。如擬開展上市前臨床試驗,真實世界數(shù)據(jù)可作為單組試驗的外部對照,或者用于構(gòu)建目標值;附帶條件批準后,真實世界數(shù)據(jù)可用于確認產(chǎn)品的有效性,識別產(chǎn)品風(fēng)險,進行產(chǎn)品風(fēng)險/收益的再評價。
(十一)上市后監(jiān)測
產(chǎn)品的上市后監(jiān)測,涉及不良事件監(jiān)測、產(chǎn)品安全有效性再評價等方面,是醫(yī)療器械全生命周期臨床評價的重要組成部分。真實世界數(shù)據(jù)在上市后監(jiān)測中應(yīng)當(dāng)發(fā)揮重要作用,如通過收集、提取風(fēng)險信號,開展不良事件歸因分析,及時發(fā)現(xiàn)和控制已上市醫(yī)療器械的使用風(fēng)險,同時促進生產(chǎn)企業(yè)對已上市產(chǎn)品的設(shè)計改進,推動新產(chǎn)品研發(fā)。
附
醫(yī)療器械真實世界研究常見統(tǒng)計分析方法
一、實效性隨機對照試驗的統(tǒng)計方法
與傳統(tǒng)隨機對照臨床試驗相比,實效性隨機對照試驗(以下簡稱pRCT)在現(xiàn)實醫(yī)療環(huán)境中開展,患者個體差異可能較大,接受干預(yù)的標準化程度可能降低,患者依從性可能較差,臨床專業(yè)人員的醫(yī)療技術(shù)可能存在不同,研究失訪可能增加。pRCT的統(tǒng)計分析需遵循事先制定的統(tǒng)計分析方案,考慮因素包括但不限于以下情形:
(一)意向性分析是常用的統(tǒng)計分析方法,需重視對患者失訪的處理,預(yù)先明確失訪患者的處理辦法并說明原因;
(二)pRCT的研究人群、臨床環(huán)境等存在較大異質(zhì)性,研究結(jié)果檢驗效能可能較低,應(yīng)謹慎使用非劣效設(shè)計。
(三)pRCT在隨機后可能仍會出現(xiàn)混雜,例如患者接受的干預(yù)發(fā)生變化,不同組別患者的依從性不同等。研究者需根據(jù)研究問題與研究假設(shè),采取適當(dāng)統(tǒng)計方法調(diào)整隨機后混雜的影響。
(四)pRCT如果來自于多個中心,需要對中心效應(yīng)進行控制,當(dāng)主要結(jié)局變量是連續(xù)性指標時,可采用協(xié)方差分析方法;當(dāng)主要結(jié)局變量是分類指標時,可采用考慮Cochran-Mantel-Haenszel方法。當(dāng)除中心效應(yīng)外還有其他協(xié)變量需要考慮時,可采用隨機效應(yīng)模型。
(五)在pRCT統(tǒng)計分析中,建議重視敏感性分析,以評估統(tǒng)計推斷的穩(wěn)健性。
二、觀察性研究常用的統(tǒng)計分析方法
在觀察性研究中,數(shù)據(jù)分析的關(guān)鍵是采用統(tǒng)計分析技術(shù)最大限度的控制混雜因素造成的偏倚??捎玫姆治龇椒òǖ幌抻谝韵虑樾危?/span>
(一)分層分析
分層分析是指將數(shù)據(jù)按可能的混雜因素分為多層,每層的內(nèi)部數(shù)據(jù)有較好的同質(zhì)性,是常用的識別和控制混雜造成的偏倚的方法之一。Mantel-Haenszel法是常用的分層分析方法,來評估混雜因素對結(jié)果的影響。該分析可判斷外來因素是混雜還是效應(yīng)修飾作用,或以哪種作用為主,以及確定混雜的大小和方向或效應(yīng)修飾的大小。但是分層分析只能控制少數(shù)混雜因素,若混雜因素數(shù)過多可能導(dǎo)致過度分層,使層內(nèi)樣本量少;對連續(xù)性變量只能用等級分層法,常引起不合理的分組。
(二)多變量回歸模型
多變量回歸模型是最常見的控制混雜因素的統(tǒng)計分析方法,根據(jù)結(jié)局變量的特點選擇logistic回歸、線性回歸、Poisson回歸和Cox比例風(fēng)險回歸等。值得注意的是,大多數(shù)回歸模型用于估計相對效應(yīng)值。針對存在層次結(jié)構(gòu)的數(shù)據(jù)可考慮多水平模型,針對存在重復(fù)測量的數(shù)據(jù)可考慮廣義線性混合效應(yīng)模型和廣義估計方程。但在應(yīng)用這些模型的時候,仍需考慮其模型的模型假設(shè)以及模型適用性。
(三)傾向性評分分析方法
傾向性評分分析是目前觀察性研究中因果推斷常用的分析方法,是一種針對較多混雜因素的調(diào)整方法,尤其適用于暴露因素常見而結(jié)局事件罕見的研究,或者有多個結(jié)局變量的研究。常見的傾向性評分應(yīng)用方法包括傾向性評分匹配法,傾向性評分分層法,逆概率加權(quán)法,以及將傾向性評分作為唯一協(xié)變量納入統(tǒng)計模型進行調(diào)整分析的方法。其中,傾向性評分的匹配和分層法在醫(yī)療器械臨床評價的真實世界研究中已有較為成熟的應(yīng)用。
值得注意的是,若使用傾向性評分方法,應(yīng)首先在統(tǒng)計分析計劃中,預(yù)先指明用于建立傾向評分模型的變量,以及對模型擬合優(yōu)度和預(yù)測效果進行判斷的標準;在對基線指標建立傾向評分模型時,應(yīng)保持對結(jié)局指標的“盲態(tài)”,避免根據(jù)結(jié)局指標重新調(diào)整傾向評分模型,從而獲得“理想”或“預(yù)期”結(jié)果的情況。
應(yīng)用傾向性評分進行效應(yīng)估計時,需判斷傾向性評分接近的患者在不同處理組間的協(xié)變量分布是否均衡,報告使用傾向性評分之前和之后的結(jié)果,考慮傾向性評分處理后可能對研究結(jié)果造成的影響,例如,用傾向性評分匹配后可能導(dǎo)致的估計精度降低(因樣本量下降);或使用傾向性評分加權(quán)時,個別極大權(quán)重的樣本可能對分析結(jié)果造成較大影響等。
傾向性評分方法僅能處理可觀測到的混雜因素,不能控制研究中未采集的混雜因素可能帶來的潛在影響,建議研究中針對評價結(jié)果進行合理的解讀和討論,并開展可能的定量分析。