智慧醫療

資料驅動醫藥研究新趨勢深度分析報告(中)

美國的資訊技術和創新基金會(ITIF, Information Technology and Innovation Foundation)所設的資料創新中心(Center for Data Innovation)於2019年9月提出一份資料驅動藥物開發的前景(The Promise of Data-Driven Drug Development)報告,報告中先明確的指出資料使用及如AI等新技術在藥物開發週期的各個階段中能帶來的好處,如開發新藥及新療法、改善患者癒後能力、大幅降低管理成本等,尤其對美國而言,發展資料驅動藥物開發可以加速獲得患者較能負擔得起的治療方法,並且指出隨著其他國家(尤其是中國)追求資料驅動性創新,尤其是涉及AI的創新,可能會影響國際間生技企業的競爭力;報告中也提出目前美國政府要實現以資料驅動藥物開發可能需要克服的各種障礙,並提倡政策決策者應創建國家健康研究資料交換中心(National Health Research Data Exchange),加強各機構的資料可近用性來幫助解決健康資料的整合問題。
以下摘譯該份報告:

三、為什麼資料驅動藥物開發現在正在發生?

資料一直在藥物開發中擔任重要的角色,但是有幾個原因使現今資料驅動藥物開發的機會比以往任何時候都來得高。
 

1.電子病歷
在過去的十年中,隨著電子病歷系統的採用,醫療保健行業經歷了數位化轉型,截至2017年,已有96%的醫院採用了由美國國家健康資訊技術協調辦公室(ONC)認證的EHR系統,EHR的廣泛使用大幅提高了可用的健康資料的數量和品質給生物醫學研究人員,這些資料在藥物開發生命週期的關鍵階段帶來了重要的好處。
 
2.新的資料來源

從歷史上看,醫療方法是根據經驗法則決定出一套通用、對一般人有效的作法,而近年越來越多的研究人員發現,人與人之間的差異在治療的有效性中起了關鍵作用,整合遺傳資料以指導藥物開發,可針對特定人群甚至個人量身定制有效的治療方法。使用基因資料的可行性的最大因素是基因定序技術的實用性和成本效益的提高。人類基因組計劃(HGP)耗資27億美元,經過13年的努力,於20006月創建了人類基因組的第一個參考序列;自2000年以來,計算能力的提高,使得基因組定序已變得越來越便宜和快了幾個數量級,現代定序儀可以在一個小時內以不到1,000美元的價格對整個人類基因組進行定序。各國政府已發起了重大計劃,以彙編大量的人類遺傳資料加速醫學研究,如201812月,英國國家衛生署(National Health Service)實現了其100,000個基因組計劃的基因組定序目標,該計劃正在為研究癌症和罕見病治療方法的研究人員提供資料。
 

基因組學可以透過更多方式使藥物開發受益,而不僅僅是透過整合患者的遺傳資料,例如研究人員最近對來自51個國家/地區的20,000例肺炎病毒株的DNA進行了定序,該資料揭示了621株新的肺炎病毒株,並使研究人員能夠確定細菌種群對各種疫苗的反應,這將使研究人員能夠更好地開發新版本的肺炎球菌疫苗。
 

遺傳資料的使用在開發罕見疾病的治療方法上將得到許多裨益,罕見疾病人群小,但種類繁多,如美國大約有7,000種罕見病,對製藥公司而言開發針對罕見疾病的新藥並不划算;然而80%的罕見疾病是遺傳性的,這意味著基因組定序和分析的進步使得發現這些疾病的遺傳標記物比以往更加可行,以幫助開發新的治療方法,如基因組公司FDNA就專門收集有關罕見疾病的遺傳資料、症狀等資訊幫助研究人員對罕見疾病進行研究。
 

除此之外,基因組學的成熟伴隨著其他相關學科跟著發展,這些學科可能對藥物開發產生相似的潛在影響。如為追求人類基因組定序而開發的許多技術及技術刺激了組學革命的發展,包括蛋白質組學、轉錄組學等,這些進展可以為生物製藥研究人員提供以前未開發的大量資料,以幫助他們更好地了解人類生物學並指導藥物開發。
 

此外,越來越多的非傳統來源新型資料用於輔助藥物開發過程、生物識別、生活方式和環境資料(如健身追踪器和空氣品質監測器等)低成本IoT設備的普及,使得收集這些資料成為可能,並提供了大量有價值的資訊,可幫助研究人員和監管機構更好地評估新藥的效力。來自各種來源的資料以及處理該資料技術的可用性越來越高,透過結合了基因、環境和每個人的生活方式等眾多資料,也使得精準醫療成為可能;將遺傳、EHR和諸如健身追踪器之類的非傳統資料源結合起來,可以提供以前無法獲得的資訊,例如了解生活方式和環境因素如何影響疾病風險與治療。例如,20197NIH列出了其資助的68項研究,涉及使用健身追踪器資料研究疾病,例如運動如何減少乳癌藥物對新確診女性的心臟毒性作用, NIH2016年啟動了精準醫療計劃,該計劃旨在建立一個100萬人的團體,他們提供有關其遺傳資訊、醫療紀錄、生活方式等資料,以加速精準醫療研究的發展。
 

3.人工智慧

AI是資料驅動藥物開發創新的主要驅動力,其最有前途的領域之一是解釋非結構化資料。數十年來,電腦系統已用於處理醫療保健中的結構化資料,但在醫療中非結構化資料要比前者來得更多,占美國所有臨床資料的80%。衛生保健中的非結構化資料包括醫學掃描和圖像、手寫的醫生筆記、不良反應事件描述等。該資料可以包含指導藥物開發的有價值的資訊。但是,從歷史上看,電腦系統無法輕鬆處理這些資料,從而使提供者依賴於人類來理解它,例如放射科醫生解釋X射線以評估藥物是否能有效縮小腫瘤,或審查患者健康記錄中的醫生記錄,以確定是否適合進行臨床實驗。數量龐大的非結構化資料難以快速提取大量潛在有用的醫學訊息,從而限制了其實用性。例如,臨床實驗現場的許多EHR系統只能使用結構化資料,從而導致實驗操作人員只能將其轉換為資源密集型且容易出錯的結構化資料,或將其忽略而浪費有用的訊息及資料。
 

例如麻薩諸塞州大學的研究人員開發了一種AI系統,該系統可以篩查非結構化EHR資料並以65.9%的準確度檢測不良藥物反應,其性能優於傳統的檢測方法,可幫助告知藥物安全性的上市後安全監測階段;Google的研究人員開發了一種機器學習系統,能夠以89%的準確度在醫學掃描中識別出乳癌已經轉移的時間,而人類的準確率是73%,這些應用顯示了AI能夠比以往更快地為研究人員提供更準確和有用資料的潛力。

四、加速資料驅動藥物開發:創建國家健康研究資料交換中心(National Health Research Data Exchange)

除非藥物研究人員能夠獲得更多的患者資料,否則資料驅動藥物開發的進展將停滯不前。患者資料的廣泛共享不但能使研究人員能夠更好地闡明治療與結果之間的關係,也能夠驗證不當行為的情況,資料的整合也能用以支持新的研究和發現。不幸的是,儘管患者通常願意共享其資料以推進醫學研究,但很少有人選擇這樣做,2018年史丹佛大學的一項研究發現,美國93%的醫學實驗參與者願意與大學科學家分享他們的醫學資料,82%願意與營利性公司的科學家分享他們的醫學資料。此外,總體而言,53%美國人願意與衛生保健研究人員共享他們的健康資料,而年輕的美國人更願意共享其健康資料。
 

但是,圍繞醫療資料的大多數法規都側重於個人限制其醫療資料使用的能力,而很少關注支持為公共利益共享個人資料的能力,當前並沒有簡單的方法讓患者貢獻其個人資料以在醫學研究中廣泛使用。個人可以同意醫療資料特定部分的限定用途,例如共享與參與特定臨床實驗相關的記錄,但是此同意書並不適用於個人的全部醫療資料,也不能將其重新用於類似的有益研究。
 

政策制定者應透過大幅擴展和增加對NIH的精準醫學計劃的資金來解決此問題,以啟動新的國家健康研究資料交換,該資料交換將使患者能夠快速輕鬆地共享其資料,以促進醫學研究。
 

健康資料註冊中心是現有的研究常用資源,並為健康資料交換中心提供了重要的先例,但其僅關注特定條件的資訊,數據量不夠龐大且沒有以標準化格式收集資料。國家健康資料交換中心應該將參與者的健康資料彙編到集中式資料庫中的註冊表,其可以依靠具有標準化應用程式介面(API)的去中心化體系結構來實現,如此可以確保這些記錄持續累積且持續更新,了解每個患者當下的正確情況。
 

創建這樣一個健康資料平台可以為藥物開發、衛生保健研究和公共衛生帶來巨大收益。作為第一步,國會應指示NIH、醫療保險和醫療補助服務中心(CMS)、ONC、疾病控制中心、FDA和其他相關醫療機構制定交換資料的指導原則。國家健康研究資料交換中心的建立可能會遭遇以下的問題:


EHR 整合:

鼓勵在EHR系統中採用國家健康資料交換中心 API並非易事,但是實現這一目標的機制已經存在。 CMSONC2010年至2017年的意義性使用規劃(Meaningful Use Program)對EHR系統實施了逐步提高的標準,使HER得以包含MedicareMedicaid患者的使用資料,後更名為促進互動性規劃(Promoting Interoperability Pragrams),繼續鼓勵開發和採用EHR系統,該系統著重於衛生保健利益相關者之間交換健康資料。
 

政策制定者應指示CMSONC要求為EHR系統整合國家健康研究資料交換API,透過獎勵機制鼓勵不斷增強不同系統間的互通性,並且建立不同利益相關者(如醫院和EHR開發人員)的合作溝通管道。
 

患者參與度:

國家健康研究資料交換應該是一種患者可以自動註冊且隨時可以退出的系統。可以制定一些機制來鼓勵患者註冊該系統,首先,患者應獲得經濟獎勵,如以適度減少向參與者支付醫療保險稅的形式出現,或者患者可以獲得非財務形式的獎勵,如優先於非參與者參加相關的臨床實驗。有些人可能認為對個體的這種差別待遇是不公平的,但鑑於國家衛生研究資料交換將極大地促進藥物開發,從而為所有患者提供未來的治療方法,這種令人信服的誘因是完全合理的,尤其是當個人選擇不共享其資料,而期望從其他人可能實現資料驅動的藥物開發中受益更為不公平。另外,參與者死亡後應要給予選擇是否將其資料捐贈給健康資料交換中心,增加資料中心的永久資源。
 

資料存取:

國家健康資料交換中心中的資料存取應受合約的約束,以防止濫用;美國國立衛生研究院的全民健康研究計畫目前正在制定一項研究協議,以確保以既能滿足研究人員需求的方式廣泛訪問其資料,又能保護隱私和安全,該模型很可能適用健康資料交換中心未來的資料取用。此外,所有取用的資料均應遵守健康保險可攜與責任法HIPAA),違反者應受如暫時或永久禁止參與等處罰。
 

透過患者識別系統確保資料整合性:
健康資料交換中心的主要障礙是資料不準確,儘管使用
EHR很普遍,但是目前還沒有一種準確有效的方法來匹配不同系統之間的患者記錄。大多數EHR使用稱為統計匹配的技術來根據屬性(例如姓名,出生日期和性別)識別患者記錄。該統計匹配不可靠且容易出錯,如果其他患者具有相同的屬性可能會誤判患者,或者是如不同的系統以不同的格式存儲資料或缺少某些資料,則可能找不到患者的記錄。即使使用現有的標識,例如社會安全號碼,但由於許多人沒有這些標識、具有多個標識或不願意透露,仍會導致錯誤。二十年前,HHS提出了建立一套用於醫療保健唯一患者標識的獨特標準化系統,但隨後的法案卻阻止了實施該計劃所需的資金。

 

國會應指示HHS實施HIPAA最初打算的唯一患者標識。這將為整個醫療保健行業帶來深遠的好處。對於資料交換中心而言,唯一患者標識將提高EHR中的資料準確性,並確保合格的研究人員能夠完全訪問已登記患者記錄。
 

解決隱私問題:

毫無疑問,人們會擔憂國家健康資料交換中心的建立,將影響到患者的隱私。但是,政策制定者應該意識到,HIPAA保護仍然適用,並且與以往將資料提供研究沒有太大的區別,主要區別是將有更多可用於研究的資料。出於歧視或其他有害目的而利用患者資料將構成違反合約且可能違反HIPAA的規定,並應處以重罰。
 

有些患者可能會認為捐贈資料來推進可能具有商業價值的藥物開發研究是不公平的,而他們的醫療費用仍保持不變,這種擔憂是可以理解的,但卻是短視的,因為共享健康資料會為國家帶來許多永久的好處,患者及其後代最終將受益於以前沒有資料就無法創建的新治療方法;更廣泛地說,捐助者和非捐助者都將從間接降低的醫療費用中受益,並且生活在一個擁有更健康個體的國家中。長遠來說,捐贈個人資料來推進醫學研究會創造出巨大的社會效益,對整個人口都有潛在的挽救生命意義。
(編譯者:黃則普)