FHIR標準在管理實境數據上的應用

文/ 國立陽明大學 系統與合成生物學研究中心 俞國靖

當數據量大到一定的程度時,搬移數據到計算設施的所在是一件很困難的事,因此逐漸發展出數據共享區(data commons)的觀念,將公用的數據放在計算設施附近。使用者要計算時,可將演算法搬到計算設施的入口網,直接掛載有權限使用的數據做計算。快速健康照護互通資源(FHIR),雖然是為電子病歷交換所設計的標準,但它所儲存的欄位與許多生醫領域的實境數據(real world data, RWD)相似。若將各種來源不同的實境數據,像是電子病歷、疾病登錄、健檢數據、健保申報等均存為FHIR格式,數據科學家就不需要瞭解各種不同來源的數據之存放方式,只需要瞭解FHIR的標準與數據的存放方式,即可做多種數據的整合與分析。生醫數據中心提供的數據共享區若能符合FHIR標準,即可提供可即時做人工智慧分析的數據(AI-ready data)。目前國內並無將大量實境數據標準化的經驗,也缺少治理多個來源的數據之管理經驗,因此本文介紹方法,突破這兩個技術層次的瓶頸。

要把醫療資料上傳至FHIR雲端伺服器,需要先將資轉換成FHIR標準,在轉換過程中,不同醫院醫療資料上傳資料時,因檢驗方式不同,針對觀察(Observation)資源項目,檢查及問卷部份等,需要輸入LOINC碼及長的名稱(long common name)。以對健康有益的高密度血脂蛋白(HDL)檢測為例,會找到超過50筆稍有差異的檢測方式,若用人工做LOINC碼的對應需要花許多時間。這也是目前一般醫院遇到的最大問題,醫院大多使用健保代碼或醫院代碼,FHIR需使用LOINC碼,目前並無健保代碼轉LOINC的相關工具。若能使用電腦輔助系統協助將可能的結果排序,將可大幅減少專業人員瀏覽與選擇適當對應方式的時間。

數據中心必須有申請、資格審查、合約簽訂、資料下載時間記錄、後續使用追蹤與到期取消使用資格功能。利用電子簽署保密協定、自動追蹤、與管理雲端FHIR伺服器帳號權限的機制,可以強化數據的管理,避免人工作業的疏漏。對使用者而言,簡化數據治理的流程設計,可讓使用者儘早取得數據,進行分析,甚至邦聯式學習(federated learning)。當數據治理的瓶頸舒緩後,就可將重點專注於建立AI-ready的環境,發展邦聯式學習的新合作模式,符合「找得到(findable)、可取得(accessible)、可交換(interoperable)、與可再利用(re-usable)」的FAIR原則等,以增加數據中心的國際競爭力。

參考文獻

  1. Yu KC, Liao YL, Sun TY, Wu Y, Su ZX, Yang, UC (2021) Preparation and management of FHIR-compliant data sets. Joint Conference of Medical Informatics in Taiwan 2021, Taipei, R.O.C. [Oral presentation]
  2. Common LOINC Laboratory Observation Codes. (2017) Regenstrief Institute, Inc. https://loinc.org/usage/obs/
  3. Wilkinson MD, et al (2016) The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 3:160018.
  4. Wilkinson MD, et al (2019) Addendum: The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 6(1):6

喜歡我們的內容嗎?

現在訂閱臨床資訊知識報
RICCI 帶你跟上臨床試驗數位轉型最新趨勢
歡迎來到 RICCI!
還不是會員嗎?點此註冊