2016年,國務(wù)院印發(fā)《關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》,部署“互聯(lián)網(wǎng)+健康醫(yī)療”的服務(wù)新模式,推動醫(yī)療信息化產(chǎn)業(yè)發(fā)展。健康醫(yī)療大數(shù)據(jù)前景廣闊,在醫(yī)院發(fā)展、臨床服務(wù)和臨床科研等領(lǐng)域都有巨大的應(yīng)用價值。
盡管囊括醫(yī)院內(nèi)外、診前診中診后的健康醫(yī)療大數(shù)據(jù)項目,頻頻獲得投資人青睞,但仍有相當(dāng)一部分醫(yī)院,并沒有采用互聯(lián)網(wǎng)企業(yè)的信息化軟件。技術(shù)不成熟,工具同質(zhì)化嚴重,企業(yè)對醫(yī)院不了解,不能完全滿足臨床需求,醫(yī)院擔(dān)心數(shù)據(jù)安全,患者隱私泄露等問題,都是目前亟待解決的突出難題。
3月18日,圍繞醫(yī)療機構(gòu)對大數(shù)據(jù)的實際需求,解放軍區(qū)總醫(yī)院(北京301醫(yī)院)醫(yī)學(xué)信息研究所副所長薛萬國,在“醫(yī)療大數(shù)據(jù)應(yīng)用與實踐研討會”上進行精彩報告。貝殼社將演講干貨整理如下:
哪些領(lǐng)域,對數(shù)據(jù)庫需求強烈?
醫(yī)學(xué)技術(shù)的持續(xù)進步導(dǎo)致病例數(shù)據(jù)的快速膨脹,如一個樣本的全基因測序,數(shù)據(jù)可達幾十GB,一幅全數(shù)字病理切片,容量接近20GB,這在以前是難以想象的;病人的復(fù)雜性及診療的多樣性導(dǎo)致醫(yī)療數(shù)據(jù)類型結(jié)構(gòu)復(fù)雜化,從病歷檢索到影像識別,大量非結(jié)構(gòu)化的數(shù)據(jù)需要自動分析和特征提取,處理難度仍較大;以人為中心的診療,對數(shù)據(jù)整合要求極高,數(shù)據(jù)的整合式管理、整合式展現(xiàn)和整合式分析比較困難;因為患者的生命周期較長,決定了醫(yī)療數(shù)據(jù)的長周期、長存儲和長管理性,期間要不斷適應(yīng)新技術(shù)的發(fā)展變化。
醫(yī)療大數(shù)據(jù)的應(yīng)用體現(xiàn)在以下四個領(lǐng)域
舉例說明,在個性化診療領(lǐng)域較出名的案例是,美國臨床癌癥協(xié)會曾開展了CancerLinQ的項目,收集20多家醫(yī)院的17萬份乳腺癌病例資料,將病人的癌癥分型、個人信息和治療方案分組整理,形成不同于臨床指南的實踐版治療路徑,通過隨訪得出不同病人的生存周期和療效,為今后病人的治療提供參考依據(jù),這些被分析的數(shù)據(jù)是真實世界的數(shù)據(jù),也是有價值的數(shù)據(jù)。
大數(shù)據(jù)也有利于疾病早期篩查。比如,對于缺血性心臟病風(fēng)險預(yù)警,醫(yī)生能從基于高通量測序技術(shù)的生物標(biāo)志物、ECG(心電圖)波形、臨床參數(shù)關(guān)聯(lián)分析、心臟血管影像等層面綜合分析,得出病人處于疾病低風(fēng)險期、隱匿期還是活躍期。海量的數(shù)據(jù)能預(yù)先建立模型,幫助臨床決策。
在精準(zhǔn)醫(yī)療研究領(lǐng)域,大數(shù)據(jù)分析同樣適用。可以結(jié)合基因分型,對具有相同臨床表現(xiàn)的個體做進一步地細分、探究病因,在血液病和胃癌等疾病治療方面,精準(zhǔn)預(yù)后分析已經(jīng)開展應(yīng)用,疾病的精準(zhǔn)分型需要臨床數(shù)據(jù)與組學(xué)數(shù)據(jù)的聯(lián)合聚類分析。
大數(shù)據(jù)與人工智能也密切相關(guān)。在大量胃鏡樣本的基礎(chǔ)上,對胃癌前疾病進行分類:先構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),訓(xùn)練計算機對海量胃鏡圖像進行糜爛、萎縮、潰瘍、正常等情況的診斷分類,正確率可達91.26%,這已能部分代替人工進行病變診斷了;另外計算機也能參與肺結(jié)節(jié)的病理識別和輔助診斷。
在醫(yī)院管理方面,大數(shù)據(jù)能有效加強管理,提升服務(wù)質(zhì)量。美國卡羅萊納醫(yī)療系統(tǒng)曾采用數(shù)據(jù)分析技術(shù)預(yù)測患者非預(yù)期再住院(30天內(nèi))的風(fēng)險,準(zhǔn)確率高達79%,并有針對性地采取預(yù)防干預(yù)措施,最終有效減少31%的再住院病例。具體是,分析18個月的就診數(shù)據(jù),建立約600個變量模型,其中40個具有高預(yù)測性,利用高預(yù)測性模型,對2000個住院病例進行評估,提出3萬條措施建議。
除了以上一線應(yīng)用外,基礎(chǔ)性應(yīng)用也離不開大數(shù)據(jù)支持,但目前仍不夠智能。比如,病例文本中的搜索手段依然不夠靈活,復(fù)雜的檢索需求難以滿足,許多數(shù)據(jù)隱含在病例文本中,需要從病例中模糊檢索;另外由于醫(yī)療隨訪是臨床科研的一項基礎(chǔ)性工作,所以隨訪數(shù)據(jù)對于臨床療效的重要性不言而喻,但目前普遍缺乏統(tǒng)一的隨訪機制,科室隨訪零散,重復(fù),不完整,數(shù)據(jù)的殘缺嚴重影響了數(shù)據(jù)的可用性。臨床科研亟需建立系統(tǒng)性的隨方機制和隨訪數(shù)據(jù)的管理體系。
大數(shù)據(jù)的基礎(chǔ)性應(yīng)用領(lǐng)域,??茖2〉臄?shù)據(jù)庫需求也很突出。雖然不少科室都建立自己的??茖2?shù)據(jù)庫,但數(shù)據(jù)庫質(zhì)量總體不高,有的僅為一張excel表格,數(shù)據(jù)重復(fù)錄入現(xiàn)象,數(shù)據(jù)記錄不規(guī)范,可持續(xù)性差等問題眾多,有的科室與第三方公司建立合作,專家表示存在數(shù)據(jù)流失風(fēng)險。
病例檢索工具,難以滿足醫(yī)院需求
醫(yī)療大數(shù)據(jù)應(yīng)用的落地離不開需求、數(shù)據(jù)和技術(shù)三要素,缺一不可。然而,不少醫(yī)院在大數(shù)據(jù)應(yīng)用領(lǐng)域依然非常欠缺,仍處于“小米加步槍”的低級階段。
醫(yī)學(xué)自然語言處理就是最基本的一個需求,語義理解是醫(yī)療大數(shù)據(jù)的基礎(chǔ)技術(shù)。一個最簡單的例子,查找病例中含“吸煙”既往史的案例,現(xiàn)在結(jié)果可能將“不吸煙”的病例也搜索出來,因為“不吸煙”三個字含有“吸煙”這個詞語,這就是否定語義的處理不當(dāng),所以醫(yī)學(xué)自然語言處理的難點一個是醫(yī)學(xué)術(shù)語集與規(guī)范化,另一個是醫(yī)學(xué)語言的“語義理解”。
醫(yī)學(xué)語言的語義理解兩方面;病例檢索是最為基礎(chǔ)性的需求,臨床人員希望檢索工具能從診斷、手術(shù)、用藥、檢查結(jié)果、病例、組學(xué)特征中,任意選擇檢索條件和檢索路徑,能支持病例文本基于自然語言理解基礎(chǔ)上的語義檢索,能支持探索式檢索,具有高性能,保證響應(yīng)時間在3秒之內(nèi),然而遺憾地是,目前市場上可見的檢索工具幾乎都達不到要求。
我們希望給醫(yī)護人員提供一個靈活的檢索工具,但是市面上能看到很多互聯(lián)網(wǎng)企業(yè)雖然做了很大努力,可還是沒能解決病例檢索的問題。比如,對于檢索出所有“化療之后白細胞下降的患者”這一簡單要求,很多軟件仍無法實現(xiàn)。所以,現(xiàn)在很多基于病例檢索的專科專病數(shù)據(jù)庫構(gòu)建依然靠手工完成。
建立疾病專科數(shù)據(jù)庫,積累病例數(shù)據(jù),是每個科室都會自覺去做的事。難以置信地是,科室整理一份科研病例需要的時間是2~3個小時,工作量遠超想象。所以醫(yī)護人員很難有時間和動力去做病例的收集和整理,雖然目前有不少軟件支持,但智能化程度還不夠。能否自定義數(shù)據(jù)內(nèi)容、以結(jié)構(gòu)化方式抽取病例數(shù)據(jù),支持數(shù)據(jù)的補充錄入,能否集中化地處理病例,讓患者參與到隨訪互動中等都是好的電子病歷工具的評判標(biāo)準(zhǔn)。
(文章來源:億歐網(wǎng))
第三十四屆CIO班招生
國際CIO認證培訓(xùn)
首席數(shù)據(jù)官(CDO)認證培訓(xùn)
責(zé)編:houlimin
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個人認為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,請及時通知本站,予以刪除。