2018年10月,陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院(西南醫(yī)院)正式成立了醫(yī)學(xué)大數(shù)據(jù)與人工智能中心,從信息科中剝離獨(dú)立運(yùn)行。分家不分心,我們?nèi)允且黄饛牟煌瑐?cè)重點(diǎn)共同推進(jìn)醫(yī)院信息化建設(shè)。對于我這個擁有16年醫(yī)院信息建設(shè)管理經(jīng)驗的“老板凳”來說,終于能從信息科負(fù)責(zé)人的崗位上“光榮退休”。慶幸的是,總算逃離了過去無窮無盡的瑣碎和時刻緊繃的不安,是莫大的釋放與解脫。而同步而至的是新的壓力與挑戰(zhàn),這一切都來源于自身對新領(lǐng)域知識儲備的不足,以及開辟全新工作領(lǐng)地的艱難。
在這個新組建的部門成員中,既有OCP(Oracle數(shù)據(jù)庫認(rèn)證專家),也有C#.net、Java、PB開發(fā)程序員,還有高工級網(wǎng)絡(luò)工程師,更有科研項目組織能手,全都是身懷絕技的業(yè)務(wù)骨干。但是,一開始大部分人還不知道下一步具體該干什么、怎么干,自己能發(fā)揮什么作用。用“深感茫然”來形容,一點(diǎn)也不為過。為了給并肩戰(zhàn)斗的小伙伴們鼓勁,我確定了八字方針“居安思危、迎難而上”,并勉勵大家如果不想被時代淘汰,那就搏擊潮頭、改變自己,不斷提升未來20年職業(yè)生涯的核心競爭力。
言歸正傳,作為一名“初出茅廬”的醫(yī)療數(shù)據(jù)探路者,我謹(jǐn)談?wù)勧t(yī)院后信息化時代,如何讓數(shù)據(jù)驅(qū)動新一輪醫(yī)院信息化建設(shè)。
一、掌握基本技能,實(shí)現(xiàn)從信息管理專家向數(shù)據(jù)利用專家的轉(zhuǎn)變。
傳統(tǒng)信息管理人員的核心能力在于對管理流程和數(shù)據(jù)流程的深入理解,在此基礎(chǔ)上,準(zhǔn)確把握用戶需求,科學(xué)頂層設(shè)計,并優(yōu)選適宜的技術(shù)開發(fā)或產(chǎn)品加以實(shí)現(xiàn)。而數(shù)據(jù)管理人員的核心能力在于對數(shù)據(jù)邏輯和相互關(guān)系的理解,以及掌握整個數(shù)據(jù)處理的技術(shù)鏈條,包括數(shù)據(jù)抽取、清洗、標(biāo)準(zhǔn)化、結(jié)構(gòu)化、語義識別、存儲、分析和開發(fā)等。這兩者并非完全割裂,而是相輔相成,相互促進(jìn)。這也是我們從信息管理崗位向數(shù)據(jù)處理應(yīng)用崗位轉(zhuǎn)換的優(yōu)勢所在。
然而,從信息管理走來的我們,劣勢也不少。在上述整個鏈條中,有太多我們不熟悉的領(lǐng)域知識需要補(bǔ)課。譬如,拿最基礎(chǔ)的數(shù)據(jù)抽取來說,抽取的方式、ETL工具、同步頻率、一致性校驗、字符集轉(zhuǎn)換等細(xì)節(jié)都需要考慮。醫(yī)院極其多樣化、復(fù)雜的數(shù)據(jù)來源和類型,給數(shù)據(jù)匯聚與利用帶來很大難度。下圖從數(shù)據(jù)來源、數(shù)據(jù)類型、存儲位置這三個維度體現(xiàn)了醫(yī)療相關(guān)數(shù)據(jù)的概貌。

做醫(yī)療大數(shù)據(jù)研究,正是要將這些分散的數(shù)據(jù)通過患者主索引(EMPI)等方式關(guān)聯(lián)起來,通過大數(shù)據(jù)架構(gòu)進(jìn)行存儲、處理,結(jié)合臨床、科研、管理的需求進(jìn)行統(tǒng)計學(xué)方法或全樣本分析。
舉一個我們在數(shù)據(jù)抽取過程中的小例子:由于歷史原因,軍隊醫(yī)院HIS數(shù)據(jù)庫都是采用AMERICAN_AMERICA.US7ASCII英文字符集,因各系統(tǒng)間錯綜復(fù)雜的聯(lián)系,絕大部分醫(yī)院都沒有轉(zhuǎn)換成當(dāng)前主流的中文字符集。于是問題來了,要想在數(shù)據(jù)中心采用中文字符集以兼容各種數(shù)據(jù)來源,就必須完成轉(zhuǎn)換。我們采用了Oracle Golden Gate(簡稱:OGG)技術(shù)進(jìn)行業(yè)務(wù)庫實(shí)時同步和字符集轉(zhuǎn)換,采用開源ETL工具Kettle進(jìn)行數(shù)據(jù)抽取,在這一過程中遇到了一些問題。譬如:OGG要求歸檔日志必須延續(xù)一致,Oracle的SID不能發(fā)生變更,如果環(huán)境變了,前面的工作都可能要重來。對于大容量數(shù)據(jù)倉庫來說,這就是“噩夢”。Kettle數(shù)據(jù)抽取工具的原理是,將英文字符集的數(shù)據(jù)表映射遷移至中間表,再寫入中文字符集數(shù)據(jù)庫。但是,對數(shù)據(jù)庫字段中的空格等特殊字符的處理經(jīng)常發(fā)生錯誤,處理blob等大對象類型的數(shù)據(jù)也存在問題。在數(shù)據(jù)開發(fā)過程中,如主流的Tableau、FineReport等報表工具完全不支持英文字符集,而有些實(shí)時數(shù)據(jù)的分析仍需要從英文字符集的生產(chǎn)數(shù)據(jù)中心直接得到分析結(jié)果。
這只是一個很基礎(chǔ)、很小的技術(shù)障礙,可能有好的解決方案,只是我們暫時還沒掌握。而這只是數(shù)據(jù)處理分析“萬里長征”的第一步,還有無數(shù)“攔路虎”在前面埋伏著。我們深刻地感到,知識更新時不我待!
究竟還有哪些知識領(lǐng)域需要我們潛心學(xué)習(xí)?下圖是我總結(jié)的一張大數(shù)據(jù)知識體系圖:

術(shù)業(yè)有專攻。面對如此龐雜的知識體系要求,一個人精力有限,難以全面掌握和精通。但既然專業(yè)研究大數(shù)據(jù),必然要求一專多能。所以,每位團(tuán)隊成員多少都要了解一些,并且要按這個知識體系逐步把團(tuán)隊打造好。
二、打破傳統(tǒng)觀念,以數(shù)據(jù)思維解決傳統(tǒng)信息化中的難點(diǎn)與痼疾。
“互聯(lián)網(wǎng)+”促使數(shù)據(jù)以前所未有的速度數(shù)量級增長,大家又開始討論“數(shù)據(jù)思維”了。那什么是數(shù)據(jù)思維呢?
個人認(rèn)為,數(shù)據(jù)思維是當(dāng)數(shù)據(jù)積累到一定程度后,發(fā)生了量變到質(zhì)變,用數(shù)據(jù)產(chǎn)生知識,進(jìn)而反過來影響工作流程、業(yè)務(wù)模式和決策方式。有句老話說:“船到橋頭自然直”,正是時代發(fā)展到現(xiàn)階段,數(shù)據(jù)量、算法、算力這三要素共同催生的結(jié)果。用數(shù)據(jù)思維思考問題、解決問題成為當(dāng)下各行各業(yè)變革的方向,這也是為什么數(shù)據(jù)產(chǎn)生的價值越來越大的原因。數(shù)據(jù)已成為智能化和人工智能的基礎(chǔ)。大數(shù)據(jù)方法促使傳統(tǒng)的統(tǒng)計學(xué)抽樣轉(zhuǎn)變?yōu)槿珮颖痉治觯瑪?shù)據(jù)越大,得到的結(jié)果可能就越好。同時,大數(shù)據(jù)不再追求個體數(shù)據(jù)的“精益求精”,而轉(zhuǎn)變?yōu)閷π实年P(guān)注,快速采集、快速分析、快速決策、快速預(yù)見、快速創(chuàng)新和快速應(yīng)用。當(dāng)然,數(shù)據(jù)質(zhì)量永遠(yuǎn)是一切數(shù)據(jù)利用的基礎(chǔ)。
那醫(yī)院又如何運(yùn)用數(shù)據(jù)思維呢?
首先,要數(shù)據(jù)化。從患者就醫(yī)到醫(yī)護(hù)工作、物資設(shè)備管控等,絕大部分醫(yī)院業(yè)務(wù)流程都可以通過信息化手段實(shí)現(xiàn)數(shù)據(jù)化,特別是運(yùn)用物聯(lián)網(wǎng)技術(shù)使人和物成為信息網(wǎng)絡(luò)中的數(shù)據(jù)節(jié)點(diǎn),這一重要趨勢日益彰顯。數(shù)據(jù)化有助于建立業(yè)務(wù)規(guī)范,并為后期精準(zhǔn)管控創(chuàng)造基礎(chǔ)條件。譬如,對于醫(yī)院不容易管好的高值耗材,一些醫(yī)院正在構(gòu)建SPD體系(SPD是Supply-供應(yīng)、Processing-加工、Distribution-配送,這三個英文單詞的首字母縮寫),通過信息化技術(shù)和智能設(shè)備,在供應(yīng)商、醫(yī)院各科室、患者之間建立全程追蹤、全程質(zhì)量監(jiān)管、高效運(yùn)營的醫(yī)院供應(yīng)鏈體系。
其次,要工具化。數(shù)據(jù)挖掘分析是一門精深的專業(yè),數(shù)據(jù)并非人人想用就能用。要想讓更多人享有數(shù)據(jù)紅利,就必須將數(shù)據(jù)分析應(yīng)用工具化。操作越簡單、功能越強(qiáng)大的數(shù)據(jù)工具越受歡迎。譬如,過去我院醫(yī)生要找一些臨床研究用的病例資料,一般只能去病案室先查基本信息,再翻閱病案資料。不僅費(fèi)時費(fèi)力,還找不準(zhǔn)、找不全。自從構(gòu)建了醫(yī)院臨床大數(shù)據(jù)搜索引擎后,許多醫(yī)生臨床科研的小宇宙頓時爆發(fā)了。因為我們提供的是一個類似于百度、Google一樣的工具界面,醫(yī)生幾乎不用經(jīng)過任何培訓(xùn),就能在幾秒鐘找到所需資料。
三是要善用數(shù)據(jù)解決方案。很多時候,慣性思維導(dǎo)致我們對一些問題一籌莫展,數(shù)據(jù)思維有助于解決很多問題。在重慶舉行的2019 CHINC會議上,聽了浙江省建德市第一人民醫(yī)院相鵬副院長介紹的智能病案質(zhì)控系統(tǒng)。他介紹,為解決醫(yī)生在書寫病歷過程中濫用復(fù)制的問題,參考了論文查重的經(jīng)驗。醫(yī)生在書寫病歷時,計算機(jī)系統(tǒng)自動進(jìn)行大數(shù)據(jù)檢測,如果某段病歷相似度達(dá)到一定值,超越了常理,那么計算機(jī)系統(tǒng)會認(rèn)為這是一份不合格病歷,并且不允許保存提交。這應(yīng)該是一個典型的引入數(shù)據(jù)思維的好辦法,也是將大數(shù)據(jù)和AI技術(shù)應(yīng)用在醫(yī)院信息化基礎(chǔ)環(huán)節(jié)的典型案例。
三、深入臨床一線,跟醫(yī)生交朋友,成為醫(yī)工結(jié)合的專業(yè)化樞紐。
要用好大數(shù)據(jù),不能閉門造車。我們中心成立以后,已到全院20個科室進(jìn)行大數(shù)據(jù)服務(wù)介紹和臨床需求調(diào)研。有些還是被院士領(lǐng)銜科室、排行榜王牌科室邀請去的。除了倍感榮幸、責(zé)任外,確實(shí)感覺到越是發(fā)展好的臨床科室,越是對大數(shù)據(jù)、智能化的要求更迫切。
在與科室的交流過程中,我發(fā)現(xiàn),醫(yī)學(xué)專家和IT人之間的鴻溝并不容易逾越。有些需求,他們認(rèn)為很簡單,但在我們看來實(shí)現(xiàn)起來會比較復(fù)雜,還有一些則剛好相反。譬如,兩年前我們就開始給乳腺中心做一個小型的基于臨床指南的乳腺癌CDSS(臨床決策支持系統(tǒng)),到現(xiàn)在還沒完成驗收。當(dāng)時,我們認(rèn)為很簡單,先將指南結(jié)構(gòu)化,建立規(guī)則知識庫,然后結(jié)合患者診療過程中的各項指標(biāo)推薦指南建議。然而,由于疾病的復(fù)雜性、人機(jī)交互的便捷性、數(shù)據(jù)接口的可用性等問題,導(dǎo)致系統(tǒng)難以真正落地和發(fā)揮應(yīng)有價值。
究竟怎樣才能讓大數(shù)據(jù)中心成為醫(yī)工結(jié)合的專業(yè)化樞紐呢?我認(rèn)為應(yīng)該關(guān)注以下三個方面:
一是加強(qiáng)學(xué)習(xí),注重復(fù)合型人才培養(yǎng)。共同語言是有效溝通的前提,工科人去理解醫(yī)生的思維方式是比較困難的。所以,對于醫(yī)院信息專業(yè)人員要理解臨床思維,就必須加強(qiáng)醫(yī)學(xué)領(lǐng)域知識的積累學(xué)習(xí),至少對醫(yī)學(xué)基礎(chǔ)常識應(yīng)有所了解,少“開黃腔”或完全沉浸在自己的世界里異想天開。同時,著力構(gòu)建醫(yī)學(xué)大數(shù)據(jù)開發(fā)應(yīng)用團(tuán)隊必備的人才結(jié)構(gòu),一般應(yīng)包括:數(shù)據(jù)庫工程師、大數(shù)據(jù)處理軟硬件工程師、數(shù)據(jù)分析師、大數(shù)據(jù)與AI開發(fā)工程師等。其中,數(shù)據(jù)分析師最好有醫(yī)學(xué)統(tǒng)計學(xué)專業(yè)背景,熟練掌握常用醫(yī)學(xué)數(shù)據(jù)處理的模型、算法和工具。如果能有臨床和科研經(jīng)驗的醫(yī)務(wù)人員加入,那就如虎添翼了。
二是技術(shù)引導(dǎo),價值推動。讓醫(yī)學(xué)人員及時了解可能在醫(yī)學(xué)上應(yīng)用的最新信息通信技術(shù),是產(chǎn)生思想碰撞火花的重要條件。大數(shù)據(jù)中心人員在自身學(xué)習(xí)的同時,可將相關(guān)領(lǐng)域進(jìn)展與成果的情報信息分享給醫(yī)務(wù)人員,不斷用新視野、新方法、新事物去“熏陶”啟發(fā)他們。此外,醫(yī)院總有一批對大數(shù)據(jù)與AI等特別感興趣的醫(yī)務(wù)人員發(fā)燒友,把這類“積極分子”的作用發(fā)揮好,至關(guān)重要。在日常工作中,大數(shù)據(jù)中心可以重點(diǎn)協(xié)助他們進(jìn)行項目課題申報、論文撰寫、定制化軟件研發(fā)等服務(wù),形成互相依賴、互相促進(jìn)的共同體,把大數(shù)據(jù)中心的能力和價值充分釋放、快速體現(xiàn)出來。
三是促進(jìn)大數(shù)據(jù)服務(wù)職能化、規(guī)范化。過去幾年,在醫(yī)院開展大數(shù)據(jù)、AI應(yīng)用都是錦上添花的事情,能做更好,不能做也問題不大,因為醫(yī)院信息中心對常規(guī)需求都應(yīng)接不暇、難以兼顧。而現(xiàn)在這一狀況正在改變,以醫(yī)療大數(shù)據(jù)和AI等為核心的新興領(lǐng)域競爭,不僅是醫(yī)療信息化發(fā)展水平本身的競爭,更是臨床醫(yī)技學(xué)科發(fā)展的競爭。醫(yī)院大數(shù)據(jù)中心應(yīng)該明確職能任務(wù),把相關(guān)工作流程化、常態(tài)化。譬如,大數(shù)據(jù)平臺構(gòu)建維護(hù)、數(shù)據(jù)質(zhì)量監(jiān)管、臨床科研數(shù)據(jù)服務(wù)、大數(shù)據(jù)與AI產(chǎn)品落地推廣、定制化大數(shù)據(jù)應(yīng)用開發(fā)等,應(yīng)該成為大數(shù)據(jù)中心的常規(guī)任務(wù)。有任務(wù)就得有考核指標(biāo),這樣才能有序良性發(fā)展。此外,隨著大數(shù)據(jù)應(yīng)用常態(tài)化,經(jīng)常會有臨床科室要求我們協(xié)助數(shù)據(jù)利用和導(dǎo)出。為此,我們制訂了《醫(yī)學(xué)大數(shù)據(jù)臨床科研使用管理規(guī)定》,從患者隱私保護(hù)、數(shù)據(jù)安全、審批流程和醫(yī)學(xué)倫理等方面進(jìn)行了規(guī)范,促使我們提供的數(shù)據(jù)服務(wù)不再是“人情”活兒,而是規(guī)范操作,有章可循。
四、借力發(fā)展,探尋學(xué)科交叉融合創(chuàng)新之路。
對于軍改縮編形勢下的醫(yī)院來說,成立十來人的隊伍專門從事大數(shù)據(jù)相關(guān)工作,可以說支持力度已算不小。但與目前旺盛的需求和如火如荼的行業(yè)發(fā)展態(tài)勢相比,仍顯勢單力薄,要形成自己的特色優(yōu)勢和核心競爭力,需要精心謀劃。充分借力發(fā)展,優(yōu)勢互補(bǔ),特別是促進(jìn)跨學(xué)科交叉融合,是個人摸索出的重要經(jīng)驗。
目前,我們中心已和中科院重慶院、中科院北京軟件所、重慶大學(xué)、電子科大、北京大數(shù)據(jù)研究院等高校和科研院所建立了穩(wěn)定的合作關(guān)系,有的合作已經(jīng)產(chǎn)出了實(shí)質(zhì)性成果。通過近三年跟這些單位合作,我們共同承擔(dān)了多個大數(shù)據(jù)、AI、“互聯(lián)網(wǎng)+醫(yī)療”等方面的重大、重點(diǎn)和面上科研項目。
值得一提的是,2018年,我們中心聯(lián)合中科院等組織一批單位,聯(lián)合申報并獲批了一項國家重點(diǎn)研發(fā)計劃項目——“基于人工智能的危重癥事件追蹤預(yù)警及決策支持服務(wù)”,這是2018年我院唯一一項獲批的國家級項目,這也是我們多年來堅持學(xué)科交叉不斷磨合結(jié)出的創(chuàng)新碩果。
該項目的主要研究內(nèi)容是,采集和辨識手術(shù)中臨床監(jiān)護(hù)大數(shù)據(jù),智能分析異常監(jiān)護(hù)數(shù)據(jù)與主要危重癥事件;融合HIS和EMR臨床數(shù)據(jù),并基于遺傳算法、進(jìn)化算法、深度神經(jīng)網(wǎng)絡(luò),構(gòu)建神經(jīng)進(jìn)化危重癥不良事件預(yù)測模型;基于自動推理與認(rèn)知技術(shù),構(gòu)建主要危重癥事件人工智能決策支持知識圖譜,實(shí)現(xiàn)監(jiān)護(hù)期間主要重癥事件的實(shí)時追蹤、早期診斷和預(yù)警。
項目由我院臨床專家主持,大數(shù)據(jù)中心人員從IT技術(shù)方面全力配合。雖然我們這個小團(tuán)隊對醫(yī)學(xué)層面的專業(yè)貢獻(xiàn)有限,但在組織研究團(tuán)隊、項目總體設(shè)計、數(shù)據(jù)治理、促進(jìn)學(xué)科交叉方面,發(fā)揮了較好的支撐和橋梁作用。
基于多年的學(xué)科交叉合作經(jīng)驗,我也有一些心得體會與大家分享:
虛心求教,要充滿求知欲??此撇惶嚓P(guān)的學(xué)科,實(shí)則可能存在許多潛在關(guān)聯(lián)。合作并非是完全依賴對方,而是建立在相互理解的基礎(chǔ)上。通過廣泛接觸各類相關(guān)知識,融會貫通后形成新的創(chuàng)意。
善于思考,靈感來自碰撞。知識的學(xué)習(xí)是基礎(chǔ),在需求中探索技術(shù),在技術(shù)研究中挖掘需求,這些都是靈感的來源。一次又一次的碰撞,總會產(chǎn)生思想的火花。
要有耐心,成果需要積累。學(xué)科交叉合作并非一蹴而就,更不是合作就一定很快有成果,要有足夠的耐心。三人行必有我?guī)?,多結(jié)識些不同領(lǐng)域的專家學(xué)者,多了解些跨領(lǐng)域知識,機(jī)會總是留給有準(zhǔn)備的人。
一吐為快!就算是一個大數(shù)據(jù)研究的入門者,或許還是門外漢,跟大家嘮叨嘮叨轉(zhuǎn)型過程中的一些感悟吧。
活到老,學(xué)到老。路漫漫其修遠(yuǎn),吾將馬不停蹄去求索!
第三十四屆CIO班招生
國際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:content
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,請及時通知本站,予以刪除。