異構(gòu)數(shù)據(jù)采集:醫(yī)療大數(shù)據(jù)的“高速列車”
異構(gòu)數(shù)據(jù)采集:醫(yī)療大數(shù)據(jù)的“高速列車”
2018-08-31 09:16:34 來(lái)源:億歐網(wǎng)
搶沙發(fā)
2018-08-31 09:16:34 來(lái)源:億歐網(wǎng)
摘要:一家醫(yī)院,數(shù)十種軟件系統(tǒng),“數(shù)據(jù)孤島”問(wèn)題怎么破?異構(gòu)數(shù)據(jù)采集技術(shù)的出現(xiàn),幫助醫(yī)療大數(shù)據(jù)搭上了“快速列車”,同時(shí)也碰了廠商的“蛋糕”。技術(shù)壁壘高,為何商業(yè)上不給力?是哪里出了問(wèn)題?
關(guān)鍵詞:
數(shù)據(jù)采集
列車
高速
中國(guó)擁有非常龐大的醫(yī)療數(shù)據(jù),它們來(lái)自十多億中國(guó)人,跨越數(shù)十年的沉淀。正因如此,以數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù),被廣泛應(yīng)用于醫(yī)療服務(wù)、醫(yī)藥研發(fā)、醫(yī)學(xué)研究等各個(gè)環(huán)節(jié),國(guó)內(nèi)創(chuàng)業(yè)熱情高漲,IBM、飛利浦、微軟、強(qiáng)生等醫(yī)療領(lǐng)域的科技巨擘也紛紛在中國(guó)建立研發(fā)中心。
然而,中國(guó)醫(yī)療數(shù)據(jù)存在兩大問(wèn)題:
第一,非結(jié)構(gòu)化的醫(yī)療文本數(shù)據(jù),無(wú)法直接用于機(jī)器處理和分析。今天中國(guó)的部分地區(qū),病歷的電子化程度甚至還沒有達(dá)到100%。
第二,HIS、LIS、PACS、RIS…國(guó)內(nèi)一家醫(yī)院的軟件系統(tǒng),少則幾個(gè),多則幾十個(gè)。這些系統(tǒng)出產(chǎn)的廠商,全國(guó)有不下3000家,各自為營(yíng),導(dǎo)致系統(tǒng)間數(shù)據(jù)無(wú)法互聯(lián)共享,造成嚴(yán)重的醫(yī)療“數(shù)據(jù)孤島”現(xiàn)象。
這兩大問(wèn)題中,第一個(gè)問(wèn)題的技術(shù)解決難度相對(duì)要小。目前出現(xiàn)的解決辦法有二:一種是運(yùn)用自然語(yǔ)言處理技術(shù),可以將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),國(guó)內(nèi)不少企業(yè)在這一領(lǐng)域耕耘,包括森億智能、零氪科技、思派、依圖醫(yī)療、大數(shù)醫(yī)達(dá)等等。另一種解決辦法,是以IBM Watson為代表的認(rèn)知計(jì)算技術(shù)路線,能夠直接對(duì)非結(jié)構(gòu)化的醫(yī)學(xué)文本進(jìn)行理解和推理。
第二個(gè)問(wèn)題,即“數(shù)據(jù)孤島”問(wèn)題的解決則難度較大。如果要將各系統(tǒng)臨床數(shù)據(jù)進(jìn)行整合,傳統(tǒng)的辦法只有在征得醫(yī)院的同意下,挨個(gè)聯(lián)絡(luò)供應(yīng)商請(qǐng)求提供數(shù)據(jù)接口,需要極大的人力、資金與時(shí)間投入。
而近兩年來(lái),這一問(wèn)題正在逐步被解決,其解決辦法的核心就是:異構(gòu)數(shù)據(jù)采集。
從這家新三板企業(yè)講起
從公開資料看,博為軟件可能是第一個(gè)吃螃蟹的企業(yè)。這家2016年在新三板掛牌的長(zhǎng)沙企業(yè),最先研發(fā)出“101異構(gòu)數(shù)據(jù)采集技術(shù)”,能夠在各軟件廠家不提供接口的情況下,實(shí)時(shí)精準(zhǔn)地抓取各軟件的數(shù)據(jù),存儲(chǔ)指定數(shù)據(jù)庫(kù)中。如此,醫(yī)生可以從數(shù)據(jù)庫(kù)中獲取各個(gè)系統(tǒng)的數(shù)據(jù),達(dá)到與數(shù)據(jù)接口一樣效果。此外,該技術(shù)還能夠?qū)崿F(xiàn)歷史數(shù)據(jù)的遷移,即自動(dòng)采集舊系統(tǒng)中的完整數(shù)據(jù),按照配置邏輯自動(dòng)寫入新系統(tǒng),保證系統(tǒng)數(shù)據(jù)完整性。每個(gè)小時(shí)可以處理上萬(wàn)條數(shù)據(jù),并且可多臺(tái)機(jī)器同時(shí)運(yùn)行,處理速度快,節(jié)約人工成本。
除博為軟件外,國(guó)內(nèi)具備這一技術(shù)能力的企業(yè)僅有寥寥數(shù)家,其中包括依圖醫(yī)療、上海翼依、北京數(shù)見科技、普元技術(shù)等。
技術(shù)壁壘的巨人,商業(yè)變現(xiàn)的矮子?
異構(gòu)數(shù)據(jù)采集的技術(shù)研發(fā)壁壘較高,但商業(yè)上的表現(xiàn)卻并不理想。以博為軟件為例,2015年至今雖營(yíng)業(yè)收入增長(zhǎng)了4倍,但年?duì)I收數(shù)據(jù)還未破千萬(wàn)元大關(guān)——2017年全年數(shù)據(jù)有望完成這一突破。從凈利潤(rùn)來(lái)看,自博為軟件2016年掛牌新三板以來(lái),始終未達(dá)到盈虧平衡,2017年上半年凈利潤(rùn)為-6.43萬(wàn),創(chuàng)造歷史新低。
去年,博為軟件董事長(zhǎng)梁威曾經(jīng)對(duì)外披露,截止2017年10月,博為軟件已累積了200家醫(yī)院的臨床數(shù)據(jù),100多萬(wàn)的病人數(shù)據(jù)。從產(chǎn)品落地醫(yī)院的數(shù)量來(lái)看,可知生意難做,恐怕多數(shù)是與醫(yī)院開展試用合作,抑或是議價(jià)能力差,客單價(jià)低得讓人心累。
醫(yī)院是封閉的環(huán)境,醫(yī)療是封閉的圈子。具備異構(gòu)數(shù)據(jù)采集的企業(yè),多數(shù)是軟件服務(wù)類企業(yè),并非專注于醫(yī)療垂直領(lǐng)域,這就意味著產(chǎn)品向醫(yī)院推廣過(guò)程中,會(huì)遇到新舊供應(yīng)商和渠道的碰撞和摩擦。那么,深耕醫(yī)療大數(shù)據(jù)的企業(yè),或許會(huì)多一分優(yōu)勢(shì)?事實(shí)上,對(duì)于軟件服務(wù)類企業(yè),其服務(wù)的客戶類型具有多元化特征,以博為軟件為例,其客戶涵蓋了政府、醫(yī)院、互聯(lián)網(wǎng)企業(yè)、保險(xiǎn)企業(yè)等等。相比之下,醫(yī)療反而是門檻最高的領(lǐng)域。
其次,就異構(gòu)數(shù)據(jù)采集技術(shù)本身而言,勢(shì)必遭到軟件廠商的掣肘。過(guò)去若想將數(shù)據(jù)從軟件中導(dǎo)出,需要向廠商交付一定的費(fèi)用才可以提供接口。而這項(xiàng)新技術(shù)的出現(xiàn),無(wú)疑是動(dòng)了廠商們的“蛋糕”,阻力在所難免。
即便如此,異構(gòu)數(shù)據(jù)采集技術(shù)的價(jià)值是受到認(rèn)可的,它真正解決了“數(shù)據(jù)孤島”問(wèn)題,打通了醫(yī)院各個(gè)系統(tǒng)之前的界限,讓醫(yī)療大數(shù)據(jù)平臺(tái)的建構(gòu)更加方便,效率更高。
第三十四屆CIO班招生
國(guó)際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:content
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來(lái)自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),請(qǐng)及時(shí)通知本站,予以刪除。