深度學(xué)習(xí)在數(shù)據(jù)分析方面正在呈現(xiàn)持續(xù)增長的趨勢,并被稱為2013年的10項突破性技術(shù)之一。它是對神經(jīng)網(wǎng)絡(luò)的改進,包含更多的計算層,從而能夠在數(shù)據(jù)中進行更高層次的抽象和預(yù)測。到目前為止,它正成為通用成像和計算機視覺領(lǐng)域領(lǐng)先的機器學(xué)習(xí)工具。
特別地,卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)被證明是可用于許多計算機視覺任務(wù)的有利工具。深度卷積神經(jīng)網(wǎng)絡(luò)(DeepCNN)可以自動學(xué)習(xí)從原始數(shù)據(jù)(例如,圖像)獲得的中級和高級的抽象概念。最近的結(jié)果表明,從CNN提取的通用描述符(genericdescriptor)在自然圖像的對象識別和定位中非常有效。世界各地的醫(yī)學(xué)圖像分析組正在迅速進入該領(lǐng)域,并將CNN和其他的深度學(xué)習(xí)方法應(yīng)用于廣泛的應(yīng)用當(dāng)中。許多不錯的成果正在涌現(xiàn)。
在醫(yī)學(xué)成像領(lǐng)域,疾病的準(zhǔn)確診斷或評估取決于圖像采集和圖像解譯。近年來,隨著技術(shù)的發(fā)展,設(shè)備能以更快地速率和更強大的分辨率來收集數(shù)據(jù),這大大提高了圖像采集的質(zhì)量。然而,計算機技術(shù)對圖像解譯的改進,才剛剛開始。目前,大部分的醫(yī)學(xué)圖像解譯都由醫(yī)生來進行??墒牵祟愡M行的圖像解譯因為其主觀性、不同解讀者的較大變化和產(chǎn)生的疲勞,往往是片面的。許多診斷任務(wù)需要初始搜索過程來檢測異常,并且量化測量值和時間的變化。計算機化的工具,尤其是圖像分析和機器學(xué)習(xí),對改善診斷起到關(guān)鍵作用。他們通過幫助識別需要治療的部位來支持專家工作流程。在這些工具當(dāng)中,深度學(xué)習(xí)被迅速的證實了其作為基礎(chǔ)的優(yōu)越性,能夠提高準(zhǔn)確性。它還開辟了數(shù)據(jù)分析的新領(lǐng)域,并以一種前所未有的速度不斷發(fā)展。
A.歷史上的網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)背后的基本思想已經(jīng)存在了幾十年了。它們通常只有幾個層。反向傳播算法的出現(xiàn),使得神經(jīng)網(wǎng)絡(luò)的性能有了顯著的提升。然而,性能仍然不夠。其他分類器逐漸發(fā)展開來,包括決策樹、boosting和支持向量機。其中每一個都已經(jīng)應(yīng)用于醫(yī)學(xué)圖像分析,特別是用于檢測異常,而且他們也在分割(segmentation)等其它一些相關(guān)領(lǐng)域得到了應(yīng)用。盡管取得了這樣的發(fā)展,相對高的假陽性率依然很普遍。
早在1996年在Sahiner等人的工作中,CNN(卷積神經(jīng)網(wǎng)絡(luò))就被應(yīng)用在醫(yī)學(xué)圖像處理上。在這項工作中,從乳腺X光照片中提取包含活檢證實的腫塊或者正常組織的ROIs(RegionofInterests)。CNN包含一個輸入層、兩個隱含層和一個輸出層以及使用的反向傳播。在這個前GPU時代,訓(xùn)練時間被描述為「計算密集型」,但是卻沒有給出具體的時間。1993年,CNN被用于肺結(jié)節(jié)檢測。1995年,CNN被用于檢測乳腺X光照片上的微鈣化。
一個典型的用于圖像處理的CNN,其結(jié)構(gòu)包含一連串卷積濾波器的層,夾雜著一連串?dāng)?shù)據(jù)壓縮或者池化層。卷積濾波器(convolutionfilter)處理輸入圖像的一小塊。類似于人腦的低級像素處理,卷積濾波器能夠檢測相關(guān)度高的圖像特征,比如可以代表明顯邊緣的線或圓(例如用于器官檢測)或者圓形(比如用于圓形的物體,像結(jié)腸息肉),然后是高階特征比如局部或是全局形狀和紋理。CNN的輸出通常是一個或多個概率或者圖像對應(yīng)的類別的標(biāo)簽。卷積濾波器能夠直接從訓(xùn)練的數(shù)據(jù)當(dāng)中學(xué)習(xí)。這正是人們所需要的,因為它降低了對很花費時間的手動標(biāo)記特征的需求。如果不用卷積濾波器,那么在預(yù)處理圖像階段,針對特定應(yīng)用設(shè)計的濾波器以及一些需要計算的特征是離不開這些人工特征的。
CNN是高度并行化的算法。與單獨的的CPU處理相比,使用CNN的實用性一大部分是來源于圖像處理單元(GPU)促成的巨大的速度提升(大約40倍)。早期描述GPU對訓(xùn)練的CNN和其他機器學(xué)習(xí)技術(shù)價值的論文是在2006年發(fā)表的。在醫(yī)學(xué)圖像處理中,GPU首先被引入用于分割、重建和配準(zhǔn),然后才是機器學(xué)習(xí)。有趣的是,雖然Eklundetal.在他們的2013年的論文中廣泛談?wù)摼矸e,但卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)一點也沒有被提及。這突出了深度學(xué)習(xí)的重大改革對醫(yī)學(xué)圖像處理研究的迅速調(diào)整有多迅猛。
B.今天的網(wǎng)絡(luò)
由于CNN的新變體的開發(fā)和針對現(xiàn)代GPU優(yōu)化的高效并行求解器(parallelsolver)的出現(xiàn),深度神經(jīng)網(wǎng)絡(luò)最近已經(jīng)獲得了相當(dāng)大的商業(yè)利益。CNN的強大得益于它的深層架構(gòu),這讓它在不同抽象級別上,提取一系列辨別特征。從頭開始訓(xùn)練一個深層的卷積神經(jīng)網(wǎng)絡(luò)是一個巨大的挑戰(zhàn)。首先,CNN需要很大數(shù)量的標(biāo)記數(shù)據(jù),而這這在醫(yī)學(xué)領(lǐng)域很難達到。這是因為請專家來進行標(biāo)記是很昂貴的,并且疾?。ū热?,病變)的樣本十分稀少。其次,訓(xùn)練深度CNN需要大量的計算和存儲器資源,沒有它們的話,訓(xùn)練的過程會非常耗時。第三,訓(xùn)練一個深度CNN經(jīng)常由于過擬合和收斂問題而變得復(fù)雜化,通常需要對網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)或者架構(gòu)重復(fù)調(diào)整以確保所有的層都以相當(dāng)?shù)乃俣葘W(xué)習(xí)。鑒于以上的困難,一些被稱為「遷移學(xué)習(xí)(transferlearning)」和「微調(diào)(fine-tuning)」的新的學(xué)習(xí)方案被提出來提供解決方案,并且被越來越多的人接受。這些將在II-C節(jié)進一步討論。
C.醫(yī)學(xué)領(lǐng)域的網(wǎng)絡(luò)
領(lǐng)域深度學(xué)習(xí)(domainDeeplearning)方法當(dāng)應(yīng)用到大型訓(xùn)練集時最為有效,但在醫(yī)學(xué)領(lǐng)域,并不總能獲得大的數(shù)據(jù)集。因此,我們面臨著一系列重大的挑戰(zhàn),這包括,(a)深度神經(jīng)網(wǎng)絡(luò)可以被有效地用在醫(yī)學(xué)任務(wù)上嗎?(b)從一般意象到醫(yī)學(xué)領(lǐng)域的轉(zhuǎn)移學(xué)習(xí)是否相關(guān)?(c)我們是否可以單獨依靠學(xué)習(xí)的特征,還是可以將它們與人工制作的功能結(jié)合起來完成任務(wù)?這種關(guān)于醫(yī)學(xué)成像的深度學(xué)習(xí)的IEEE成像(IEEE-TMI)特殊問題集中在機器學(xué)習(xí)這個新時代的進展以及它在醫(yī)學(xué)圖像處理領(lǐng)域的角色。這個問題介紹了最近CNN和其他深度學(xué)習(xí)應(yīng)用在醫(yī)療任務(wù)方面的成就。它包含來自世界各地的各種調(diào)查員的50份論文中挑選出來的18篇文章,這對于IEEE的特殊問題是一個非常高的數(shù)字,并且這是在從論文征集公布到提交截止日期的時長比以往要短的時間內(nèi)實現(xiàn)的。論文集中在從檢測到類別化(例如,病變檢測、圖像分割、形狀建模、圖像配準(zhǔn))等這些大量傳統(tǒng)的任務(wù),也有一些開放的新穎的應(yīng)用領(lǐng)域。其中還包括了一些重點在網(wǎng)絡(luò)探索的工作,并給出了對不同的任務(wù)、參數(shù)、訓(xùn)練集應(yīng)該如何選擇架構(gòu)的看法。
期刊論文和主題概述
A.病變檢測
電腦輔助檢測(CAD/Computer-aideddetection)是一個完善的醫(yī)學(xué)圖像分析領(lǐng)域,非常適合深度學(xué)習(xí)。在CAD的標(biāo)準(zhǔn)方法中,通過監(jiān)督方法或者經(jīng)典的圖像處理技術(shù)(比如濾波和數(shù)學(xué)形態(tài)學(xué)(mathematicalmorphology))檢測病變。候選病變通常被分割出來,而且通常由大量的手動設(shè)計的特征來描述。分類器將特征向量與對應(yīng)的候選部位是實際病變的概率做映射。使用深度學(xué)習(xí)而不是手動設(shè)計的特征的直接方法是訓(xùn)練在以候選病變?yōu)橹行牡囊唤M圖像圖像數(shù)據(jù)上操作的CNN。本期的幾篇文章都使用了這種方法。為了獲取3D胸部CT掃描的肺結(jié)節(jié)的候選以及提取以這些候選部位為中心的9個不同的方向的2D貼片,Setioetal.[12]結(jié)合了先前開發(fā)的三種候選探測器。結(jié)合不同的CNN來對每個候選者進行分類。報告顯示,與先前公布的用于相同任務(wù)的經(jīng)典CAD的結(jié)果相比,這種方法取得了微小的進步。
Rothetal.將CNN用于改進3個現(xiàn)有的CAD系統(tǒng)用于檢測結(jié)腸鏡CT中結(jié)腸息肉的存在,以及利用體CT,檢測硬化脊柱轉(zhuǎn)移和擴大淋巴結(jié)。他們也用了先前開發(fā)的候選檢測器和3個正交方向的2D貼片,以及多達100個隨機旋轉(zhuǎn)視圖。隨機旋轉(zhuǎn)的「2.5D」視圖是一種從原始3D數(shù)據(jù)分解圖像表示的方法。隨后通過整合在2.5D視圖上的CNN的預(yù)測結(jié)果來獲得額外的準(zhǔn)確度提升。對于所有使用CNN的3個CAD系統(tǒng),病變檢測的靈敏度改善了13–34%,這表明該方法是通用的可調(diào)整的。若使用非深度學(xué)習(xí)分類器(例如支持向量機族),幾乎不可能達到這種程度的改進。
Douetal.從磁敏性加權(quán)磁共振成像掃描中檢測出腦微出血。他們使用3DCNN并且用CNN替換原始的候選檢測階段,提出了兩階段方法。報告提出,在相同的數(shù)據(jù)集上重新實施、訓(xùn)練和測試,他們的3DCNN的結(jié)果與現(xiàn)有文獻中的其他經(jīng)典的方法和2DCNN方法相比,有了改進。
Sirinukunwattanaetal.[15]在組織病理學(xué)圖像中檢測和分類細胞核。他們使用一個CNN,使用一個小塊作為輸入,而不僅僅是預(yù)測小塊的中心像素是否是細胞核,他們對輸出進行建模,每個細胞核中心會產(chǎn)生一個峰值而其他地方較為平坦。這種空間約束的CNN與在測試階段中的重疊貼片的融合相結(jié)合,產(chǎn)生了比先前基于CNN和基于經(jīng)典特征方法的先前提出的技術(shù)更好的結(jié)果。
Anthimopoulosetal.側(cè)重于利用2D胸部CT掃描圖像來探測間質(zhì)性肺病的模式。他們是研究這個問題的三個組之一(其他兩個是Shinetal.和vanTulderetal.)使用來自[19]的公開數(shù)據(jù)集。他們訓(xùn)練CNN,讓其能區(qū)分32×32個像素的小塊屬于7個類中的哪一個。報告顯示,他們的結(jié)果達到了比以前三個使用手動設(shè)計特征的方法更高的精度。
在研究此類問題的其他幾篇文章中,病變檢測也是一個感興趣的話題,但是這些文章的側(cè)重點在于更廣泛或?qū)W⒂谔囟ǖ姆椒▎栴}。這些論文將在下面簡要談?wù)摗?br />
B.分割和形狀建模
對于一個由2891個心臟超聲檢查構(gòu)成的大數(shù)據(jù)集,Ghesu等人結(jié)合了深度學(xué)習(xí)和邊緣區(qū)空間學(xué)習(xí)來做物體探測和分割?!复髤?shù)空間的有效探索」與一種增強深度網(wǎng)絡(luò)中的稀疏性的方法的結(jié)合增強了計算效率,且該方法相較于同一個小組發(fā)布的另一個參考方法將平均分割誤差減少了13.5%。
有三組研究人員關(guān)注于大腦結(jié)構(gòu)分割或腦病變。多發(fā)性硬化癥腦病變分割的磁共振成像(MRI)問題由Brosch等人解決。他們開發(fā)了一種3D深度卷積編碼網(wǎng)絡(luò),這種網(wǎng)絡(luò)能夠結(jié)合相互關(guān)聯(lián)的卷積與反卷積過程。卷積過程學(xué)習(xí)到更高層次的功能,而反卷積過程預(yù)測出體素水平分割。他們將這種網(wǎng)絡(luò)應(yīng)用到兩個公用數(shù)據(jù)集和一個臨床試驗數(shù)據(jù)集中,并將自己的方法與5種公用方法進行了比較。報告稱,稱該方法的表現(xiàn)「可與當(dāng)前最先進的方法相媲美」。
Pereira等人研究了磁共振成像中的腦腫瘤分割。他們使用了小的內(nèi)核、更深層的架構(gòu)、灰度歸一化和數(shù)據(jù)增強。不同卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)被用于低級別和高級別的腫瘤。該方法分別對腫瘤的增強部分和核心部分進行了分割。他們在2013年的數(shù)據(jù)集公共挑戰(zhàn)賽上排名第一,并在2015年的現(xiàn)場挑戰(zhàn)賽上排名第二。
對于大腦結(jié)構(gòu)分割問題,Moeskops等人的一項研究顯示,卷積神經(jīng)網(wǎng)絡(luò)在涵蓋了從早產(chǎn)兒到老年人的五個不同年齡組病人的數(shù)據(jù)集上表現(xiàn)出色。一種多尺度的方法被用于實現(xiàn)其可靠性。該方法在8種組織類別中取得了良好的效果,其中5個數(shù)據(jù)集的Dice相似性系數(shù)平均值為0.82至0.91。
C.網(wǎng)絡(luò)探究
1)數(shù)據(jù)維度問題——二維vs三維:我們看到的大部分?jǐn)?shù)據(jù)研究采用的是二維分析。二維向三維的過渡經(jīng)常遭到質(zhì)疑——它是否會是性能大幅提升的一個關(guān)鍵所在。數(shù)據(jù)增強過程中存在一些變化,包括2.5維。例如在Roth等人的研究中,軸位、冠狀位和矢狀位圖像以候選的結(jié)腸息肉或淋巴結(jié)中的體素為中心,并被輸入到cuda-convnet卷積神經(jīng)網(wǎng)絡(luò)中,該網(wǎng)絡(luò)包含了通常用于表示一張自然光圖像的紅、綠、藍三色通道。三維卷積神經(jīng)網(wǎng)絡(luò)被Brosch和Dou等人明確用在了這個問題上。
2)學(xué)習(xí)方法論——無監(jiān)督型vs監(jiān)督型:當(dāng)我們看網(wǎng)絡(luò)文獻時會明顯發(fā)現(xiàn),大部分研究為了實現(xiàn)分類而專注于監(jiān)督型卷積神經(jīng)網(wǎng)絡(luò)。這種網(wǎng)絡(luò)對許多應(yīng)用來說非常重要,包括檢測、分割和標(biāo)記。然而仍有一些研究專注于無監(jiān)督型方案,它們大多在圖像編碼、高效圖像表征計劃以及作為深入監(jiān)督型方案的一種預(yù)處理步驟方面被證明是有用的。無監(jiān)督型表征學(xué)習(xí)方法如受限波爾茲曼機(RestrictedBoltzmannMachines/RBM)可能會超越標(biāo)準(zhǔn)的濾波器組,因為它們直接從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征描述。RBM由一個生成型學(xué)習(xí)目標(biāo)來訓(xùn)練;這使得網(wǎng)絡(luò)可以從未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)表征,但不一定會產(chǎn)生最佳分類特征。VanTulder等人進行了一項調(diào)查研究,它結(jié)合了卷積分類RBM中生成型和判別型學(xué)習(xí)目標(biāo)的優(yōu)點。該研究表明學(xué)習(xí)任務(wù)的組合形式優(yōu)于純粹的判別型或生成型學(xué)習(xí)。
3)訓(xùn)練數(shù)據(jù)注意事項:卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了對數(shù)據(jù)驅(qū)動型、極具表征性、分層遞階的圖像特征的學(xué)習(xí)。在許多應(yīng)用領(lǐng)域中(見期刊),這些特征已被證明是一個十分強大且可靠的表征。要提供這樣一個豐富的表征和成功的分類,需要足夠多的訓(xùn)練數(shù)據(jù)。所需數(shù)據(jù)量是一個有待探討的關(guān)鍵問題。相關(guān)問題包括以下內(nèi)容:我們?nèi)绾巫钣行У厥褂盟鶕碛械挠?xùn)練數(shù)據(jù)?在無法獲得數(shù)據(jù)的情況下我們能做些什么?以及最后是否存在獲取數(shù)據(jù)并進行醫(yī)學(xué)注釋的替代方法?
其中一些問題由該期刊中的一些論文解決。VanGrinsven等人試圖通過動態(tài)選擇訓(xùn)練期間被錯誤分類的負樣本來改善和加速解決醫(yī)學(xué)圖像分析任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練。卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程是一個連續(xù)的過程,需要多次迭代(或多個時期)來優(yōu)化網(wǎng)絡(luò)參數(shù)。在每一個時期,一個樣本的子集是從訓(xùn)練數(shù)據(jù)中隨機選擇的,并通過反向傳播和最小化代價函數(shù)來呈給網(wǎng)絡(luò)以更新其參數(shù)。醫(yī)學(xué)領(lǐng)域中的分類任務(wù)往往是一個正常型/病理型的判別任務(wù)。在這種情況下,正常型類別尤其會被過度表征;此外由于每張圖像中正常型組織的重復(fù)型模式,大多數(shù)正常型訓(xùn)練樣本是高度相關(guān)的。其中只有一小部分會包含有用信息。在學(xué)習(xí)過程中對這些數(shù)據(jù)進行同等處理會導(dǎo)致在無用的正常型樣本上浪費許多次訓(xùn)練迭代,使卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程花費不必要的時間。能夠識別有用的正常型樣本的一種方法(如該研究所示)提高了卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程的效率并減少了訓(xùn)練時間。
4)遷移學(xué)習(xí)和微調(diào):在像ImageNet一樣全面注解的醫(yī)療成像領(lǐng)域中獲取數(shù)據(jù)仍然是一個挑戰(zhàn)。當(dāng)沒有足夠多的數(shù)據(jù)可用時,有幾種方法可以提供幫助:1)遷移學(xué)習(xí):由自然的圖像數(shù)據(jù)集或由一個不同醫(yī)療領(lǐng)域中所預(yù)訓(xùn)練過的卷積神經(jīng)網(wǎng)絡(luò)模型(監(jiān)督型)被用于手頭一個新的醫(yī)療任務(wù)。一種方案是,一個預(yù)訓(xùn)練過的卷積神經(jīng)網(wǎng)絡(luò)被施加到一張輸入圖像中,然后其輸出從網(wǎng)絡(luò)層中被提取出來。所提取的輸出被當(dāng)做特征并被用于訓(xùn)練一個單獨的模式分類器。例如在Bar等人的研究中,預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)被用來作為一個鑒定胸部病理的特征生成器。在Ginneken等人的研究中,基于卷積神經(jīng)網(wǎng)絡(luò)的特征與手動添加的特征被整合在一起,實現(xiàn)了一個結(jié)節(jié)(nodule)檢測系統(tǒng)中的性能提升。2)微調(diào):確實有一個中等大小的數(shù)據(jù)集可用于手頭任務(wù),一個參考方案是,在進一步的監(jiān)督型訓(xùn)練完成后,將一個預(yù)先訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)作為幾個(或全部)網(wǎng)絡(luò)層的初始化來使用,在手頭任務(wù)中使用新數(shù)據(jù)。
遷移學(xué)習(xí)和微調(diào)是在醫(yī)療成像應(yīng)用中使用深度卷積神經(jīng)網(wǎng)絡(luò)的關(guān)鍵部分。對這些問題進行探討的是Shin和Tajbakhsh等人的研究工作。其研究中的實驗結(jié)果一致表明,使用帶有微調(diào)的預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)能夠達到最佳效果,無論是特定應(yīng)用領(lǐng)域(Tajbakhsh等人)還是所有網(wǎng)絡(luò)架構(gòu)(Shin等人)。Tajbakhsh等人的進一步分析表明,深度微調(diào)在性能提升方面優(yōu)于淺度微調(diào),而訓(xùn)練集尺寸的降低也使得使用微調(diào)的重要性得到提高。在Shin等人的研究中,GoogleNet架構(gòu)相比其他較淺深度架構(gòu)實現(xiàn)了最先進的縱隔淋巴結(jié)檢測。
5)真實標(biāo)注數(shù)據(jù)(GroundTruth)——來源于專家與非專家:對公開真實標(biāo)注數(shù)據(jù)的缺乏,以及每次醫(yī)療任務(wù)中收集這些數(shù)據(jù)的難度,加上成本和時間開銷,這些都是醫(yī)療領(lǐng)域中令人望而卻步的限制因素。雖然眾包實現(xiàn)了對現(xiàn)實世界圖像的大型數(shù)據(jù)庫的注釋,但其在生物醫(yī)學(xué)目的上的應(yīng)用卻需要一個更加深入的理解力,因而需要對實際注釋任務(wù)有更精確的定義(Nguyen和McKenna等人)。專家任務(wù)被外包給非專家用戶的事實可能會導(dǎo)致雜亂的注釋,引起用戶之間的分歧。許多問題出現(xiàn)在醫(yī)學(xué)專家與非專業(yè)人士的知識結(jié)合上,比如怎樣結(jié)合信息源,如何由他們在性能和其他方面被事先證明過的準(zhǔn)確性來評估和混合輸入權(quán)重。這些問題由Albarqouni等人解決。他們提出一種結(jié)合了聚合層aggregationlayer的網(wǎng)絡(luò),該聚合層被集成到卷積神經(jīng)網(wǎng)絡(luò)中,從而將源于群眾注釋的學(xué)習(xí)輸入作為網(wǎng)絡(luò)學(xué)習(xí)過程的一部分。顯示結(jié)果對深度卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的功能給出了有價值的見解。有關(guān)醫(yī)學(xué)領(lǐng)域中眾包研究最驚人的事實竟是這樣一個結(jié)論:一群非專業(yè)的、沒有經(jīng)驗的用戶實際上可以做得像醫(yī)學(xué)專家一樣好。Nguyen和McKenna等人在放射圖像的研究中也觀察到了這點。
D.創(chuàng)新應(yīng)用和新奇應(yīng)用案例
Kallenberg[32]的工作是以乳腺X片圖像為輸入數(shù)據(jù)源,運用無監(jiān)督式特征學(xué)習(xí)來為乳腺的疾病風(fēng)險打分。他們展示了一種從無標(biāo)記數(shù)據(jù)來學(xué)習(xí)層次特征的方法,然后這些特征將會直接輸入到一個簡單分類器中。在這個分類器中,將會進行2類不同的操作:1)乳房密度的圖像分割,2)乳腺X片紋理的打分。分類器在這兩方面的表現(xiàn)都非常優(yōu)秀。為了控制訓(xùn)練模型的容量,通過一個稀疏正則化優(yōu)化來控制稀疏的時間和范圍。無監(jiān)督式學(xué)習(xí)過程中卷積層其實可以看成是一個自動編碼器autoencoders;在監(jiān)督學(xué)習(xí)部分,(預(yù)先訓(xùn)練好的)權(quán)值和偏差值會進一步運用softmax回歸函數(shù)來微調(diào)。
Yan[33]等人的工作中設(shè)計了一個多階段(multi-stage)深度學(xué)習(xí)框架來處理圖像分類問題并且將其用于人體局部特征識別。在預(yù)訓(xùn)練階段,通過多示例學(xué)習(xí)(multi-instancelearning)來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),從而獲取當(dāng)前訓(xùn)練數(shù)據(jù)切片中里最具有辨別力的局部圖塊和無效訊息的局部圖塊。在強化階段,預(yù)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)將進一步通過相應(yīng)局部圖像來訓(xùn)練圖像分類器,從而強化他的分類能力。這個多示例深度學(xué)習(xí)方法的突出點在于可以自動的完成區(qū)分性的局部圖像和無效訊息的局部圖像的識別。因此,不需要事先的人工標(biāo)注工作。
回歸網(wǎng)絡(luò)在醫(yī)療圖像里的使用不是很常見。Miao等人提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的回歸網(wǎng)絡(luò),來實現(xiàn)實時的二維/三維配準(zhǔn)。他們提出了三個算法來簡化潛在的映射對象回歸,并且在CNN回歸模型中加入了一種強壯的非線性模型。從這個網(wǎng)絡(luò)的輸出結(jié)果來看,深度學(xué)習(xí)算法比之前的最優(yōu)算法的結(jié)果更準(zhǔn)確且魯棒性更好,大幅度提升了基于灰度的二維/三維配準(zhǔn)進程。
目前我們?nèi)匀辉谔剿魃窠?jīng)網(wǎng)絡(luò)可以應(yīng)用的領(lǐng)域,以及在哪些領(lǐng)域上他們的應(yīng)用和任務(wù)維度上會產(chǎn)生持續(xù)的影響。在一個開創(chuàng)性的研究中,Golkov[35]提出了一個原始化的論證,他運用深度學(xué)習(xí)來簡化彌散MRI(核磁共振)圖像數(shù)據(jù)處理,優(yōu)化后僅需一步。他們的研究表明,這種改進使得人們從一個先進的模型獲取標(biāo)量測量數(shù)據(jù)的掃描時間減少了12倍,并且不需要運用擴散模型就能識別異常。揭示擴散加權(quán)信號和顯微組織特性之間的關(guān)系是值得正視的。Golkov[35]表示,運用深度神經(jīng)網(wǎng)絡(luò)也許可以揭示這樣的關(guān)系:彌散加權(quán)成像(DWIs)可以直接被作為輸入數(shù)據(jù),而不是通過模型擬合獲得的標(biāo)量測量值來處理。這項研究表明基于逐個立體像素的顯微組織預(yù)測,以及基于彌散加權(quán)成像值的自動無模型圖像分割可以用于健康組織和MS病灶的模型訓(xùn)練中。擴散峰廣為人知的是通過12個數(shù)據(jù)點、凸起方向彌散以及僅8個數(shù)據(jù)點的密度估計來得到。這個為臨床研究提供了快速且魯棒性更好的方法,同時也表明標(biāo)準(zhǔn)的數(shù)據(jù)處理過程可以用深度學(xué)習(xí)的方法來簡化。
討論:關(guān)鍵問題和展望
已有的很多工作顯示,深度網(wǎng)絡(luò)的的使用提升了目前的最高水平,且這些提升在很多領(lǐng)域都是一致的。通常情況下,深度學(xué)習(xí)給出解決方案的所取得的進步是相對直接的,這一點我們可以從醫(yī)療計算領(lǐng)域看到這一明顯的進步。在《醫(yī)療影像中的深度學(xué)習(xí):一項令人激動的新科技的綜述和展望》一文中,提出了這樣一些問題:2012年的大規(guī)模種類識別理論有了10%的進步,但如何在應(yīng)用方面獲得實質(zhì)性的飛躍呢?所提出的問題正確嗎?探索的方向正確嗎?使用的圖像表達技術(shù)足以支撐嗎(比如,2D還是3D)?需要從每個醫(yī)療案例中獲得更多的數(shù)據(jù)嗎?還是轉(zhuǎn)向深度學(xué)習(xí)更高效?還有更多的相關(guān)問題在這篇文章的第二部分被提出來。大部分的問題丞待解決。
在這篇文獻中,可以看出,雖然通過深度網(wǎng)絡(luò)可以接觸到監(jiān)督式學(xué)習(xí)和無監(jiān)督式學(xué)習(xí),但是似乎大部分的工作都在使用監(jiān)督式學(xué)習(xí)。那么在醫(yī)學(xué)領(lǐng)域呢?數(shù)據(jù)量是一個關(guān)鍵因素,在形式上就要求結(jié)合監(jiān)督式學(xué)習(xí)和無監(jiān)督式學(xué)習(xí)雙方的優(yōu)點。在醫(yī)學(xué)領(lǐng)域,由于很難獲取大數(shù)據(jù)(人工標(biāo)注難以獲得),所以該領(lǐng)域需要更多的半監(jiān)督式學(xué)習(xí)和監(jiān)督式學(xué)習(xí)。
此文包括很多的網(wǎng)絡(luò)構(gòu)架。從當(dāng)前已發(fā)表的論文中可以看出可變性是非常大的。選擇已知的構(gòu)架,設(shè)計任務(wù)穩(wěn)定的構(gòu)架,跨構(gòu)架融合等都可能導(dǎo)致可變性。我們可以就此提出一個有趣的問題:如果一個非常深層的殘差網(wǎng)絡(luò),跨過了152層,在ILSVRC2015層分類任務(wù)上表現(xiàn)最好,那么應(yīng)用到醫(yī)療上也可以獲得很好的結(jié)果嗎?
深度學(xué)習(xí)一個很重要的方面就是它可以從大量的訓(xùn)練數(shù)據(jù)中獲益?;贗mageNET數(shù)據(jù)集在ILSVRC競賽后,獲得了計算機視覺上的巨大突破(http://www.image-net.org/)。相比于其他論文中所用到的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,這個特殊問題所用到的數(shù)據(jù)集非常大(百萬和一千一百相比)。如果我們能構(gòu)建了類似這么大的公共醫(yī)學(xué)圖像數(shù)據(jù)集,我們的社會將受益很大。
為什么這項工作非常有挑戰(zhàn)性呢?第一,很難為構(gòu)建這樣一個數(shù)據(jù)集籌措資金;第二,要對醫(yī)學(xué)圖像數(shù)據(jù)進行高質(zhì)量的注解,就需要醫(yī)學(xué)專業(yè)知識,這不僅非常稀缺且非常昂貴;第三,與自然圖像相比,隱私問題使得醫(yī)療數(shù)據(jù)更難以獲得;第四,醫(yī)療成像的應(yīng)用廣度需要收集更多不同的數(shù)據(jù)集。盡管存在著這么多障礙,我們還是在數(shù)據(jù)收集和共享數(shù)據(jù)方面有了很快的進展。許多公共數(shù)據(jù)集已經(jīng)發(fā)布,并且現(xiàn)在在實踐中使用它們了。例如,VISCERAL和癌癥成像檔案,Rothetal.[13]和Shinetal.[17],通過對CT掃描擴大的淋巴結(jié)圖像進行分析而獲得的數(shù)據(jù)集,已經(jīng)在癌癥成像檔案上公開,同一研究組也在線上公開了胰腺數(shù)據(jù)集。
自2007年以來,在諸如MICCAI,ISBI和SPIE醫(yī)學(xué)成像等醫(yī)學(xué)成像會議上舉辦競賽研討會已經(jīng)成為一種習(xí)慣。網(wǎng)站上有大量的數(shù)據(jù)集和正在進行的研究(http://www.grand-challenge.org/)。使用這些公共基準(zhǔn)數(shù)據(jù)集相對于僅使用公共數(shù)據(jù)集具有明顯的優(yōu)勢:競賽提供了要解決的任務(wù)的精確定義,并且已經(jīng)定義一個或多個評估度量,給各種算法提供了公平的評價標(biāo)準(zhǔn)。如果沒有這樣的評價標(biāo)準(zhǔn),即使各個算法使用相同的數(shù)據(jù)集,也難以將相同問題的不同方法進行比較。例如,其中的三個研究(Anthimopoulos等,Shin等[17]和vanTulder等)使用帶有醫(yī)學(xué)注釋的相同胸部間質(zhì)性肺疾病CT掃描數(shù)據(jù)集,但是他們所報告結(jié)果卻不同。
在這一方面,一項關(guān)于這個問題的研究(Setioetal.)在一個對肺結(jié)節(jié)的挑戰(zhàn)上初見成果。這項挑戰(zhàn)是由IEEE和ISBI會議共同組織,所使用的是公開的LIDC/IDRI數(shù)據(jù)集,這篇文章中所提建立的系統(tǒng)可直接與其替代方法進行比較。
去年已經(jīng)有了一個以醫(yī)療圖像分析為平臺,基于機器學(xué)習(xí)應(yīng)用的比賽。Kaggle組織了一次關(guān)于識別糖尿病患者眼底彩色圖像的競賽,獎金為100000美金。661支隊伍提交了結(jié)果,一共提供了8000張圖片。這些數(shù)據(jù)被用于一項特殊研究(vanGrinsvenetal.)。最近。第二屆通過核磁共振圖片測量心臟體積,得出射血分?jǐn)?shù)圖像醫(yī)學(xué)圖像分析競賽結(jié)束了。一共192支隊伍參加了比賽,獎金為200000美金。在這兩個比賽中,最優(yōu)秀的競爭者都在使用卷積神經(jīng)網(wǎng)絡(luò)。在所使用的較為好的算法中,使用大數(shù)據(jù)集和深度學(xué)習(xí)的參賽者顯出了更大的優(yōu)勢,我們希望這種趨勢能繼續(xù)下去。在這種情況下,在接下來的一系列世界范圍內(nèi)關(guān)于提高各種成像的癌癥篩查的準(zhǔn)確性的競爭,可能會引起相關(guān)人士的關(guān)注。
Albarqouni等人的研究顯示,在線平臺,例如比賽中的那些平臺,可以用于多種目的。它們會促進新的合作,形成解決方案,也能夠通過眾包而獲得大量數(shù)據(jù)的。
最后,我們感謝總編的指導(dǎo),TMI辦公室的幫助,最重要的是作者和審稿人的巨大努力。這篇文章給出了醫(yī)學(xué)影像,這個迅猛發(fā)展的領(lǐng)域的快照。我們希望你會喜歡它,并期待未來你對這個領(lǐng)域的貢獻。
(文章來源:網(wǎng)易科技)
第三十四屆CIO班招生
國際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:houlimin
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,請及時通知本站,予以刪除。