研究表明,功能連接可揭示生物標志物的個體心理或臨床特征。然而在靜息態(tài)功能磁共振的典型分析中,不同研究者對其分析方法的選擇并不固定且存在很多差異。為此,對靜息態(tài)數(shù)據(jù)進行一種特定類型的研究將具有較強的現(xiàn)實意義,所以我們選擇了一種預(yù)測模型(針對功能連接),接下來本文將對此選擇做出合理的解釋。本文發(fā)表在Neuroimage雜志。
研究方法:
本文系統(tǒng)地研究了 6 個不同隊列的預(yù)測模型(被試2000人左右)。這些模型涉及的病癥及考慮的因素為:神經(jīng)退行性疾病(阿爾茨海默氏癥、創(chuàng)傷后應(yīng)激障礙)、精神障礙疾?。ň穹至寻Y、自閉癥)、藥物影響(大麻使用)、臨床環(huán)境和心理特征(流體智力)。人們對rest-fMRI 的預(yù)測過程主要包括三個步驟:定義腦區(qū)、確定交互作用以及監(jiān)督學習的最優(yōu)方案。本文對于任何一步都會進行基準測試: 在實驗過程中,本文采用8種方法定義腦區(qū)(從REST-fMRI數(shù)據(jù)中預(yù)定義或直接生成),采取3種措施建立功能連接(從提取的時間序列中),構(gòu)建10個分類模型(為比較受試者之間的交互作用)。盡管人口分布及地點存在差異性,但本文仍然對240多個不同的管道進行了總結(jié),且對本文的模型進行了概括。研究發(fā)現(xiàn),實驗效果在根據(jù)功能數(shù)據(jù)所定義的區(qū)域上達到最好,且人們利用諸如線性回歸這種線性預(yù)測模型,其預(yù)測效果最佳。
研究背景:
靜息態(tài)功能磁共振成像(Rest-fMRI)是一種無特定任務(wù)的腦活動的分析,目前,它已成為探測人腦功能(針對健康人群及疾病人群)的首選工具。同時由于REST-fmri數(shù)據(jù)容易獲得、前景廣闊的特點,這就導(dǎo)致人們開始大規(guī)模地收集REST-fMRI數(shù)據(jù)(如2013年,Van Essen等人的人類連接組項目)。由于大樣本的數(shù)據(jù),其統(tǒng)計分析結(jié)果更準確,更更具有說服力,所以人們將較容易獲得的rest-fmri腦影像數(shù)據(jù)與人體神經(jīng)病理等臨床癥狀聯(lián)系起來,他們利用REST-fMRI數(shù)據(jù),構(gòu)建預(yù)測模型、建立生物標記物。
人們可以從REST-fMRI數(shù)據(jù)中提取出功能連接體(表征大腦的網(wǎng)絡(luò)結(jié)構(gòu)),而且人們可用大腦功能連接體的權(quán)重來表示個體的行為、認知、年齡、心理健康程度及和腦部病理程度。
功能連接能否轉(zhuǎn)化為預(yù)測感興趣表型的生物標記與機器學習管道(管道在本文中的意思是連續(xù)的數(shù)據(jù)處理形成的固定步驟)息息相關(guān),換句話說,機器學習管道對此過程有著關(guān)鍵作用。就REST-fMRI數(shù)據(jù)而言,將功能連接轉(zhuǎn)換為對分類對象的表型的處理管道通常包括3個,如圖1所示:
盡管該領(lǐng)域的許多綜述表明,人們可運用大腦功能連接邊的權(quán)重對感興趣的客體進行分類,但這個過程中能使用的管道種類實在太多,且不同的管道選擇對研究的準確性有相當大的影響,此外,分析這種變化所耗費的成本是一般研究的兩倍,所以很少有人討論此問題。綜上,人們之所以不討論此問題可簡單概括如下:首先,這種研究方法對實踐者而言是一種負擔,因為他們沒有系統(tǒng)的指導(dǎo),且他們需要在諸多選擇中去做出合理的選擇。其次,多變的方法會給研究人員帶來特別大的自由度,所以這可能對生物標志物預(yù)測準確性的測量造成影響。考慮到上述因素,我們應(yīng)該慎重地選擇建模方法和處理管道。
因此,本文基于功能連接組的分類管道及分類管道的不同步驟,進行了系統(tǒng)的基準測試(基準測試是指通過設(shè)計科學的測試方法、測試工具和測試系統(tǒng),實現(xiàn)對一類測試對象的某項性能指標進行定量的和可對比的測試)。除此之外,為制定出更好的策略,本文還分析了6個不同隊列的預(yù)測精度,這其中包括不同的臨床問題、不同的樣本量、難度不一的預(yù)測問題及一個心理特征。雖然最優(yōu)模型可能會因預(yù)測任務(wù)而產(chǎn)生差異,但本文所作的基準測試仍可概括出一些基本趨勢。
具體來說,將從以下幾個方面來展開研究:
1. 我們應(yīng)該如何選擇節(jié)點:通過預(yù)定義的圖譜還是采用數(shù)據(jù)驅(qū)動的方法?基于腦影像的診斷,我們需要多少節(jié)點?節(jié)點應(yīng)該選擇分布式大腦網(wǎng)絡(luò)還是感興趣區(qū)域(ROI)?
2.我們應(yīng)該如何表示大腦功能連接組的權(quán)重:是通過相關(guān)性、部分相關(guān)性還是采用更復(fù)雜的模型來測量協(xié)方差矩陣的幾何特征?
3.考慮到大腦功能連接組的權(quán)重,我們應(yīng)選擇哪些分類器來用于機器學習?我們應(yīng)該首選線性模型還是非線性模型?應(yīng)該使用稀疏模型還是非稀疏模型?我們是否還應(yīng)該考慮特征選擇呢?
本文除了探索以上這些主要問題,還對預(yù)處理策略和協(xié)變量控制進行了額外的實驗(研究帶通濾波和全腦均值回歸的效果)。
本文的全局概括:
本文結(jié)構(gòu)如下:
首先回顧了迄今為止被大量使用的具體方法。
接著,提出了基準測試的不同選擇(針對分類管道步驟),并對這些方法進行了相應(yīng)的描述;
最后,根據(jù)本文的試驗情況,對其實驗結(jié)果進行報告并揭示了它們的趨勢。
方法:功能連接組分類管道
當前實踐的簡要回顧:基于功能連接組的預(yù)測方法
在研究過程中,本文首次使用三篇綜述里面有關(guān)預(yù)測研究的調(diào)查方法,這三篇綜述的作者分別為Wolfers , Arbabshirani 等人及Brown and Hamarneh 。從這些綜述中來看,這27項研究均運用了REST-fMRI數(shù)據(jù),并獲得了良好的分類分數(shù)。下面將對不同管道步驟中的選擇進行簡要概括(詳情見表2)。 定義腦區(qū)ROI的不同方法:
參考文獻坐標,以其為中心,制作半徑為 5 毫米到 10 毫米的小球ROI;
參考一些腦圖譜如 AAL腦圖譜、基于皮層結(jié)構(gòu)的圖譜以及基于功能連接的分區(qū)圖譜;
基于k-均值、Ward聚類方法、獨立成分分析方法(ICA)或字典學習的數(shù)據(jù)驅(qū)動方法,以往研究中使用的分區(qū)的腦區(qū)數(shù)量可設(shè)置成幾十個到幾百個,但人們通常將節(jié)點數(shù)(即腦區(qū)數(shù)量,為方便描述,后文統(tǒng)一為節(jié)點)控制在100個左右。
接下來描述大腦功能連接組的表示情況:
實驗研究從二階統(tǒng)計量的角度出發(fā),來定義功能交互作用(基于單一協(xié)變量)。研究使用 Pearson 相關(guān)或偏相關(guān)的數(shù)理統(tǒng)計方法,其研究過程主要涉及最大似然估計或 Ledoit-Wolf 收縮協(xié)方差估計。我們知道節(jié)點之間的部分相關(guān)性有助于規(guī)避相關(guān)結(jié)構(gòu)中的間接影響,但這一過程需要借助對協(xié)方差的收縮估計(收縮是一種正則化形式,用于在訓練樣本數(shù)量比特征數(shù)量少的情況下改善協(xié)方差矩陣的估計),我們對其中最簡單的一個實驗進行了基準測試。
關(guān)于預(yù)測分類器的描述
人們在之前的實驗中已經(jīng)使用過許多不同的分類器(其中包括線性分類器、非線性分類器以及稀疏分類器和非稀疏分類器),本文從中挑選出一些模型,并對其進行使用。詳情見表A2。除了表上面所展示的原型管道之外,還有一些研究使用了如網(wǎng)絡(luò)模塊化或中心性等圖論的網(wǎng)絡(luò)建模方法,但值得一提的是,人們很少把這些方法與監(jiān)督學習相結(jié)合使用。雖然圖論指標可以很好地捕捉到大腦連通性全局方面的信息,但不能很好地捕獲特定子網(wǎng)絡(luò)中的連通性特征。所以本文只專注于機器學習方法(用于提取判別關(guān)系),不研究圖論方法。
因為當前的做法非常多樣且對建模方法沒有標準的定義及選擇。所以為了確保研究的準確性及合理性,本文探索了經(jīng)典機器學習管道中比較流行的方法及其變體,以更好地滿足我們的實驗?zāi)繕耍▽δ苓B接進行良好且有效的預(yù)測)。
接下來,將會對本文的研究進行詳細的介紹。定義感興趣腦區(qū)(ROI)
實驗假設(shè):在本文定義的ROI范圍內(nèi),能很好地捕捉到與功能連接相關(guān)的功能單元。雖然本文研究了解剖學上和功能上所定義的腦圖譜,也學習了定義ROI的相關(guān)數(shù)據(jù)驅(qū)動方法,但因為使用條件以及不同病理的差異性,所以我們需要清楚:在實際的研究中,ROI的選擇是一個極其困難的過程。
預(yù)定義圖譜的選擇:
本文選擇了四個標準腦圖譜,其中兩個是結(jié)構(gòu)圖譜:
(1)AAL116腦圖譜
(2)Harvard Oxford圖譜,總共包含118個ROI
(3)Bootstrap Analysis of Stable Clusters (BASC)腦圖譜,選擇序號為36,64,122,197,325,444的感興趣區(qū)
(4)Power圖譜,制作半徑為5mm的小球ROI
對于所有的基準測試,本文都只使用預(yù)先計算的區(qū)域。值得說明的一點是,在對靜息態(tài)數(shù)據(jù)的研究過程中,如果有些功能圖譜可運用字典學習的方法計算出,那么本文便參照Mensch等人計算的圖譜,對數(shù)據(jù)進行合理的訓練,以確保實驗結(jié)果的準確性。
數(shù)據(jù)驅(qū)動方法的選擇:
本文選擇了四種當下流行的數(shù)據(jù)驅(qū)動方法(從fMRI數(shù)據(jù)中提取ROI,且用兩種聚類方法來定義ROI:)(1)K均值聚類(2)Wards聚類算法(3)組ICA方法(4)字典學習方法
數(shù)據(jù)驅(qū)動圖譜的維度選擇:
我們采取聚類的方法,提取出不同編號的ROI,具體為:40,60,80,100,120,150,200,300。同理,我們借助CanICA 和 DictLearn線性分解方法,提取出以下成分:40,60,80,100,120。
為避免實驗?zāi)P统霈F(xiàn)過擬合的情況,對每一種數(shù)據(jù)驅(qū)動方法的分割都限制在訓練集,并直接將分割結(jié)果應(yīng)用于測試集。與此同時,在交叉驗證循環(huán)的過程中,對于每個分割(定義大腦 ROI),也將其限制在訓練集上。
為了實現(xiàn)預(yù)測目標,本文使用圖譜來學習連接模式。此外,為了讓所提取的ROI區(qū)域增強,在提取大腦 ROI 之前,先對 rest-fMRI 數(shù)據(jù)上做了高斯平滑核為6mm 的高斯平滑的操作。
本文還測試了節(jié)點是直接使用局部腦區(qū)還是分布式網(wǎng)絡(luò)。目前,功能連接組學將大腦的局部區(qū)域或?qū)鄠€區(qū)域的分布式網(wǎng)絡(luò)都稱之為節(jié)點。為了確保實驗的準確性,本文在實驗過程中,對這兩種方法都進行了考慮。
在腦網(wǎng)絡(luò)(借助Canica和DictLearn獲得)中采用隨機游走算法提取節(jié)點。對于K-Means和BASC方法,只需在它們的連通分量中劃分集群即可,在此過程中,去除尺寸 < 1500立方毫米的假陽性區(qū)域。圖2展示了利用各種數(shù)據(jù)驅(qū)動方法從ADNI REST-fMRI數(shù)據(jù)中獲得的大腦區(qū)域,具體情況如圖所示:
圖2:使用ICA、DictLearn、KMeans和Ward方法提取的大腦區(qū)域。使用 ICA 和字典學習方法,得到的靜息態(tài)網(wǎng)絡(luò)的維度分別是80和60,隨之被分解為多個區(qū)域(150個)。通過KMeans和Ward聚類得到120個區(qū)域,其顏色隨機分配。
多連通圖的參數(shù)化
然后對每個節(jié)點都提取出其時間序列。在信號提取的過程中,本文探索了幾種降噪方法來規(guī)避非神經(jīng)偽影,降噪方法具體為:對數(shù)據(jù)做低通濾波的處理,對全腦均值均值進行回歸。為了有效地估計功能連通性,使用了Ledoit-Wolf收縮估計,并給出了收縮參數(shù)的形式表達式。雖然REST-fMRI數(shù)據(jù)集的時間序列長度不同,但這種估計方法仍能產(chǎn)生良好效果,本研究還針對協(xié)方差,研究了它的的非正則化及稀疏估計方面的問題(見附錄H.2)。本研究在這種協(xié)方差結(jié)構(gòu)的背景下,對三種不同的功能交互的參數(shù)化過程進行了研究:全相關(guān)、偏相關(guān)及協(xié)方差矩陣。雖然協(xié)方差矩陣使用頻率較低,但它具備良好的數(shù)學基礎(chǔ),且許多研究都報告出該框架具有良好的解碼性能。本研究對兩個變量進行了比較,使用歐幾里得平均值或幾何平均值作為參考點(在這兩種情況下都參考了Nilearn所提出的方法)。值得注意的是,偏相關(guān)和切線空間的計算都需要求協(xié)方差逆矩陣,因此這些矩陣必須可逆。所以,這些參數(shù)化法不適用于非正則化協(xié)方差估計。
為了后面統(tǒng)計分析過程的良好進行,本研究對功能連接的每個參數(shù)都進行了矢量化的操作處理(數(shù)據(jù)的標準化),使用連通矩陣的下三角部分進行分類。
監(jiān)督學習:分類器
最后,使用預(yù)測模型進行分類。在這個過程當中,本研究運用了幾種不同的方法(線性方法、非線性方法、稀疏方法和非稀疏方法)。對于非線性方法,用 K = 1 和歐幾里得距離的方法來度量最近鄰方法(K-NN)、高斯樸素貝葉斯 (GNB) 和隨機森林分類器 (RF)。對于線性分類器,本研究使用了支持向量分類 (SVC) 和 Logistic 回歸的方法,設(shè)定稀疏度值為?1,并對其做了正則化的處理。對于非稀疏線性分類器,本研究使用了嶺分類、SVC、Logistic回歸的數(shù)學方法。此外,對于 SVC,還使用了單因素方差分析方法對其進行 10%閾值的特征篩選。對于正則化參數(shù)(例如 SVC 中的軟邊距參數(shù)),使用默認的值C =1或α= 1,因為研究發(fā)現(xiàn)這兩個默認值具有很好的代表性。
實驗研究
為了對不同的預(yù)測模型進行基準測試,本實驗所用的數(shù)據(jù)為五個公開可用的REST-fMRI數(shù)據(jù)集,并在這些數(shù)據(jù)集上應(yīng)用了不同的功能連接組分類管道。在實驗過程中,對臨床上不同的的功能連接預(yù)測結(jié)果都進行了研究,這其中包括:神經(jīng)退行性、神經(jīng)精神障礙、藥物濫用的影響及流動智力。本文專注于二進制的分類問題。具體情況如表1所示:
表1:數(shù)據(jù)集和預(yù)測任務(wù)。每組的被試數(shù)目:COBRE :142人ADNI :136 人ADNIDOD:167人ACPI :126 人ABIDE :866人HCP : 443人
IQ代表流動智力(788 名受試者在 HCP900 版本中獲得 IQ 分數(shù))表 A3總結(jié)了每個數(shù)據(jù)集的采集參數(shù)。
1. 參照ADNI的restfMRI 數(shù)據(jù),以對患有輕度認知障礙 (MCI) 的被試與被患有阿爾茨海默病 (AD) 的被試進行區(qū)分。
2. 參照ADNIDOD的restfMRI 數(shù)據(jù),將PTSD患者與健康對照組區(qū)分開來。
3. 參照ACPI的restfMRI 數(shù)據(jù),判別被試是否有過吸食大麻史。
4. 參照ABIDE的restfMRI 數(shù)據(jù),以此區(qū)分出患有自閉癥障礙的患者實驗組與健康對照組。
5. HCP 900人連接體項目包含健康受試者的成像和行為數(shù)據(jù)。使用來自HCP900釋放的預(yù)處理的rest-fMRI數(shù)據(jù)來區(qū)分高智商和低智商個體.
6. 參照COBRE(生物研究中心)的 restfMRI 數(shù)據(jù),來研究精神分裂癥和雙相情感障礙這兩種疾病。需要注意的是,本文主要利用精神分裂癥患者的數(shù)據(jù),將其與健康組進行對照,以便達到預(yù)測目標。
Rest-fMRI數(shù)據(jù)預(yù)處理:軟件及相關(guān)過程
用SPM12軟件對 COBRE、ADNI 和 ADNIDOD數(shù)據(jù)進行預(yù)處理。預(yù)處理包括:頭動校正、一步配準,平滑(高斯平滑核為5mm)。除此之外,在數(shù)據(jù)處理的過程中,剔除了有嚴重偽影(多人肉眼觀察)或頭動大于 2 毫米的被試。對于經(jīng)過預(yù)處理的 ABIDE數(shù)據(jù) 和 ACPI數(shù)據(jù),本研究選用 C-PAC pipeline 來處理圖像,但本研究在這個過程中,沒有回歸全腦均值。對于 ACPI數(shù)據(jù),本研究使用ANTS配準的方法對圖像數(shù)據(jù)進行標準化處理,但沒有刪除數(shù)據(jù),也沒有對數(shù)據(jù)做全腦均值的回歸處理。對經(jīng)過預(yù)處理可用的數(shù)據(jù)者,繼續(xù)進行下面的操作,而且,本研究沒有對HCP 數(shù)據(jù)做任何額外的預(yù)處理操作。
刪除標準:
本研究通過目視檢查(肉眼觀察)的步驟剔除了一些被試,也借助其他辦法排除了不符合要求的被試。例如,本研究從 COBRE 樣本中剔除了既患有雙相情感障礙疾病又患有分裂情感疾病的被試。對于HCP數(shù)據(jù),本研究為了更容易預(yù)測二元分類設(shè)置,把低智商與高智商被試做了分組處理,根據(jù)分位數(shù) 0.333 (以下為低智商)和 0.666 (以上為高智商)來選擇(詳情見表1)。
交叉驗證和誤差測量:
本研究在進行交叉驗證(CV)的過程中對所有被試進行隨機處理,并對每個數(shù)據(jù)集做了超過100次的分割,最終將被試分成兩組:75%的被試運用訓練分類器和數(shù)據(jù)驅(qū)動模型的方法來分割腦區(qū),剩余25%的被試則在不可見數(shù)據(jù)上進行測試。此外,本研究對數(shù)據(jù)進行分層處理,以保持組之間的樣本比率。針對每次分割,本研究計算出曲線下面積(AUC),曲線下面積的值1代表完美預(yù)測,0.5代表隨機水平概率。AUC的最終預(yù)測分數(shù)可用來衡量不同選擇之下的預(yù)測管道結(jié)果情況。
計算和實施:
本研究的實驗研究包含240多種類型的管道(8個圖譜,3個連通性度量,10個分類器,以及其他變量,如3個filter選項和3個協(xié)方差回歸選項),這些管道分別在5個數(shù)據(jù)集上運行。其運行結(jié)果是:在原始數(shù)據(jù)到模型計算期間的這個過程之中,本研究需要對50多萬個管道進行擬合,所以計算量相當大。本研究使用Python2.7工具進行數(shù)據(jù)處理。這其中包括:定義腦圖譜、提取具有代表性的時間序列以及構(gòu)建連通性度量。
結(jié)果:管道選擇的基準
接下來,本研究概述不同的模型選擇對預(yù)測結(jié)果所產(chǎn)生的影響。
本研究在表2中報告了所有REST-fMRI數(shù)據(jù)集所獲得的AUC分數(shù),并且在表2中,本研究已將每步的最優(yōu)選擇進行呈現(xiàn),以下本研究將對這些最優(yōu)選擇進行詳細闡述。
不同的方法將產(chǎn)生不同的影響,為了更好衡量其影響,所以本研究對每個管道的預(yù)測分數(shù)計算出平均值。這種相對測量方法避免了因折疊或數(shù)據(jù)集不同而導(dǎo)致的分數(shù)差異的情況。本研究對這些相對預(yù)測分數(shù)進行了觀察,并研究了不同的步驟選擇(如分類器的選擇、連接參數(shù)的選擇和大腦圖譜的選擇)對預(yù)測管道的影響。在實驗過程中,涉及很多步驟的選擇,對于固定步驟而言,其影響有二:第一,當某些實驗步驟是最優(yōu)選擇或接近最優(yōu)選擇時,本研究可以考慮其中一個步驟的影響;第二,對必選步驟來說,本研究可以考慮該步驟對其他步驟的影響。從經(jīng)驗上看,這兩種情況得出了相似的結(jié)論,詳情見附錄 C。
分類器的選擇
圖 3 總結(jié)了分類器對 rest-fMRI 數(shù)據(jù)集預(yù)測分數(shù)的情況。結(jié)果顯示不同模型和數(shù)據(jù)集(即預(yù)測目標)之間存在一定的差異性,非稀疏(l2-regularized)線性分類器的表現(xiàn)情況更好,略領(lǐng)先于logistic-l2。
圖3:分類器的選擇對預(yù)測準確性的影響。對于每個分類器,當改變其他步驟(正在進行)的建模選擇時。總體而言,L2正則化的線性分類器的表現(xiàn)更好。
連接參數(shù)的選擇
圖4總結(jié)了REST-fMRI數(shù)據(jù)集的相對預(yù)測分數(shù)受協(xié)方差矩陣的參數(shù)化情況的影響。通常來說,切空間參數(shù)化(正切空間投影法被應(yīng)用于功能連接的估計,具體方法可以看這篇文章:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7086233/)的性能優(yōu)于完全相關(guān)或部分相關(guān)。
圖4:連接參數(shù)對預(yù)測精度的影響。實驗過程中,本研究將完全相關(guān)性方法或部分相關(guān)性方法與基于切線空間的方法進行對比,發(fā)現(xiàn)使用基于切線空間的方法,其在預(yù)測時,其連通性參數(shù)顯示出更高的準確度和相對較低的方差。圖4方框顯示中位數(shù)和四分位數(shù),及五分位數(shù)和95分位數(shù)。
區(qū)域定義方法的選擇:
為找到大腦區(qū)域定義的最佳方法,本研究在實驗過程中,對實驗方法做了兩步處理。首先,本研究對每種方法都找出了最佳預(yù)測的維度,但這只適用于具有各種維度的 BASC 圖譜及數(shù)據(jù)驅(qū)動的區(qū)域定義方法(如ICA)。其次,本研究在最佳維度的這個背景之下,研究了每種方法的預(yù)測精度。
最好的辦法:
圖5總結(jié)了不同的區(qū)域定義方法的相對預(yù)測性能。盡管這些方法的系統(tǒng)性影響很小(相比于褶皺和數(shù)據(jù)集的方差),但就預(yù)測效果而言:參照功能數(shù)據(jù)定義方法所定義的區(qū)域要比參照解剖學定義方法的預(yù)測效果更好。其中,本研究使用?1字典學習方法定義區(qū)域(在REST-FMRI數(shù)據(jù)中),其實驗效果似乎是最好的,其次是ICA方法(預(yù)測效果排名第二)。
圖5:不同的圖譜定義的方法對預(yù)測精度的影響。
最優(yōu)維度:
本研究對每種最佳維度方法的選擇進行了圖示,如圖 6所示。在實驗過程中,本研究發(fā)現(xiàn)了一個在不同情況下會出現(xiàn)變化的最優(yōu)值:這個值會隨著提取節(jié)點數(shù)量的增加,使預(yù)測精度升高,然而對于其他方法,在相同情況下,這個值的預(yù)測精確性又會緩慢下降。詳情見圖6。除此之外,典型的最優(yōu)區(qū)域數(shù)量約為 150(見附錄 E)。
圖6:腦區(qū)數(shù)量對預(yù)測準確性的影響。該圖顯示了不同方法(對五個 rest-fMRI 數(shù)據(jù)集采用的方法)的 AUC 分數(shù)的分布情況。水平條(黑色)表示中位數(shù),紅色箭頭表示維度。
更大的數(shù)據(jù)集和預(yù)先計算的圖譜:
為了研究數(shù)據(jù)分析(限于更高質(zhì)量數(shù)據(jù)集)的一致性對結(jié)果的影響,本研究對包括 HCP 數(shù)據(jù)在內(nèi)的基準測試進行了相同的預(yù)處理。因這些數(shù)據(jù)時間序列更長且計算成本高,故為了降低計算成本及確保結(jié)果的嚴謹性,所以本部分將分析限制在預(yù)先計算的圖譜上(對于字典學習和ICA方法下的腦區(qū)分割,是從對ADNI REST-fMRI數(shù)據(jù)的估計中來的)。
圖7總結(jié)了不同方法對六個群組預(yù)測精確性的影響。該實驗得出了與其他實驗類似的結(jié)論:使用字典學習、切線空間參數(shù)化和 L2 正則化分類器的方法來獲取功能圖譜作為特征,對分類性能的提升更大。詳情見下圖7。
圖7:預(yù)計算區(qū)域(限于六個數(shù)據(jù)集)的流水線選擇
該圖展示了相對預(yù)測分數(shù)的邊際分布情況,最佳選擇方法正向排序為:基于字典學習的分區(qū)方法(MOD1)、聚類法(BASC)、連通性的切數(shù)空間參數(shù)化方法以及L2正則化的邏輯回歸方法。
濾波、全腦平均信號的影響
是否濾波以及是否回歸全腦平均信號對結(jié)果影響不大。
總結(jié):
本研究為使用功能磁共振數(shù)據(jù)作為特征的分類機器學習的實踐提供了一些參考方向,具體總結(jié)在表 3 中:本研究發(fā)現(xiàn)帶正則化參數(shù)的邏輯回歸方法是一個在許多情況下都可以被使用的基本模型,并且使用ICA或者字典學習方法對功能數(shù)據(jù)進行軟分區(qū)可以進一步提升模型的分類性能,除此以外,本文發(fā)現(xiàn)預(yù)處理過程中的濾波和全腦均值回歸對分類結(jié)果的表現(xiàn)沒有明顯影響。
本文研究還有一個意義在于,使用良好的默認模型可以抑制分析管道的組合爆炸,從而降低研究的計算成本,以使其實驗結(jié)論更穩(wěn)定、更具有說服力、更具有統(tǒng)計意義。值得一提的是,就數(shù)據(jù)而言,其數(shù)據(jù)分析不可能有一個萬能的解決方案,本文方法的最優(yōu)選擇以及本研究的研究雖然與前人研究的結(jié)果具有一致性,但不代表任何研究運用此方法都能達到和本文一樣的效果,所以大家在實驗過程中,可根據(jù)自己的數(shù)據(jù)以及實驗?zāi)康模侠磉x擇實驗方法和模型來進行研究。
如需原文及補充材料請?zhí)砑铀加翱萍嘉⑿牛?/span>siyingyxf或18983979082獲取,如對思影課程及服務(wù)感興趣也可加此微信號咨詢。另思影提供免費文獻下載服務(wù),如需要也可添加此微信號入群,原文也會在群里發(fā)布,如果我們的解讀對您的研究有幫助,請給個轉(zhuǎn)發(fā)支持以及右下角點擊一下在看,是對思影科技的支持,感謝!
微信掃碼或者長按選擇識別關(guān)注思影
非常感謝轉(zhuǎn)發(fā)支持與推薦
歡迎瀏覽思影的數(shù)據(jù)處理業(yè)務(wù)及課程介紹。(請直接點擊下文文字即可瀏覽思影科技所有的課程,歡迎添加微信號siyingyxf或18983979082進行咨詢,所有課程均開放報名,報名后我們會第一時間聯(lián)系,并保留已報名學員名額):
核磁:
北京:
第五十九屆磁共振腦影像基礎(chǔ)班(北京,4.14-19)
第二十九屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(北京,4.22-27)
第十九屆磁共振腦影像結(jié)構(gòu)班(重慶,4.13-18)
第六十屆磁共振腦影像基礎(chǔ)班(重慶,4.21-26)
第十二屆任務(wù)態(tài)功能磁共振數(shù)據(jù)處理班(上海,4.21-25)
第六十一屆磁共振腦影像基礎(chǔ)班(上海,5.7-12)
更新:第二十八屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(上海,5.22-27)
腦電及紅外、眼動:
北京:
第三十三屆腦電數(shù)據(jù)處理中級班(北京,4.7-11)
第二十五屆腦電數(shù)據(jù)處理入門班(北京,5.16-20)
南京:
第二十三屆腦電數(shù)據(jù)處理入門班(南京,4.23-27)
上海:
第三屆腦電機器學習數(shù)據(jù)處理班(Matlab版,上海,5.15-20)
重慶:
第二十二屆近紅外腦功能數(shù)據(jù)處理班(重慶,5.24-29)
數(shù)據(jù)處理業(yè)務(wù)介紹:
思影科技功能磁共振(fMRI)數(shù)據(jù)處理業(yè)務(wù)
思影科技嚙齒類動物(大小鼠)神經(jīng)影像數(shù)據(jù)處理業(yè)務(wù)
思影科技EEG/ERP數(shù)據(jù)處理業(yè)務(wù)
思影科技腦結(jié)構(gòu)磁共振成像數(shù)據(jù)處理業(yè)務(wù)(T1)
思影數(shù)據(jù)處理業(yè)務(wù)三:ASL數(shù)據(jù)處理
思影科技腦影像機器學習數(shù)據(jù)處理業(yè)務(wù)介紹
思影數(shù)據(jù)處理服務(wù)六:腦磁圖(MEG)數(shù)據(jù)處理
BIOSEMI腦電系統(tǒng)介紹
目鏡式功能磁共振刺激系統(tǒng)介紹