在醫(yī)學影像技術(shù)及其交叉學科領(lǐng)域,有許多問題需要借助高性能計算才能得到解決,如醫(yī)學影像重建、放療劑量評估、影像基因組學等。中國科學院蘇州生物醫(yī)學工程技術(shù)研究所醫(yī)學影像室研究員高欣帶領(lǐng)的數(shù)字介入診療課題組,從2014年開展了云計算技術(shù)在醫(yī)學影像計算領(lǐng)域的應(yīng)用研究,取得了進展,并已應(yīng)用于醫(yī)學影像的數(shù)據(jù)處理。以放療劑量評估為例,課題組成員劉仰川等針對在本地計算機上進行放療劑量評估耗時嚴重的問題,開展了基于云計算加速的放療劑量評估研究。研究人員提出了利用在云計算平臺Amazon EC2上構(gòu)建Hadoop集群(見圖1),實現(xiàn)基于MapReduce的GATE仿真加速的方案(見圖2)。在該方案中,GATE是一款Monte Carlo仿真軟件,具備完善的放療劑量評估功能;Hadoop是一款開源軟件,它提供了分布式計算框架MapReduce,還提供了大數(shù)據(jù)儲存框架HDFS。
在云端Hadoop集群中,節(jié)點(又稱主機、實例)均來自同一個機器鏡像(Amazon Machine Image,AMI),且被分配了不同的角色,其中一個Master節(jié)點負責計算任務(wù)的分配、一個Secondary NameNode節(jié)點負責對Master節(jié)點進行備份、多個Slave節(jié)點負責計算。本地計算機通過SSH通訊協(xié)議實現(xiàn)跟云端集群之間的數(shù)據(jù)上傳與下載。
在MapReduce框架中,包含Map和Reduce兩種任務(wù),它們均在worker節(jié)點內(nèi)運行,分別負責計算和合并。Map任務(wù)首先從HDFS中下載仿真代碼文件(sub-macro),再調(diào)用GATE進行仿真,并將中間結(jié)果(sub-dose、sub-dose uncertainty)以鍵值對(key-value pairs)的形式發(fā)送出去。Reduce任務(wù)將具有相同鍵(key)的中間結(jié)果合并,并將最終結(jié)果傳輸至HDFS。
為了驗證基于MapReduce的GATE仿真加速方案的有效性,科研人員構(gòu)建了18MeV的X光束入射水模實驗,分別進行了本地單線程仿真、云端多集群仿真、云端多光束強度仿真、以及集群可靠性仿真。實驗中,作為云計算加速的典型結(jié)果,含有64個worker節(jié)點的集群,相對單個worker節(jié)點集群和本地計算機,分別取得了41倍和32倍的加速比。該方案除了能應(yīng)用于醫(yī)學影像領(lǐng)域外,還可應(yīng)用于生物醫(yī)學領(lǐng)域的諸多方面,如基因測序、蛋白質(zhì)分析等。
上述研究成果發(fā)表在Australasian Physical & Engineering Sciences in Medicine上。
該研究工作得到了國家自然科學基金、中科院科研裝備研制項目及蘇州科技計劃項目的資助。
圖1.云端Hadoop集群構(gòu)建示意圖
圖2.基于MapReduce的GATE仿真加速方案