對(duì)于AI深度神經(jīng)網(wǎng)絡(luò)主要由許多節(jié)點(diǎn)層組成的復(fù)雜架構(gòu),結(jié)果導(dǎo)致大量需要在訓(xùn)練中評(píng)估的參數(shù),包括權(quán)重、偏差等。相比于簡(jiǎn)單的架構(gòu),更大、更復(fù)雜的神經(jīng)網(wǎng)絡(luò)需要更多的訓(xùn)練數(shù)據(jù)滿(mǎn)足適當(dāng)?shù)氖諗俊?/span>
最近,在IEEE論文提出如何可以減少少量數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的新方法,其實(shí),主要通過(guò)極坐標(biāo)空間中的徑向變換實(shí)現(xiàn)圖像增強(qiáng)。雖然,并未改變數(shù)據(jù)的信息內(nèi)容,而是改進(jìn)了數(shù)據(jù)的多樣性,并最終提升了神經(jīng)網(wǎng)絡(luò)的泛化表現(xiàn)。
其實(shí),從圖中可以看到。a)使用徑向變換從笛卡爾坐標(biāo)系統(tǒng)(左)中把樣本映射到極坐標(biāo)系統(tǒng)(右)。b)極坐標(biāo)系統(tǒng)中的徑向變換。c)使用徑向變換篩選 256 × 256 圖像(2D 平面)中的離散樣本。任意選定的極點(diǎn)在像素(170,50)處。d)把 c)中篩選的樣本從極坐標(biāo)系統(tǒng)映射到笛卡爾坐標(biāo)系統(tǒng)。紅色樣本表明了樣本從 c)到 d)的映射方向。
然后,上圖來(lái)自MNIST 數(shù)據(jù)集的樣本和使用極坐標(biāo)系中的徑向變換 RT(•)的相應(yīng)表征。還有,下圖中的多模態(tài)醫(yī)療數(shù)據(jù)集的樣本,以及在極坐標(biāo)系統(tǒng)中使用徑向變換的相應(yīng)表征。
IEEE利用AI神經(jīng) 將變換實(shí)現(xiàn)圖像增強(qiáng)
使用MNIST和醫(yī)療多模態(tài)數(shù)據(jù)集中的原始和徑向變換圖像訓(xùn)練的AlexNet和GoogLeNet模型的收斂行為。術(shù)語(yǔ)「RT」是指徑向變換圖像,術(shù)語(yǔ)「Original」是指用很少的原始圖像訓(xùn)練的模型。x軸表示訓(xùn)練迭代,左y軸表示訓(xùn)練時(shí)的模型損失,右y軸表示使用驗(yàn)證數(shù)據(jù)集訓(xùn)練時(shí)的模型準(zhǔn)確度。
通過(guò)原始和徑向變換的多模態(tài)醫(yī)療圖像訓(xùn)練的 AlexNet 和 GoogLeNet 的準(zhǔn)確度(「Acc.」in %)和置信度(「Conf.」in %)值?!窤bd」是指腹部 MRI,「Std」是標(biāo)準(zhǔn)偏差。黑體部分是最佳結(jié)果。
此外,通過(guò)原始和徑向變換的 MNIST 圖像訓(xùn)練的AlexNet和GoogLeNet的準(zhǔn)確度(「Acc.」in %)和置信度(「Conf.」in %)值。「Std」是標(biāo)準(zhǔn)偏差。黑體部分是最佳結(jié)果。