2026.1.20
本文提出一种用于MRI重建的傅里叶卷积块(FCB),通过将空间域卷积转换为频域操作,实现了全局感受野和低计算复杂度,并在多种CNN架构上展现出优于现有SOTA方法和Vision Transformer的重建性能,有效抑制了伪影并恢复了图像细节。
Title题目
01
Fourier Convolution Block with global receptive field for MRI reconstruction
具有全局感受野的傅里叶卷积块用于MRI重建
文献速递介绍
02
磁共振成像(MRI)因扫描时间长和可能产生运动伪影而限制了其临床应用。通过在傅里叶采集空间(k空间)采集欠采样数据是一种缩短MRI扫描时间的常用方法,但欠采样会导致图像中出现不可避免的混叠伪影。传统的压缩感知(CS)技术利用稀疏先验信息解决混叠问题,但其性能在高欠采样率下较差。近年来,基于深度学习(DL)的模型在MRI重建中表现出卓越性能,超越了传统CS算法。DL模型主要分为端到端模型和解卷迭代算法模型。MRI图像重建中的欠采样伪影通常呈长距离分布,需要具有大感受野(RF)的模型。然而,大多数DL模型基于CNN,其RF有限,即使理论上通过堆叠多层可以扩大RF,但实际的有效感受野(ERF)远低于预期。Vision Transformer(ViT)和大型核CNN通过捕获全局信息展现出优越性能,但也面临计算成本高和训练困难的挑战。本研究提出傅里叶卷积块(FCB),一个可即插即用的全局算子,通过将空间域卷积转换为频域,实现匹配图像尺寸的全局RF,且计算需求低于大型核卷积。为减少参数,FCB采用了深度可分离卷积,并提出了一种新的重参数化策略以有效融合局部和全局信息。
Aastract摘要
02
从欠采样磁共振成像(MRI)信号中重建图像可以显著缩短扫描时间并改善临床实践。然而,基于卷积神经网络(CNN)的方法在MRI重建中表现出色,但其有限的感受野(RF)可能限制其捕获全局特征的能力,这对于全局分布的混叠伪影去除至关重要。Vision Transformer的最新进展进一步强调了大感受野的重要性。本研究提出了一种新颖的全局傅里叶卷积块(FCB),通过将常规空间域卷积转换为频域操作,实现了与整幅图像匹配的全局感受野和低计算复杂度。有效感受野和训练核的可视化结果表明,FCB在实践中确实提高了重建模型的感受野。所提出的FCB在四种流行的CNN架构上,使用脑部和膝关节MRI数据集进行了评估。带有FCB的模型比基线模型获得了更优的PSNR和SSIM,并展现出更丰富的细节和纹理恢复。
Method方法
03
傅里叶卷积通过频域内的逐元素乘法实现,利用离散傅里叶变换(DFT)和逆离散傅里叶变换(IDFT)可以在频域操作。FCB将输入图像通过快速傅里叶变换(FFT)转换到频域,与学习到的核进行逐元素乘法,然后通过逆FFT转换回空间域。FCB的优点在于其能够严格对应任意尺寸(1x1到NxN)的空间卷积,因此可以覆盖局部和全局感受野,并通过反向传播自适应学习有效的感受野。理论分析表明,FCB在扩大感受野时具有比传统大核卷积更低的计算复杂度。为解决FCB参数量大的问题,本文将其集成到深度可分离卷积中,其中FCB替换了深度卷积部分。此外,为了有效训练具有大感受野的网络,提出了一种重参数化训练策略:首先使用传统3x3卷积核训练网络以捕获局部模式,然后将深度卷积(DW)层中的3x3卷积核重参数化为傅里叶卷积,最后微调网络以扩展到全局感受野。此重参数化过程本质上是卷积核的零填充DFT。
Discussion讨论
04
本文提出的傅里叶卷积块(FCB)通过在频域执行卷积操作,成功为MRI重建CNN提供了全局感受野。这种方法显著改善了基线CNN模型的重建性能,尤其是在不同欠采样率、各种数据集以及存在额外噪声的情况下。与Vision Transformer等主流模型相比,FCB增强的模型在定量指标上表现更优,并且在恢复精细细节(如纹理和边缘)方面展现出卓越能力。FCB的计算复杂度较低,其运行时间显著少于Vision Transformer,且与使用11x11卷积核的传统CNN相当。通过可视化分析,FCB确实有效扩大了CNN的感受野。与侧重于CNN架构设计的其他方法不同,FCB专注于基础卷积层,可以作为即插即用的模块集成到各种CNN架构中,以捕获长距离关联。此外,FCB在隐藏层处理实值数据,并利用频域的共轭对称性来节省内存和时间,使其也能平滑地集成到处理复值数据的CNN模型中。尽管FCB具有诸多优势,但也存在局限性。虽然其内存使用与空间卷积相当,但FCB的参数量仍然显著更高,导致存储内存成本增加,这是在追求大感受野时内存与速度之间的权衡。此外,FCB涉及重复的FFT和IFFT操作,可能影响计算效率。未来研究可探索如何进一步提高FCB的计算效率,例如设计纯粹基于谱的CNN来解决频域激活函数的问题。
Conclusion结论
05
本文介绍了一种新颖的具有全局感受野的卷积块设计,用于MRI重建CNN。实验结果表明,所提出的FCB有效提高了基线CNN模型的重建性能。在不同欠采样率下,FCB增强的模型在各种数据集上即使添加额外噪声也获得了更好的定量指标,并表现出更强的恢复复杂细节(包括纹理和边缘)的能力。值得注意的是,FCB模型优于被认为是具有大感受野的主流模型Vision Transformers。此外,FCB模型还超越了嵌入k空间数据以增强长距离连接的方法。FCB还展现了低计算复杂度,实验表明其运行时间显著少于Vision Transformers,并与使用11x11卷积核的传统CNN相当。通过可视化,证明了FCB有效扩大了CNN的感受野。与专注于CNN架构设计的其他方法不同,我们的方法关注CNN中的基本卷积层。FCB作为一个即插即用的模块,有潜力集成到各种CNN架构中。尽管FCB的内存使用与空间卷积相当,但其参数量仍然显著更高。未来的研究可以探索如何提高FCB的计算效率。
Results结果
06
研究使用FastMRI数据集的脑部和膝关节数据进行实验,包括T1、T2、T2 FLAIR和PD加权图像,并在8倍和12倍欠采样率下进行评估。对比了包含FCB的UNet、E2EVar、MoDL、VSNet以及其基线模型,并与ViT模型(ViT, ReconFormer, SwinMR)、k空间数据模型(Ksp, MDRecon)以及FasterFC-UNet进行了比较。结果表明,在所有四种架构、不同欠采样率、采样模式(泊松、笛卡尔、径向)和噪声水平下,FCB显著提高了PSNR和SSIM指标。F-E2EVar表现出最高的性能提升。定性结果显示,带有FCB的模型能更有效地抑制混叠伪影,恢复更精细的细节和纹理,尤其是在脑部和膝关节图像中,伪影明显减少,细节更清晰。F-MoDL在与ViT和k空间模型的比较中,PSNR和SSIM均显著优于其他方法,且参数量和运行时效率优于大多数ViT模型。FCB在模型不同层中的应用分析表明,即使只在最后一层使用FCB也能显著提高重建性能。与传统大核UNet相比,F-UNet在保持低运行时间(与11x11核UNet相当)的同时,实现了最佳的重建性能。消融实验证实了循环填充、深度可分离卷积、跳跃连接、FCB和重参数化训练策略对性能的积极贡献。卷积核频谱可视化显示,FCB显著增大了卷积核的有效感受野,且其ERF更接近k空间采样的点扩散函数,有助于网络利用混叠信号。
Figure图
07
图1.所提出的傅里叶卷积块(FCB)的示意图。(a) 三个传统卷积层,核大小分别为3 × 3、11 × 11和21 × 21。(b) 对应于顶部所示不同核大小的传统卷积层的等效FCB,大小为N×N。
图2.基线模型和建议的卷积块架构(仅显示MoDL和VSNet的一次迭代)。缩写:DW = 深度卷积,PW = 逐点卷积。卷积块与模型视图颜色一致,DW层以红色突出显示。这表明这里的卷积操作可以被FCB替换。
图3.脑部数据集中T2加权数据的重建示例。顶部显示8倍加速下的结果,底部显示12倍加速下的结果。单张重建图像的PSNR和SSIM标记在右上角。第二行和第五行描绘了真实图像中标记区域的放大重建结果。第三行和第六行显示了此放大区域的残余误差,所有误差均乘以10以便更好地可视化。
图4.脑部数据集中T1加权数据的重建示例。
图5.膝关节数据集的重建示例。顶部显示8倍加速下的结果,底部显示12倍加速下的结果。
图6.F-MoDL和其他方法重建的脑部T1加权数据示例。
图7.当FCB应用于模型不同层时,膝关节验证数据集在8倍加速下的PSNR结果。(a) UNet的结果。(b) MoDL的结果。(c) VSNet的结果。
图8.UNet和F-UNet中卷积核的谱可视化(FCB部署在最后6层)。(a) UNet的谱图。(b) F-UNet的谱图。卷积核或FCB中核的谱振幅沿UNet深度从左到右显示。上排和下排对应于每个UNet块中的双卷积层。每个图的右下角标注了核谱的秩。
图9UNet的有效感受野(ERF)。(b) F-UNet的ERF。(c) 2D泊松采样模式的点扩散函数(PSF)。F-UNet的ERF覆盖了更大的区域,接近采样PSF。