近日,新葡的京集团官网2022级计算机科学与技术专业研究生祁宣豪以第一作者身份在国际权威学术会议ACM SIGMM International Conference on Multimedia Retrieval(中国计算机学会CCF推荐B类国际会议)发表研究论文“SFAM: Lightweight Spectrum Unreferenced Attention Network。
ICMR是美国计算机协会(ACM)旗下的系列会议,是多媒体检索领域的顶级国际会议。该会议于2011年由历史悠久的国际图像和视频检索会议(CIVR)与国际多媒体信息检索会议(MIR)合并而成。ICMR目前是中国计算机学会(CCF)推荐的“计算机图形学与多媒体”领域B类排名首位的会议。
该论文针对Transformer网络模型体积巨大且无法有效捕获图像局部特征的问题,提出一种轻量级的频谱特征提纯模块(spectral feature refinement module, SFRM)和无参注意力增强模块(parameter less attention augmentation module, PAAM)相结合的复合Transformer结构。SFRM利用二维离散余弦变换将图像从空间域转换到频域,在高频区域和低频区域分别提取图像整体结构和细节特征信息,实现对原始图像中空间域不明显的图像特征进行提纯;PAAM引入无参的通道、空间和3D注意力增强机制,在不增加参数量的情况下,提取出空间域中局部信息的关联特征,以提高图像的局部特征的表达能力;同时,引入深度可分离(DConv MLP)进一步轻量化网络模型。