基于多尺度注意力和特征融合改进的开放词汇图像语义分割算法
成功的视觉语言模型如CLIP等通过与代价聚合技术相结合,在开放词汇语义分割上取得了较好的效果,然而在分割精度方面仍然面临挑战。针对视觉语言模型的采取Transformer主干网络,存在局部空间信息缺乏的问题,本文设计了通道多尺度注意力模块,利用不同大...
小型微型计算机系统
网络首发
立即查看 >
图书推荐
相关工具书