关键区域鉴别联合多粒度知识蒸馏的细粒度图像分类
近年来,随着深度学习技术的飞速发展,研究人员开始尝试将Vision Transformer(ViT)应用于细粒度图像分类.然而,尽管ViT的多头自注意力机制赋予了模型强大的全局信息捕捉能力,但在关注局部微小且判别力强的区域上仍显不足,这在一定程度上限...
小型微型计算机系统
2025年08期
立即查看 >
图书推荐
相关工具书