欢迎来到 宁波市某某化工涂料销售部
全国咨询热线:020-123456789
联系我们

地址:联系地址联系地址联系地址

电话:020-123456789

传真:020-123456789

邮箱:admin@aa.com

新闻中心
CAP:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021
  来源:宁波市某某化工涂料销售部  更新时间:2024-04-30 22:25:47

CAP:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

论文提出细粒度分类解决方案CAP,多的细通过上下文感知的重注注意力机制来帮助模型发现细微的特征变化。除了像素级别的意力有趣注意力机制 ,还有区域级别的机制注意力机制以及局部特征编码方法,与以往的粒度视觉方案很不同 ,值得一看

来源:晓飞的分类方案算法工程笔记 公众号

论文: Context-aware Attentional Pooling (CAP) for Fine-grained Visual Classification

CAP
:多重注意力机制,有趣的多的细细粒度分类方案 | AAAI 2021
  • 论文地址 :https://arxiv.org/abs/2101.06635
  • 论文代码 :https://github.com/ArdhenduBehera/cap

Introduction


  论文认为大多数优秀的细粒度图像识别方法通过发掘目标的局部特征来辅助识别 ,却没有对局部信息进行标注 ,重注而是意力有趣采取弱监督或无监督的方式来定位局部特征位置。而且大部分的机制方法采用预训练的检测器 ,无法很好地捕捉目标与局部特征的粒度关系。为了能够更好地描述图片内容  ,分类方案需要更细致地考虑从像素到目标到场景的多的细信息 ,不仅要定位局部特征/目标的重注位置 ,还要从多个维度描述其丰富且互补的意力有趣特征,从而得出完整图片/目标的内容 。
  论文从卷积网络的角度考虑如何描述目标  ,提出了context-aware attentional pooling(CAP)模块,能够高效地编码局部特征的位置信息和外观信息。该模块将卷积网络输出的特征作为输入 ,学习调整特征中不同区域的重要性 ,从而得出局部区域的丰富的外观特征及其空间特征 ,进而进行准确的分类  。
  论文的主要贡献如下:

  • 提出在细粒度图像识别领域的扩展模块CAP,能够简单地应用到各种卷积网络中,带来可观的细粒度分类性能提升。
  • 为了捕捉目标/场景间的细微差别 ,提出由区域特征引导的上下文相关的attention特征 。
  • 提出可学习的池化操作 ,用于自动选择循环网络的隐藏状态构成空间和外观特征。
  • 将提出的算法在8个细粒度数据集上进行测试,获得SOTA结果 。
  • 分析不同的基础网络 ,扩大CAP模块的应用范围。

Proposed Approach


CAP:多重注意力机制�,有趣的细粒度分类方案 | AAAI 2021

  论文算法的整体流程如上图所示 ,输入图片 ,输出具体从属类别 ,包含3个组件(3组参数) :

  • 基础CNN网络
  • CAP模块
  • 分类模块

Context-aware attentional pooling (CAP)

CAP:多重注意力机制
,有趣的细粒度分类方案 | AAAI 2021

  定义卷积网络输出的特征为 ,CAP的模块综合考虑像素级特征 、小区域特征、大区域特征以及图片级特征的上下文信息进行分类。

  • pixel-level contextual information
CAP
�:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  像素级特征的上下文信息主要学习像素间的关联度,在计算位置的输出时根据关联度综合所有其他像素特征,直接使用self-attention实现,特征转化使用卷积 。这一步直接对主干网络输出的特征进行操作,但没在整体流程图中体现。

  • Proposing integral regions

  为了更高效地学习上下文信息,论文在特征图上定义不同粒度级别的基本区域 ,粒度级别由区域的大小决定 。假设位置上的最小的区域为为例,可通过放大宽高衍生出一系列区域, ,  。在不同的位置产生相似的区域合集,得到最终的区域合集 。覆盖了所有的位置的不同宽高比区域,可以提供全面的上下文信息 ,帮助在图片的不同层级提供细微特征。

  • Bilinear pooling

  按照上一步,在特征图上得到个区域,大小从最小的到最大的,论文的目标是将不同大小的区域表示为固定大小的特征,主要采用了双线性插值 。定义为坐标转换函数 ,为区域坐标,对应的特征值为,则转换后的图片的坐标上的值为:

CAP:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  为采样函数,为核函数,这里采用的是最原始的方法 ,将目标坐标映射回原图,取最近的四个点,按距离进行输出 ,最终得到池化后的固定特征。

  • Context-aware attention
CAP:多重注意力机制
,有趣的细粒度分类方案 | AAAI 2021

  这里 ,论文使用全新的注意力机制来获取上下文信息 ,根据与其他特征的相似性进行加权输出,使得模型能够选择性地关注更相关的区域 ,从而产生更全面的上下文信息 。以查询项和一组关键词项 ,输出上下文向量 :

CAP:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  参数矩阵和用来将输入特征转换为查询项核关键项,为非线性组合 ,和为偏置项 ,整体的可学习参数为,而注意力项则代表两个特征之间的相似性。这样,上下文向量能够代表区域蕴含的上下文信息,这些信息是根据其与其他区域的相关程度获得的,整体的计算思想跟self-attention基本相似 。

  • Spatial structure encoding
CAP
	:多重注意力机制	,有趣的细粒度分类方案 | AAAI 2021

  上下文向量描述了区域的关键程度和特点  ,为了进一步加入空间排列相关的结构信息,论文将区域的上下文向量转为区域序列(论文按上到下、左到右的顺序) ,输入到循环神经网络中,使用循环神经网络的隐藏单元来表达结构特征  。
  区域的中间特征可表示为 ,采用LSTM,包含LSTM的相关参数 。为了增加泛化能力和减少计算量,上下文特征由进行全局平均池化得到,最终输出上下文特征序列对应的隐藏状态序列,后续用于分类模块中。

Classification

CAP:多重注意力机制�,有趣的细粒度分类方案 | AAAI 2021

  为了进一步引导模型分辨细微的变化 ,论文提出可学习的池化操作,能够通过组合响应相似的隐藏层来整合特征信息 。论文借鉴NetVLAD的思想 ,用可导的聚类方法来对隐藏层的响应值进行转换,首先计算隐藏层响应对类簇的相关性 ,再加权到类簇的VLAD encoding中:

CAP	:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  每个类簇都有其可学习的参数和 ,整体思想基于softmax  ,将隐藏层的响应值按softmax的权重分配到不同的类簇中 。在得到所有类簇的encoding向量后,使用可学习的权值和softmax进行归一化 。因此 ,分类模块的可学习参数为 。

Experiments and Discussion


CAP
:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  在不同的数据集上,对不同方法进行对比。

CAP
:多重注意力机制,有趣的细粒度分类方案 | AAAI 2021

  不同主干网络下的准确率对比。

CAP:多重注意力机制�,有趣的细粒度分类方案 | AAAI 2021

  不同模块输出特征的可视化,图b是加入CAP后,主干网络输出的特征。

Conclusion


  论文提出细粒度分类解决方案CAP ,通过上下文感知的注意力机制来帮助模型发现目标的细微特征变化 。除了像素级别的注意力机制,还有区域级别的注意力机制以及局部特征编码方法 ,与以往的视觉方案很不同  ,值得一看。



如果本文对你有帮助,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

work-life balance.


友情链接侠客风云传全剧情全结局全任务流程攻略(人物创建+全支线人物流程+全宝箱收集+全女主攻略+全心法收集+DLC天王归来+碧血丹心DLC全攻略) (289)贪婪洞窟地狱攻略大全(贪婪洞窟BOSS阿撒托斯通关方法)刀剑封魔录全攻略 玩家需要了解什么《新倚天屠龙记》「玩家攻略」微氪也能横着走华山一日游最强攻略(徒步登山版)新三国志英杰传刘备传1ⵅ关超详尽攻略[精品]历史上真实的令妃魏佳氏,故事比《还珠格格》《延禧攻略》还传奇刀剑封魔录宝石合成全攻略最强蜗牛国家特性是什么【2022所有伙伴获取攻略(8月最新))】DOTA2新手成神之路 极寒幽魂打法攻略上古传说缉封魔录外传.(宝石合成攻略)【经验交流】石器时代石器EE深入探讨系列——刷楼攻略去年元夜时花市灯如昼是哪个节日《刺客信条:大革命》全流程百分百关卡同步率流程图文攻略+神器收集+巴黎故事+系统详细教程+技能详解+支线任务 【游侠攻略组】 序列四,记忆一,乞丐之王【怪物猎人:崛起】攻略汇总大合集新剑侠情缘手游山河战境攻略(新剑侠情缘手游山河战境攻略视频)2017 东京攻略 目的地收割实施完成, 完成度75%梦幻新诛仙青云职业怎么玩,0氪平民新人攻略,选职业必看官居几品攻略成就一览(官居几品纳妾升官条件大全)subverse最后的碎片任务介绍三国志战略版:「强化归来!易伤助妖仙乱世再起」于吉专题攻略最强蜗牛不思议海域海盗乐园攻略大全《我的世界》Minecraft【穿越时空】地图攻略(风之国度篇)官居几品详细永安侯攻略刀剑封魔录连招编辑大型DOTA2攻略之流浪剑客斯温刺客信条大革命图文攻略 全主线流程+全收集攻略(10)侠客风云传前传夜叉和史燕头像心得感受《Subverse》角色故事介绍 Fortune能在之后加入吗口袋妖怪心金魂银全树果地点效果及获得方法仙剑奇侠传3完美图文攻略三国志10加强版如何一夫多妻?我打上了那个“一夫多妻”的补丁,可是什么用处都没有啊!后来我干脆用修改的,更是一塌糊涂!谢谢大家啦!全部圣三国蜀汉传完整攻略刀剑封魔录人物特点?(刀剑封魔录人物特点大全)2048怎么玩及攻略【纯干货】最强蜗牛攻略小技巧及试玩体验刀剑封魔录秘籍是什么-攻略秘籍大全仙剑奇侠传手游攻略大全CLANNAD 攻略梦幻新诛仙:14张探灵地图超详细攻略汇总以及通关技巧分享
联系我们

地址:联系地址联系地址联系地址

电话:020-123456789

传真:020-123456789

邮箱:admin@aa.com

0.2706

Copyright © 2024 Powered by 宁波市某某化工涂料销售部   sitemap