⬆︎
×
TOC
Hyplus目录

显著目标检测(2):DAGCN: Dynamic and Adaptive Graph Convolutional Network for Salient Object Detection

动态自适应GCN (DAGCN: SRKNN → AnwGCN)

Li, F. Liu, Z. Tian, S. Du, and Y. Wu, “DAGCN: Dynamic and Adaptive Graph Convolutional Network for Salient Object Detection,” IEEE Trans. Neural Netw. Learning Syst., vol. 35, no. 6, pp. 7612–7626, Jun. 2024, doi: 10.1109/TNNLS.2022.3219245.

该文章提出了一种名为DAGCN的新型显著目标检测 (SOD) 方法,该方法由自适应邻域图卷积网络 (Adaptive neighborhood-wise Graph Convolutional Network,AnwGCN) 和空间限制的 K 近邻 (Spatially Restricted K-nearest Neighbor,SRKNN) 两部分组成。AnwGCN 用于建模和分析显著度上下文,而 SRKNN 通过测量有限范围内的非欧几里得空间距离来构建显著度上下文的拓扑关系。DAGCN 通过测量非欧几里得空间中特征的距离来构建上下文关系,并通过 AnwGCN 对上下文信息进行建模。该模型能够学习特征的度量并适应数据的隐空间分布,从而更准确地描述特征关系。通过适应邻域的卷积核,模型获得了结构学习能力,因此图卷积过程可以适应不同的图数据。实验结果表明,该解决方案在六个广泛使用的数据集上取得了令人满意的效果,并且可以有效地检测伪装物体。

DAGCN (Dynamic and Adaptive Graph Convolutional Network) 是一种用于显著目标检测 (SOD) 的深度学习模型,它通过构建动态自适应的图结构来有效地建模场景中的上下文关系,从而更准确地识别显著目标。

DAGCN 主要包含以下几个关键组件:

  1. 基础特征表示:
    使用 VGG16 作为骨干网络,通过特征金字塔网络 (Feature PyramidNetwork,FPN) 提取多尺度特征。
    FPN 的输出特征图包含了丰富的边缘信息和位置信息,并通过快捷连接保留底层特征,从而增强模型的细节感知能力。
  2. 图结构构建 (SRKNN):
    使用改进的 KNN (K-Nearest Neighbor)算法 SRKNN 来构建初始图结构。
    SRKNN 在特征空间中计算像素之间的距离,并将其映射到双曲空间中,从而更好地描述特征之间的关系。
    通过空间限制,SRKNN 平衡了全局特征相关性和局部空间相关性,并减少了模型计算量。
  3. 动态自适应图卷积 (AnwGCN):
    AnwGCN 是一种新型的自适应邻域图卷积模块,用于处理图结构并进行特征聚合。
    AnwGCN 通过信息流控制方法来控制相邻节点之间信息聚合的强度,从而适应不同图像中显著特征的实例选择性和依赖选择性。
    通过邻域图卷积核,AnwGCN 可以实现邻域特征的比较和增强,并通过耦合超边和邻域聚合权重来实现结构学习。
    模型通过重构拓扑结构将结构信息编码到节点特征中,并将其传递到下一层图卷积,从而动态地调整图结构并优化特征表达。
  4. 其他组件:
    边缘信息互补模块:通过独立解码器融合信息,增强模型对显著物体边缘的检测能力。
    读取模块:将图节点特征转换为显著性图和边缘图,并通过解码器进行输出。
  5. 损失函数:
    采用端到端训练方式,并使用加权多任务监督策略。
    损失函数包含显著物体损失和显著边缘损失,通过最小化多任务损失函数来学习网络参数。

DAGCN 的优势:

  • 动态适应性: DAGCN 可以根据训练数据动态调整图结构,从而更好地适应不同的场景和任务。
  • 结构学习: DAGCN 通过耦合超边和邻域聚合权重来实现结构学习,从而更有效地描述特征之间的关系。
  • 灵活的特征聚合: AnwGCN 可以控制信息流,并根据相互信息 I(xi; Y) 调整不同组件的信息流开放程度,从而更好地保留高频信息和低频信息。

实验结果(Table2):

  • 在六个常用的 SOD 数据集上,DAGCN 实现了比现有方法更好的性能。
  • DAGCN 也成功地应用于更具有挑战性的伪装物体检测 (COD) 任务,并取得了较好的效果。

Fig6: 可以看到,在这四个数据集上,我们的算法(红线)在比较的方法中达到了最好的性能。

各种因素的影响(俩表;node number):表1中反映了消融实验结果对邻近节点数量的影响。可以看出,太少的邻居节点会导致大量的上下文信息丢失,过多的节点会引入过多的噪声,从而导致性能下降

总结:DAGCN 是一种有效的 SOD 模型,它通过构建动态自适应的图结构来有效地建模场景中的上下文关系,从而更准确地识别显著目标。DAGCN 具有动态适应性、结构学习和灵活的特征聚合等优势,在 SOD 任务中展现出优异的性能。

发表评论