其他分享
首页 > 其他分享> > 读《Graph Matching and Learning in Pattern Recognition in the last ten years》

读《Graph Matching and Learning in Pattern Recognition in the last ten years》

作者:互联网

2014

1.引言

结构模式识别的理论基础是根据对象的组成部分(子模式)和它们之间的关系对对象进行分解。
————

《Thirty years of graph matching in Pattern Recognition》26

总结了70 年代初开始的几年到 2000 年代初对基于图在模式识别中的应用。
图嵌入和图核,发展基于向量的分类和学习技术(例如源自统计分类和学习理论的技术)
————
模式识别中的图

————
头等问题是:将图匹配问题转变到基于向量的方法,从而可以使用统计学方法
对此有两种思路:

从而有些权衡二者的方法,比如图编辑距离GED,但这其实也可以看做第一类方法,将图映射为矩阵后还是要考察子结构的上下文信息,而不是直接做先验向量范式

2.图匹配

精确图匹配是搜索两个图的节点之间的映射。它是边保留的,如果第一个图中的两个节点有一条边连接,那第二个图中的相应节点也必须有一条边。
µ : V1 → V2是边保留的,当且仅当∀v, w ∈ V1,(v, w) ∈ E1 ⇒ (µ(v), µ(w)) ∈ E2 ∨ µ(v) = µ(w)
这种边保留的映射也叫作同态homomorphism

单态monomorphism(也叫作边诱导子图同构edge-induced subgraph isomorphism)是单射μ:∀v ≠ w ∈ V1, µ(v) ≠ µ(w)

图同态是单态双射μ,其逆映射也单态

如果G2的节点诱导子图G2’和G1之间有同构μ,那么这个子图同构μ也叫作节点诱导子图同构

最大公共子图问题是搜索G1中与 G2 的子图同构的最大子图(通常是两个子图之间的对应映射)。
————
而非精准图匹配对边的约束被放宽,为了纠错或者降低成本,选择近似或次优策略
延拓μ的定义,考虑将节点映射为特殊空节点ε的可能性
这样有第一种架构:
在这里插入图片描述
其中CR是节点替换成本,CD是节点删除成本,C’R和C’D是对边的替换、删除成本。
这样匹配问题被转化为最小化成本C,这样精准匹配问题就可以看做一种特例,要求C最小化到0
第二种架构为有权图匹配,将图表示成邻接矩阵,元素为连续值表示两节点间关系
给定两图的邻接矩阵A,B,记Cijkl为两边之间的兼容性张量
在这里插入图片描述
记一个匹配矩阵M,如果一图的i节点匹配二图的k节点,则Mik=1,否则为0
这样匹配问题被转化为最大化W
在这里插入图片描述
通过调整兼容函数c可以调整精准匹配为特例

2.1 精确匹配

2003 De Santo et al. 138
对图同构和图子图同构的四种精确算法进行了广泛的比较评估

大多数现有的精确匹配算法都是基于某种形式的树搜索,其中匹配构建自一个空映射,一次添加一对节点,通常有回溯的可能性,并使用启发式算法来避免完整探索所有可能匹配的空间。

2007 年,Konc and Janeˇziˇc 87
提出了 MaxCliqueDyn,这是一种改进算法,用于寻找最大集团(以及最大公共子图),它使用分支和边界,结合近似图着色来寻找紧密边界以修剪搜索空间。



2.2 非精准匹配



尽管原则上GED与匹配无关,但实际上大多数方法通过为编辑操作(即没有添加或删除但可能更改)保留的节点找到匹配来计算距离;
给定这种匹配,编辑距离可以通过对匹配节点及其边的项剩余节点/边的项的求和得到获得
所以通常算法的结果不仅表明图之间距离,而且是应该最小化该距离值的匹配。
因此本节包含一些GED方法

2.2.1 基于树搜索的技术
2.2.2 连续优化
2.2.3 谱方法
2.2.4 其他方法

3.其它问题

Bunke et al. 12 in 2005
关于图内核和其他图相关技术的综述
Bunke and Riesen 14、15 in 2011、2012
综述评论图嵌入和图核

不过虽然图嵌入和图核能降低复杂度,但又引入其他计算成本导致最终成本反而可能更大

3.1 图嵌入



3.1.1 等距嵌入
3.1.2 谱嵌入
3.1.3 子模式嵌入
3.1.4 基于原型的嵌入

3.2 图核

3.3 图聚类

3.4 图学习

3.5 其余问题

4.总结

GED作为一种将许多统计模式识别方法应用于图的技术发挥了核心作用:例如NN、LVQ 和 Kmeans。
现在作为瓶颈出现的问题主要有两个:GED在计算上是指数量级,就算是求近似解成本仍然很高。经常有需要多次评估编辑距离的情形,这下问题更加严峻。可能GED还没有嵌入到适当的连续空间中:图是点,但点之间什么也没有。

近年来有无数研究图核的方法,将核方法应用到图领域充满希望,但仍缺乏足够的理论支撑(黑箱神经网络说啥了)

而嵌入方法则有如此质疑:已经用图结构化表示数据了,再转回向量还合适吗

标签:嵌入,last,图同构,ten,Graph,GED,匹配,方法,节点
来源: https://blog.csdn.net/weixin_40459958/article/details/119273785