读《Graph Matching and Learning in Pattern Recognition in the last ten years》
作者:互联网
2014
1.引言
结构模式识别的理论基础是根据对象的组成部分(子模式)和它们之间的关系对对象进行分解。
————
《Thirty years of graph matching in Pattern Recognition》26
总结了70 年代初开始的几年到 2000 年代初对基于图在模式识别中的应用。
图嵌入和图核,发展基于向量的分类和学习技术(例如源自统计分类和学习理论的技术)
————
模式识别中的图
- 图匹配
精准匹配
非精准匹配 - 图嵌入
等距嵌入
谱嵌入
基于原型的嵌入 - 图核
- 图聚类
图的聚类
基于图的聚类 - 图学习
图的学习
基于图的学习 - 其他
————
头等问题是:将图匹配问题转变到基于向量的方法,从而可以使用统计学方法
对此有两种思路:
- 完全利用原图本身,算法会很繁重,但图中所有信息都能利用上
- 通过特征提取等方法把图降维成向量,这个过程可能损失不少,但有不错的实验支撑
从而有些权衡二者的方法,比如图编辑距离GED,但这其实也可以看做第一类方法,将图映射为矩阵后还是要考察子结构的上下文信息,而不是直接做先验向量范式
2.图匹配
精确图匹配是搜索两个图的节点之间的映射。它是边保留的,如果第一个图中的两个节点有一条边连接,那第二个图中的相应节点也必须有一条边。
µ : V1 → V2是边保留的,当且仅当∀v, w ∈ V1,(v, w) ∈ E1 ⇒ (µ(v), µ(w)) ∈ E2 ∨ µ(v) = µ(w)
这种边保留的映射也叫作同态homomorphism
单态monomorphism(也叫作边诱导子图同构edge-induced subgraph isomorphism)是单射μ:∀v ≠ w ∈ V1, µ(v) ≠ µ(w)
图同态是单态双射μ,其逆映射也单态
如果G2的节点诱导子图G2’和G1之间有同构μ,那么这个子图同构μ也叫作节点诱导子图同构
最大公共子图问题是搜索G1中与 G2 的子图同构的最大子图(通常是两个子图之间的对应映射)。
————
而非精准图匹配对边的约束被放宽,为了纠错或者降低成本,选择近似或次优策略
延拓μ的定义,考虑将节点映射为特殊空节点ε的可能性
这样有第一种架构:
其中CR是节点替换成本,CD是节点删除成本,C’R和C’D是对边的替换、删除成本。
这样匹配问题被转化为最小化成本C,这样精准匹配问题就可以看做一种特例,要求C最小化到0
第二种架构为有权图匹配,将图表示成邻接矩阵,元素为连续值表示两节点间关系
给定两图的邻接矩阵A,B,记Cijkl为两边之间的兼容性张量
记一个匹配矩阵M,如果一图的i节点匹配二图的k节点,则Mik=1,否则为0
这样匹配问题被转化为最大化W
通过调整兼容函数c可以调整精准匹配为特例
2.1 精确匹配
2003 De Santo et al. 138
对图同构和图子图同构的四种精确算法进行了广泛的比较评估
大多数现有的精确匹配算法都是基于某种形式的树搜索,其中匹配构建自一个空映射,一次添加一对节点,通常有回溯的可能性,并使用启发式算法来避免完整探索所有可能匹配的空间。
2007 年,Konc and Janeˇziˇc 87
提出了 MaxCliqueDyn,这是一种改进算法,用于寻找最大集团(以及最大公共子图),它使用分支和边界,结合近似图着色来寻找紧密边界以修剪搜索空间。
。
。
。
2.2 非精准匹配
。
。
。
尽管原则上GED与匹配无关,但实际上大多数方法通过为编辑操作(即没有添加或删除但可能更改)保留的节点找到匹配来计算距离;
给定这种匹配,编辑距离可以通过对匹配节点及其边的项与剩余节点/边的项的求和得到获得
所以通常算法的结果不仅表明图之间距离,而且是应该最小化该距离值的匹配。
因此本节包含一些GED方法
2.2.1 基于树搜索的技术
2.2.2 连续优化
2.2.3 谱方法
2.2.4 其他方法
3.其它问题
Bunke et al. 12 in 2005
关于图内核和其他图相关技术的综述
Bunke and Riesen 14、15 in 2011、2012
综述评论图嵌入和图核
不过虽然图嵌入和图核能降低复杂度,但又引入其他计算成本导致最终成本反而可能更大
3.1 图嵌入
。
。
。
3.1.1 等距嵌入
3.1.2 谱嵌入
3.1.3 子模式嵌入
3.1.4 基于原型的嵌入
3.2 图核
3.3 图聚类
3.4 图学习
3.5 其余问题
4.总结
GED作为一种将许多统计模式识别方法应用于图的技术发挥了核心作用:例如NN、LVQ 和 Kmeans。
现在作为瓶颈出现的问题主要有两个:GED在计算上是指数量级,就算是求近似解成本仍然很高。经常有需要多次评估编辑距离的情形,这下问题更加严峻。可能GED还没有嵌入到适当的连续空间中:图是点,但点之间什么也没有。
近年来有无数研究图核的方法,将核方法应用到图领域充满希望,但仍缺乏足够的理论支撑(黑箱神经网络说啥了)
而嵌入方法则有如此质疑:已经用图结构化表示数据了,再转回向量还合适吗
标签:嵌入,last,图同构,ten,Graph,GED,匹配,方法,节点 来源: https://blog.csdn.net/weixin_40459958/article/details/119273785