4结点和5结点模式
作者:互联网
基于4结点和5结点模式的邻接矩阵没有简单的矩阵计算方法,需要对所有子图进行计数,以确定特定模式的数量。
模式的尺寸变大时,会面临两个挑战。
1.计算成本急剧增加。
2.给定结点数量的子图会有太多同构类型。
比如,有13个不同的3结点子图,199个不同的4结点子图,9364个不同5结点子图。
并不是所有子图都可以看作是模式。
模式:在真实网络中比随机网络中更经常出现在统计上的子图。
在实践中,需要构造一些随机网络来从所有子图中识别模式。
因此随着同构子图数量的增加,计算代价会进一步增加。
已有文献提出了很多方法来评估不同大小的子图,但都是无向图。
本文不仅涉及有向图,还涉及更多类型的模式,而且还考虑了结点之间的成对关系。
在Kashtan2004A中采用了一种采样方法,该算法在估计不同n结点模式个数的比例方面表现出良好的性能。
给定大小为n的子图,该方法可以根据不同类型的n结点子图出现频率的概率分布,
对若干个n结点子图进行抽样。
详细的采样算法在[Kashtan2004]中给出。
用它来采样一组n结点的子图。
对于每一个模式,获得了所有模式实例的集合,定义为SMk。
算法1给出了构造n结点基于模式邻接矩阵的详细算法。
注意,在第4行,如果结点i和j是直接连接的,那么它们将被视为出现1次。
计算分析:
在计算Wmi公式中,如表1所示,计算的核心是(X⋅Y)ΘZ,因为矩阵是稀疏的,所以可以有效的计算。
计算成本与稀疏矩阵中的行和列数以及非零元素的数量成正比。
在计算4结点和5结点基于模式矩阵时,首先执行采样算法,其总计算复杂度为
其中n为模式的大小,N为样本个数。
算法1的主要代价是三个for循环,其复杂度为
因此整体复杂性是。
即。
因此计算4结点和5结点模式的计算成本在大规模社交网络中是可行的。
标签:结点,子图,模式,算法,计算,点子 来源: https://blog.csdn.net/qq_37715547/article/details/112562628