关键词提取-论文研读-betweenness centrality相关算法(2)
作者:互联网
项目实训记录系列博客
一马当先,争做国家栋梁。
博客说明
本博客初衷是用于学校项目实训知识梳理、工作内容、收获感悟的记录。
若能在您的学习之路上有所帮助,不胜荣幸。但若需转载,也请注明出处。
博客包含以下内容(也是开篇提到的),但不意味着每一篇都会囊括所有;同时,也并非意味着博客的目录结构就是如此。每篇博客内容请看后文中具体的目录。
知识梳理:为了完成目标算法,将会广泛地查阅有关文献资料。将所学知识、资料进行整理。会加入个人理解,一起进行分享。
工作内容:作为项目参与者,在整个项目中所担任的角色、完成的任务。包括个人任务,团队沟通与合作。
收获感悟:您可以简单理解为鸡汤。不过,不同于空洞的话语,在这里所记录的感悟和总结都是结合自身实际、结合项目实际的,相信您能看到博主是怎样的人,也愿您能从中获得启发和前进的动力。
项目实训系列博客目录
1-关键词提取-任务理解&工作分配
2-关键词提取-代码运行云平台colab的使用
3-关键词提取-论文研读-RaKUn算法(1)
4-关键词提取-论文研读-RaKUn算法(2)
5-关键词提取-论文研读-betweenness centrality相关算法(1)
5-关键词提取-论文研读-betweenness centrality相关算法(2)
本博客目录
补充研究
多重边和边的权重问题,是本文一开始提到的”伏笔“。本质上是对于不同种类的图的研究,包括有边长的图、有权重的图和多边图三种。个人感觉泛用性会很好,所以在这里多研究了一下论文的这一部分变种算法。
这里“有边长(edge length)的图”就是我们常说的加权图,边的长度不再是1,边加权;“有权重(weight)的图”并非是通常意义的边长权重,而是运算的时候需要考虑到权重问题,也就是在网络中的重要性,在这里用路径的值(path’s edge values)相乘的方式表达。多边图(multigraph)就是允许自环和两点之间有多条边,这跟传统的定义说法一致。
edge lengths
值(value), 也就是边长(path length), 这个变种算法很像是单源最短路的算法,在基础算法上多考虑的是边的长度不再是1,而是有很多赋值的情况,还是很好理解的。
edge weights/multiplicities
首先看权重的问题,算法中作为因子跟σ[v]直接相乘,这一点也很好理解。关键是为何多边图也可以跟权重问题放在一起呢?在反复阅读论文中的定义描述之后我终于弄清楚了。
假设现在有一个简单图(simple graph),也就是之前一直在用的图模型。对于任意e=(a,b)∈E,选择从a到b的这条边,将其三倍化,得到三条跟原来一样的边。现在问题情况并不是简单的三边加和,因为三条等长的边都是从a到b的可行路径,并且如果ab的前后还有路径连接其他的顶点,最终所有包含a到b的路径都会三倍化。对于a,若原本是σ[a],三倍化之后,用数学运算来表达就是3σ[a].类比于权重的公式就令人恍然大悟了:这里边的倍数,正是此处边的权重。数学公式上可以合并,但是实际意义可以这样理解吗?也可以。若将多边图上每条边的倍数看做是这条边的权重,就可以将多边图转化为一个简单有权重图。
标签:研读,权重,关键词,betweenness,博客,centrality,算法,edge,实训 来源: https://blog.csdn.net/weixin_45883730/article/details/118600798