其他分享
首页 > 其他分享> > 图神经网络task7

图神经网络task7

作者:互联网

超大规模数据集类的创建

图神经网络的新基准Benchmarking Graph Neural Networks

与图形无关的NN(MLP)在小型数据集上的表现与GNN相同
对于较大的数据集,GNN改进了与图无关的NN
最简单形式的GNN表现较差
各向同性GNN架构在原始GCN上有所改进。GraphSage证明了在图卷积层中使用中心节点信息的重要性。GIN采用了中心节点特征以及一个新的分类器层,该分类器层在所有中间层均与卷积特征相连。DiffPool考虑了一种可学习的图形池化操作,其中在每个分辨率级别使用GraphSage。除CLUSTER外,这三个各向同性的GNN可以显着提高所有数据集的GCN性能。
各向异性的GNN是有效的。除了PATTERN以外,各向异性模型,例如GAT,MoNet和GatedGCN均能获得最佳结果。另外,注意到,GatedGCN在所有数据集上的性能始终都很好。注:各向同性的GNN大多依赖于相邻特征的简单总和,各向异性的GNN采用复杂的机制(GAT的稀疏关注机制,GatedGCN的边缘门)。
残差连接能够提升模型的性能
正则化能够提升模型的性能

OGB

OGB 能支持 PyG 和 DGL 等主流图神经网络框架,也能支持新颖的数据集切分。其中在图神经网络中,数据集的切分特别重要,它和一般的机器学习任务有很大的不同。

节点预测

odbn-proteins:蛋白质数据集,有着蛋白质之间的关联网络,而且包括了多种生物;

odbn-wiki:维基百科数据形成的网络;

ogbn-products:亚马逊客户同时购买的商品的网络。

ogbi-ddi:药物相互作用网络;

ogbi-biomed:人类生物医药知识图谱;

ogbi-ppa:蛋白质之间的关系网络;

ogbi-reviews:亚马逊的用户-商品评论数据集;

ogbi-citations:微软学术的引用关系网络图谱。

图预测

OGB 同时也提供了对图进行预测的任务数据集,分别有:

ogbg-mol:对分子进行预测,来自 MoleculeNet;

ogbg-code:代码段的语法树结构网络;

ogbg-ppi:蛋白质之间的交互网络;

分割图数据是个问题?

自然科学研究者,他们每次收集的数据肯定不是重复的,他们每次都需要做一系列新实验,因此模型每次都在做分布外的预测。这就要求数据的分割方式需要非常合理,需要模型的泛化能力足够强大以处理这些分布外的数据预测。
OGB 采用的数据分割方法也非常有意思。例如对于分子图数据集,分割方法可以是分子支架(scaffold),具体而言,我们可以通过分子的子结构做聚类,然后将常用的集群作为训练集,将其它非常见集群作为验证与测试集。这种处理方式会迫使神经网络获得更高的泛化性,不然它完全无法预测那些子结构不同的分子。
按物种分割或按代码库分割也是相同的道理,本质上这些数据分割都尝试把某一小部分整体移出来做测试。

交通流预测

交通流预测主要包含两个方面,一个是空间(spatial),另一个是时间(temporal)。
Spatial的手段主要包括基于road network的图卷积(GCN)与基于地图网格的普通卷积(CNN);
Temporal的手段主要是基于LSTM,GRU等序列建模的方式,现在对于更长期的序列建模也是研究的热点,一个是基于多个序列模型(如RNN,LSTM等)的聚合,来增加时间维度的感受野。一个是使用时间卷积网络(TCN)来增强时间维度的感受野。基本主流论文中的方法大框架都是采用空间领域的图卷积与时间领域的GRU。

引用

链接: datawhale-gnn
链接: 图神经网络的新基准
链接: 图神经网络的ImageNet
链接: 图神经网络简介及其在交通流预测中的应用

标签:预测,task7,卷积,GNN,神经网络,ogbi,数据
来源: https://blog.csdn.net/weixin_46714700/article/details/118575012