ACKRec
作者:互联网
ABSTRACT
大规模开放网络课程(Massive open online courses,简称MOOCs)正在成为一种时髦的教育方式,它为学生掌握知识提供了大规模、开放获取的学习机会。为了吸引学生的兴趣,mooc提供商采用推荐系统向学生推荐课程。然而,由于一门课程通常由多个视频讲座组成,每个视频讲座都涉及一些特定的知识概念,直接推荐课程忽略了学生对某些特定的知识概念的兴趣。为了填补这一空白,本文研究了知识概念推荐问题。本文提出了一种基于端到端图神经网络的知识概念推荐方法——Attentional Heterogeneous Graph Convolutional Deep Knowledge Recommender (ACKRec)。与其他推荐问题一样,它也存在稀疏性问题。为了解决这个问题,我们利用内容信息和上下文信息,通过图卷积网络学习实体的表示。除了学生和知识概念外,我们还考虑了其他类型的实体(如课程、视频、教师),并构建了一个异构信息网络(HIN)来捕获不同类型实体之间相应的卓有成效的语义关系,并将它们纳入表征学习过程中。具体来说,我们在HIN上使用元路径来引导学生偏好的传播。此外,我们提出了一种注意机制来自适应地融合来自不同元路径的上下文信息,以捕捉不同学生的不同兴趣。为了了解所提出模型的参数,我们提出利用扩展矩阵分解(MF)。进行了一系列的实验,证明了ACKRec在多个流行指标上的有效性,并与最先进的基线方法进行了比较。研究结果表明,所提出的ACKRec能够有效地向mooc在线学习的学生推荐知识概念
KEYWORDS
推荐系统;神经网络图;异构信息网络
1 INTRODUCTION
近年来,大规模开放网络课程(mooc)正逐渐成为世界范围内的一种替代教育模式。例如,Coursera、edX和Udacity这三个MOOC的先驱平台,为数百万用户提供了来自国际知名大学的众多课程。在中国,数百万用户在“*XuetangX”*学习。“XuetangX”是中国最大的MOOC平台之一,提供各种科目的数千门课程。虽然mooc的学生数量在不断增长,但mooc的发展仍然存在一定的困难。对于mooc来说,一个具有挑战性的问题是如何吸引学生在整体课程完成率低于5%[34]的平台上持续高效地学习。因此,它需要更好地理解和捕捉学生的兴趣。
为了了解和捕捉mooc平台上的学生兴趣,我们做了多种努力,包括课程推荐[13,35]、行为预测[20]、用户意图理解[34]等。在这些努力中,推荐系统被MOOCs供应商应用,向学生推荐课程。然而,一门课程通常由一些视频讲座组成,每个视频讲座涵盖一些特定的知识概念。直接的课程推荐忽略了学生对具体的知识概念的兴趣,例如,不同的教师讲授的计算机视觉课程在微观上可能会有很大的不同(涵盖不同的知识概念集):有些老师可能只讲基于几何的方法,而另一些老师可能只讲基于深度学习的方法,因此推荐只讲基于几何方法的计算机视觉课程给对基于深度学习方法感兴趣的学生是不合适的。因此,需要从微观的角度研究学生的网络学习兴趣,进行知识概念推荐。
传统的推荐策略,如协同过滤(collaborative filtering, CF),考虑用户(学生)的历史交互,根据兴趣相似的用户潜在的共同偏好进行推荐,取得了很大的成功。然而,基于CF的方法存在用户-项目(学生-知识概念)关系的稀疏性,这限制了推荐的性能。为了克服这个问题,已经做了许多努力,利用边信息,如社交网络[11]、用户/项目属性[27]、图像[33]、上下文[25]等。在mooc平台中,我们观察到除了用户和知识概念外,还存在多种类型的实体(视频、课程、教师)以及不同实体之间的多种关系。
表1显示的是2018年1月1日至2018年3月31日XuetangX真实数据的统计。该数据包含9986个用户、43405个视频、7020门课程、5038名教师、1029个知识概念以及相应的多种关系类型。如图1所示,“课程:V_9e77179”包含“知识概念:c++”,“学生:207256”正在上“课程:CaltechX”,“视频:V_1a9aa686”与“知识概念:二叉树”有关,“课程:CaltechX”由“老师:Smith”教授。此外,考虑用户的行为历史,我们可以发现更多的关系。例如,“用户:207256”点击了“知识概念:c++”、“知识概念:二叉树”、“知识概念:深度优先搜索”。考虑到以上多种类型的关系,我们可以得到用户和知识概念之间更有成效的事实和交互。如果我们仅仅依靠基本的结构,很难发现“知识概念:深度优先搜索”和“知识概念:时间复杂度”之间的显著交互作用,它们属于不同的课程,但被一个用户点击。如图1所示,不同的知识概念包含不同的上下文。仅利用单一的交互方式可能会忽视用户与知识概念之间的重要关系。例如,“知识概念:c++”和“知识概念:二叉树”虽然出现在同一个视频中,但语义却不同。这些异构关系提供了丰富的侧信息,并从三个方面对推荐系统有益:(1)引入知识概念之间的语义关联,有助于识别潜在交互;(2)合理扩展用户兴趣,增加推荐知识概念的多样性;(3)用户的兴趣可以通过沿着这些关系跟踪用户的历史记录来解释。因此,它需要将这些异构关系合并到实体的表示学习中。
基于上述观察,我们提出了Attentional Heterogeneous Graph Convolutional Deep Knowledge Recommender (ACKRec),这是一个端到端mooc平台知识概念推荐框架。为了捕获异构复杂关系,我们将mooc平台数据建模为一个异构信息网络(HIN)[23]。然后,我们提出了一个基于注意的图卷积网络(GCNs)来学习不同实体的表示。传统的GCNs只能捕获同质实体之间的同质关系,忽视了异质关系之间的丰富信息。为了解决这个问题,我们使用元路径[25]作为指导,通过GCN捕获HIN中的异构上下文信息。通过这种方式,异类关系可以更自然、更直观地利用。此外,考虑到不同的学生可能有不同的兴趣,我们进一步提出了一种注意机制,在多元元路径中自适应地利用语境。最后,我们建议通过扩展矩阵分解对所提出模型的参数进行优化,得到最终的推荐列表。
本文的主要贡献可以总结如下:
- 我们发现了现有mooc推荐系统经常忽略的知识概念推荐的重要问题。知识概念推荐填补了这一空白,提供了一种更微观层次的推荐。
- 我们提出了一个新颖的端到端框架ackrec,利用丰富的异构上下文侧信息来辅助知识概念的推荐。
- 我们开发了一个异构信息网络模型,以捕获mooc平台中不同类型实体之间的各种复杂交互。
- 我们设计了一个基于注意力的图卷积网络,它可以将内容和异构上下文结合到不同实体的表示学习中。该模型在元路径的引导下,通过传播用户偏好自动发现用户潜在兴趣。
- 我们利用从XuetangX收集的真实世界数据进行了大量实验研究,以全面评估提出的模型的性能。我们研究了这些参数,包括元路径组合、表示维数、潜在工厂数和GCNs层数。通过与一系列强基线的比较,综合证明了该模型的有效性。
2 PROBLEM STATEMENT AND SYSTEM ARCHITECTURE
2.1 Problem Statement
给定一个目标用户在mooc中有相应的交互数据,目标是计算该用户对一系列知识概念的兴趣得分,以及推荐结果——知识概念top N List。更正式地说,给定一个用户 \(u\) 的交互数据,学习一个预测函数$f$并使用它生成一个知识概念推荐列表 \(k\)
2.2 System Architecture
我们提出的知识概念推荐系统ACKRec的架构如图2所示。它由以下部分组成:
- 特征提取。利用mooc收集的数据,首先从知识概念的名称中提取内容信息作为内容特征,然后分析不同类型实体(知识概念、视频、课程)之间的各种关系(概念-视频、概念-课程关系)来描述知识概念。类似地,我们还为用户生成概念特性和上下文特性。(关于特征提取的详细信息请参见3.1节。)
- Meta-path选择。在该模块中,我们根据从数据中提取的特征,构造一个结构化HIN来建模不同类型实体之间的关系,然后从HIN中选择不同的元路径来描述知识概念上的相关性(即具有不同含义)。例如,如果两个不同的用户注册了同一门课程,我们将两个用户之间的优势。(关于HIN上的元路径构建器的详细信息,请参见3.2节。)
- 异构实体的表示学习。在前文构建的元路径的基础上,提出了一个表示学习模型,用于学习异构视图中实体的低维表示。该模型能够捕获异构实体之间的结构相关性。具体来说,我们利用选定的元路径通过图卷积网络指导实体表示学习。随后,我们利用注意机制自适应地融合来自不同元路径的学习实体表示。(关于我们提出的模型ACKRec,详见第3.3节)
- 评级预测。在生成用户和知识概念的低维表示后,将实体的密集向量进行扩展矩阵分解,以学习模型的参数。此外,我们基于用户-项目(学生-知识概念)评级矩阵预测用户对未点击知识概念的兴趣。
标签:mooc,概念,推荐,知识,用户,ACKRec,课程 来源: https://www.cnblogs.com/meww/p/16029386.html