实体链接小结(一)
作者:互联网
实体链接
实体链接(Entity linking,EL),将文本中的实体提及映射到给定的知识库(KB),在许多领域起到了非常有趣的基础作用,例如问题回答、语义搜索和信息提取。
【主要阶段】
(i)候选生成,为每个提及在KB中获得一组引用实体;
(i i)命名实体消歧,通过计算提及和候选实体之间的相似度,并解决排序问题来选择可能的候选实体。我们将现有的实体链接模型分为两种:local models(根据实体的上下文信息来实现实体链接) 和 global models(利用文档中的所有提及和其目标实体具有全局一致性来解决实体链接问题)。
【主流方法】
基于概率生成模型的方法
基于主题模型的方法
基于图的方法
基于深度学习的方法
无监督方法
【实体链接过程】
- 命名实体识别
- 候选实体生成
- 实体消歧
- 未发现实体聚类
【评测会议】
1.MUC——主要包括信息抽取相关的评测业务。
2.ACE——实体检测与跟踪。将篇章中出现的各种表述指向其对应的实体。2003年起,ACE提供了中文语料的共指消解任务。延续到2008年。
3.TAC——共指消解任务过渡到基于维基百科的实体链接的任务。
4.OntoNotes——2010年。不包含单表述实体(单一表述的实体聚类SingletonEntity),仅标注发生共指关系的表述。
5.CoNLL——2011年。英文的共指消解评测,采用OntoNote4.0 。
【评价指标】
准确率(Accuracy) 精确率 (Precision) 、召回率 (Recall) 以及 F1 值
【当前研究热点】
如何在上下文信息受限(短文本、跨语境、跨领域等)条件下,准确地将从文本中抽取得到的实体正确链接到知识库中对应的实体
标签:候选,基于,表述,实体,提及,小结,链接 来源: https://blog.csdn.net/github_39012302/article/details/86664716