首页 > TAG信息列表 > WordNet

WordNet

WordNet WordNet本来是一个电子版英语词典。后来在NLP的发展下,为NLP提供了很多英语料支持。 >>> import nltk >>> nltk.download('wordnet') >>> from nltk.corpus import wordnet as wn >>> wn.synsets('dog') # 查一个单词的一系列属性 [Synset('dog.n.

中文WordNet的安装与使用

最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。 文章目录 (一)WordNet的介绍(二)WordNet的安装(三)中英文WordNet的使用(1)词义查询(2) 同义词查询(3) 其他查询 (一)WordNet的介绍 WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联

WordNet相关API介绍及语义相似度计算方法

WordNet Introduction WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。 它是一个覆盖范围宽广的英语词汇语义网。名词,动词,形容词和副词各自被

python-2个句子的语义相似性度量

这个问题已经在这里有了答案:            >            How to compute the similarity between two text documents?                                    8个我需要测量两个句子之间的相似度.例如: s1 = "she is goo

Python-比较同义词NLTK

这个问题已经在这里有了答案:            >            All synonyms for word in python?                                     3个我无法提出一个陌生人的问题,想您会帮我的. for p in wn.synsets('change'):<br>

如何从Spacy获取更好的引理

“ PM”可以表示“ pm(time)”,也可以表示“总理”. 我想抓住后者.希望“ PM”的引退归还“总理”.如何使用spacy做到这一点? 返回意外引理的示例: >>> import spacy >>> #nlp = spacy.load('en') >>> nlp = spacy.load('en_core_web_lg') >>> doc = nlp(u'PM means p

从Wordnet提取以特定字母开头的所有单词

如何从wordnet中提取所有以特定字母开头的单词.例如,如果我键入A,则wordnet应该返回以字母A开头的所有单词.解决方法:我最容易看到的方法是从here下载其数据库,然后解析每行第五个元素的以空格分隔的数据文件(data.adj,data.adv,data.noun,data.verb),并将其放入相关数据结构. 可能

使用sendi_classifier和NLTK的情感分析

我没有做正确的事-从错误的外观来看,我认为我正在丢失一些数据.我已经为ntk,numpy和sentiwordnet安装了sentiment_classifier(https://pypi.python.org/pypi/sentiment_classifier/0.7)的所有先决条件.这是我的代码-我正在尝试工作的文档中的一个简单示例. from senti_classifier

用C 11中的智能指针包装旧的C结构并自动释放它们

我使用的是Word-Net,这是普林斯顿大学90年代开发的旧C库. 该库是用C编写的,仅显示标头,而不显示其实际实现. 我使用的唯一结构是: SynsetPtr 我调用的两个函数是: findtheinfo_ds traceptrs_ds 这两个函数均返回SynsetPtr. 但是,当SynsetPtr代表一个感应列表时,我必须使用 free

如何使用Python NLTK在WordNet同义词集中仅打印单词本身?

在Python 2.7中,有没有一种方法可以使用NLTK来获取单词,而不获取包括“ synset”,括号和“ n.01”等的额外格式? 例如,如果我这样做 wn.synsets('dog') 我的结果如下所示: [Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synse

mysql-Wordnet查询以返回例句

我有一个用词,我需要知道以下内容: >单词的同义词(仅同义词就足够了) >单词的所有含义,每个含义包含-与该单词匹配的同义词,该含义的例句(如果存在),该含义的词性. 示例-this query link.进位一词的屏幕截图: 对于每个“感觉”,我们都有词性(例如V),与该意义相匹配的同义词(例如在第

python – 如何在NLTK的Wordnet中检索目标synset的反义词synset?

我已成功通过其他语义关系检索连接到基本synset的同义词集,如下所示: wn.synset('good.a.01').also_sees() Out[63]: [Synset('best.a.01'), Synset('better.a.01'), Synset('favorable.a.01'), Synset('good.a.03'), Synset('obedient.a

python – spacy lemmatizer如何工作?

对于词形还原,spacy有一个lists of words:形容词,副词,动词……还有例外列表:adverbs_irreg …对于常规词,有一组rules 我们以“更广泛”这个词为例 因为它是一个形容词,所以词典化的规则应该从这个列表中取出: ADJECTIVE_RULES = [ ["er", ""], ["est", ""], ["er", "e"

python – wordnet中引理和synset之间的连接或区别是什么?

我是NLP和NLTK的初学者. 我无法理解wordnet中的lemmas和synsets之间的确切区别,因为两者产生的输出几乎相同.例如,对于单词cake,它会产生这个输出. lemmas : [Lemma('cake.n.01.cake'), Lemma('patty.n.01.cake'), Lemma('cake.n.03.cake'), Lemma('coat.v.03.cake')] synsets :

在NLTK 3.0中使用Wordnet从Synset中提取Word

前段时间,有人在SO上使用NLTK的wordnet包装器问how to retrieve a list of words for a given synset.以下是建议的回复之一: for synset in wn.synsets('dog'): print synset.lemmas[0].name 使用NLTK 3.0运行此代码会产生TypeError:’instancemethod’对象不可订阅. 我尝试了

Python:将变量传递到Word中NL4K中的Synsets方法

我需要处理一个需要NLTK的项目,所以我在两周前开始学习Python,但很难理解Python和NLTK. 从NLTK文档中,我可以理解以下代码,如果我在下面的代码中手动添加单词apple和pear,它们的效果很好. from nltk.corpus import wordnet as wn apple = wn.synset('apple.n.01') pear = wn.syns

java – ws4j为应该返回1的相似性度量返回无穷大

我有一个非常简单的代码,取自this example,我使用Lin,Path和Wu-Palmer相似性度量来计算两个单词之间的相似性.我的代码如下: import edu.cmu.lti.lexical_db.ILexicalDatabase; import edu.cmu.lti.lexical_db.NictWordNet; import edu.cmu.lti.ws4j.RelatednessCalculator; import

python – 使用nltk和wordnet对多数名词进行解释

我想用lemmatize from nltk import word_tokenize, sent_tokenize, pos_tag from nltk.stem.wordnet import WordNetLemmatizer from nltk.corpus import wordnet lmtzr = WordNetLemmatizer() POS = pos_tag(text) def get_wordnet_pos(treebank_tag): #maps pos tag

python – 将单词添加到WordNet的本地副本

我正在使用WordNet,通过Python的NLTK访问,以比较来自社交媒体的单词的同义词.其中许多单词不在NLTK连接的WordNet版本中. 当我说出我的话时,我指的是特定领域的术语,而不是缩写词或表情符号. 我编译了这些单词的列表,并希望将该列表与WordNet合并. 搜索先前的努力开始尝试开发自动

python – 将形容词转换为副词

有谁知道如何将英文形容词转换为各自的副词? Python是理想的,但实际上任何程序化方法都会很棒. 我试过pattern.en,nltk wordnet和spacy无济于事. 将副词转换为根形容词形式是没有问题的.我正在使用SO解决方案here. 我想要的是走另一条路.从形容词到副词. Here is nltk wordnet code

python – 在Django单元测试中使用持久数据库

我有一个大型的只读Wordnet PostgreSQL数据库,我想从Django单元测试中使用它.具体来说,我有一个名为“wordnet”的应用程序,它包装了这个Wordnet数据库.不幸的是,默认的Django unittest框架为所有应用程序使用了一个空的内存中SQLite数据库. 如何在单元测试中使用我的PostgreSQL数

python – 将形容词和副词转换为名词形式

我正在使用wordnet为我的项目尝试词义消歧.作为项目的一部分,我想将派生的形容词或副词形式转换为它的根名词形式. 例如 美丽的==>美女 精彩==>奇迹 >我怎样才能做到这一点?除了wordnet之外还有其他任何提供这种转换的词典吗?>如果我可以将形容词的确切意义映射到具有确切意义的名词

使用Wordnet Synset的定义方法无法获得所需的输出

from nltk.corpus import wordnet syn=wordnet.synsets('cookbook')[0] print syn.definition 预期产出: 'a book of recipes and cooking directions' 实际产量: bound method Synset.definition of Synset('cookbook.n.01') 我无法查明代码中的错误,这会导

从NLTK for Python中的同义词列表中提取单词

在wn.all_synsets(‘n’)中使用这个[x for x]我可以在NLTK的帮助下从Wordnet获取所有名词的所有名词. 列表allnouns看起来像这个Synset(‘pile.n.01’),Synset(‘compost_heap.n.01’),Synset(‘mass.n.03’)等等.现在我可以使用allnouns [2]获得任何元素,这应该是Synset(‘mass.n.

试图使用wordnet java api查找同义词

我试图使用Wordnet java api在java中找到一些单词(String类型)的同义词.我在弄清楚它是如何工作的时候遇到了困难. 我发现这个链接http://lyle.smu.edu/~tspell/jaws/doc/edu/smu/tspell/wordnet/impl/file/ReferenceSynset.html#getTagCount%28java.lang.String%29我虽然它很有用,