编程语言
首页 > 编程语言> > python-与gensim一起使用freebase向量

python-与gensim一起使用freebase向量

作者:互联网

我正在尝试使用Google发布的freebase词嵌入,但是我很难从freebase名称中获取这些词.

model = gensim.models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000.bin',binary=True)
model.vocab.keys()[:10]

Out[22]:
[u'/m/026tg5z',
 u'/m/018jz8',
 u'/m/04klsk',
 u'/m/08gd39',
 u'/m/0kt94',
 u'/m/05mtf0t',
 u'/m/05tjjb',
 u'/m/01m3vn',
 u'/m/0h7p35',
 u'/m/03ggvg3']

有谁知道它是否存在某种形式的表,用于将freebase表示映射到它们表示的单词?

问候,

赫迪

解决方法:

实际上,有人对我们所有人都做了一件好事,并将ID映射到预先训练的模型中的名称.您可以下载该型号here.

from gensim.models import Word2Vec
model = Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000-en.bin.gz',
                                       binary=True)

请注意.bin之前的多余字符.然后是一些样本词汇:

>>> list(model.vocab.keys())[:10] 
['/en/the_final_country', '/en/independent_curators_international', 
'/en/coney_reyes', '/en/scalr', '/en/everyman_palace_theatre', 
'/m/0g55w3s', '/en/waltershausen', '/en/river_frome_stroud', 
'/en/grzegorz_turnau']

标签:gensim,word2vec,freebase,python
来源: https://codeday.me/bug/20191120/2042557.html