首页 > 编程语言> > python – 为什么在gensim word2vec中创建了多个模型文件？

python – 为什么在gensim word2vec中创建了多个模型文件？

2019-09-29 17:57:30 作者：互联网

当我尝试创建一个word2vec模型(带负抽样的skipgram)时,我收到3个文件作为输出,如下所示.

word2vec (File)
word2vec.syn1nef.npy (NPY file)
word2vec.wv.syn0.npy (NPY file)

我只是担心为什么会发生这种情况,因为我以前在word2vec中的测试示例我只收到一个模型(没有npy文件).

请帮我.

解决方法:

具有较大内部矢量数组的模型无法通过Python“pickle”保存到单个文件中,因此超出某个阈值时,gensim save()方法将使用更高效的原始格式将辅助数组存储在单独的文件中numpy数组(.npy格式).

您仍然只需指定根模型文件名来加载()模型;当需要子阵列时,加载代码将找到侧面文件 – 只要它们保留在根文件旁边.因此,在将模型移动到其他位置时,请确保将所有具有相同根文件名的文件保存在一起.

标签：word-embedding,gensim,word2vec,python
来源： https://codeday.me/bug/20190929/1832505.html