word2vec
作者:互联网
介绍
cbow:上下文词向量求和,预测中心词
skip-gram:中心词预测上下文
优化
1、哈夫曼树
把常规的 softmax 优化为 哈夫曼softmax,优化的是每个样本在哈夫曼树上的路径概率
与样本无关。
2、负采样
对每一个正样本,按照词频构建负样本,构建二分类任务,梯度下降求解。
可以用常规的 softmax 函数
参考博客
https://www.cnblogs.com/pinard/p/7160330.html
标签:中心词,word2vec,哈夫曼,样本,softmax,上下文,优化 来源: https://www.cnblogs.com/wa007/p/15173901.html