首页 > 其他分享> > 06 Word2Vec模型（第一个专门做词向量的模型，CBOW和Skip-gram）

06 Word2Vec模型（第一个专门做词向量的模型，CBOW和Skip-gram）

2022-07-12 16:34:17 作者：互联网

神经网络语言模型（NNLM）--》为了预测下一个词

NNLM（）--》预测下一个词

神经网络+语言模型：用神经网络去解决和人说话有关的两个任务的一个东西

softmax(w2(tanh(（w1x+b1）))+b2)

得到一个副产品（词向量）

Q 矩阵，对于任何一个独热编码的词向量都可以通过 Q 矩阵得到新的词向量

神经网络语言模型--》主要目的就是为了得到词向量

NNLM 和 Word2Vec 基本一致（一模一样），不考虑细节，网络架构就是一模一样

给出一个词的上下文，得到这个词

“我是最_的Nick”

“帅” \(w_t\)

给出一个词，得到这个词的上下文

“帅”

“我是_的Nick”

NNNL --》重点是预测下一词，双层感知机softmax(w2(tanh(（w1(xQ)+b1）))+b2)

Word2Vec --》 CBOW 和 Skip-gram 的两种架构的重点都是得到一个 Q 矩阵，softmax(w1 (xQ) +b1)

Q 矩阵的设计

![image-20220614193540503](../../Library/Application Support/typora-user-images/image-20220614193540503.png)

00010 代表 apple × Q = 10，12，19

apple（苹果，）

假设数据集里面的 apple 只有苹果这个意思，没有这个意思（训练）

（测试，应用）10，12，19 apple, 无法表示这个意思

词向量不能进行多意 ---》 ELMO

标签：做词,Word2Vec,--,NNLM,模型,矩阵,CBOW,向量
来源： https://www.cnblogs.com/nickchen121/p/16470584.html