首页 > 其他分享> > 【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA

【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA

2021-06-04 22:59:52 作者：互联网

文章目录
1 数据集
2 清洗数据集
3 GloVe + LSTM
4 GloVe词向量模型
5 搭建网络整体结构
6 训练模型并验证
7 对抗扰动
8 数据安全智能守护神UEBA（用户实际行为分析）

1 数据集

总的数据集一共有4458条数据，将按照8:2进行划分训练集和验证集。通过分析发现，其中pam的数量有3866条，占数据集的大多数，可以考虑不平衡样本采样进行训练。

数据集的格式如图所示，有三列分别是ID，Label(pam、spam)，Email
在这里插入图片描述
Spam表示垃圾邮件。

在实际中清洗数据也是非常必要的，套用一句俗话“数据决定了模型的上限”。常用的清洗数据的方法有：去掉停用词、去掉URL、去掉HT

标签：UEBA,GloVe,扰动,数据,清洗,邮件,去掉
来源： https://blog.csdn.net/weixin_43838785/article/details/117172840