其他分享
首页 > 其他分享> > 【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA

【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA

作者:互联网

【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA

文章目录
1 数据集
2 清洗数据集
3 GloVe + LSTM
4 GloVe词向量模型
5 搭建网络整体结构
6 训练模型并验证
7 对抗扰动
8 数据安全智能守护神UEBA(用户实际行为分析)

1 数据集

总的数据集一共有4458条数据,将按照8:2进行划分训练集和验证集。通过分析发现,其中pam的数量有3866条,占数据集的大多数,可以考虑不平衡样本采样进行训练。

数据集的格式如图所示,有三列分别是ID,Label(pam、spam),Email
在这里插入图片描述
Spam表示垃圾邮件。

2 清洗数据集

在实际中清洗数据也是非常必要的,套用一句俗话“数据决定了模型的上限”。常用的清洗数据的方法有:去掉停用词、去掉URL、去掉HT

标签:UEBA,GloVe,扰动,数据,清洗,邮件,去掉
来源: https://blog.csdn.net/weixin_43838785/article/details/117172840