【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA
作者:互联网
【深度学习】对抗扰动、垃圾/钓鱼邮件自动分类和UEBA
文章目录
1 数据集
2 清洗数据集
3 GloVe + LSTM
4 GloVe词向量模型
5 搭建网络整体结构
6 训练模型并验证
7 对抗扰动
8 数据安全智能守护神UEBA(用户实际行为分析)
1 数据集
总的数据集一共有4458条数据,将按照8:2进行划分训练集和验证集。通过分析发现,其中pam的数量有3866条,占数据集的大多数,可以考虑不平衡样本采样进行训练。
数据集的格式如图所示,有三列分别是ID,Label(pam、spam),Email
Spam表示垃圾邮件。
2 清洗数据集
在实际中清洗数据也是非常必要的,套用一句俗话“数据决定了模型的上限”。常用的清洗数据的方法有:去掉停用词、去掉URL、去掉HT
标签:UEBA,GloVe,扰动,数据,清洗,邮件,去掉 来源: https://blog.csdn.net/weixin_43838785/article/details/117172840