编程语言
首页 > 编程语言> > 基于自编译器的时间序列异常检测算法

基于自编译器的时间序列异常检测算法

作者:互联网

基于自编译器的时间序列异常检测算法

原始时间序列

-> Auto Encoder(Encoder 和 Decoder)

-> 重构后的时间序列

-> 通过重构后的时间序列与原始时间序列的整体误差和局部误差来判断异常点

简单来说,只要输出的时间序列在局部的信息跟原始的时间序列不太一致,就有理由认为原始的时间序列存在着异常。

1.从理论上说,它只能对一个时间序列单独训练一个模型,不同类型的时间序列需要使用不同的模型。这样的话,其实维护模型的成本比较高,不太适用于大规模的时间序列异常检测场景;
2.对周期型的曲线效果比较好,如果是毛刺型的数据,有可能就不太适用;因为长期的毛刺型数据就可以看成正常的数据了。
3.每次调参需要人为设置一定的阈值,不同的时间序列所需要的阈值是不一样的。

2019/3/9

用Azure和scikit-learn堆栈实时传感器异常检测

首先是对自己的经历介绍:
0:00 ~5:26 介绍了自己之前的的工作污水处理,并附上了之前他们团队的处理方法,使用Iot传感器。
5:26~ first using Azure Machine Learning .
微软机器学习Azure Machine Learning入门概览 - 超伦 - 博客园it has two layers.one is ML studio-Easily define experments(真的让你做的就是带你的模型把生产起点与生产终点带入到模型之中,不需要去顾虑基础设施) next is a market allowing you to translate your api(它不仅仅是在倾听,他还与木星笔记本有一个联系,他都在一个集中的位置每个人从原型进行原型设计7:43) [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MHsJbYe4-1572182958478)(:storage\d0b0e9e6-8a7b-4970-855f-80c96ee07858\95c9a2f8.png)]
next is called event (它允许哪些事件中心做什么集线器,用流分析以实际处理这些数据时间,我们实际上可以做实时处理,实时分类)手动筛选每个频道和删除所有债务或修改程序

操作的基本方式也是考虑预测值与原始值之间的差别。

接下来一件事是使用scikit-learn指标来选出效率更高的模型,使用异常检测包(微软)Microsoft‘s anomaly detection API 通过JSON消费的结果。但是it takes a lot of regular air flow that’s actually not anomalies and calls anomalies and those probably are int our case they inflow and infiltration taht we don’t want move.第二步是使用二进制分类器
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AkFFJTZO-1572182958483)(:storage\d0b0e9e6-8a7b-4970-855f-80c96ee07858\4ff8b64b.png)]

High-dimensional and large-scale anomaly detection using a linear one-class SVM with deep learning

建立一个用于高维空间的鲁棒异常检测模型需要一个无监督特征提取器和一个异常检测器相结合。

高维数据集带来的挑战有三个因素:(1)指数搜索空间-潜在特征子空间的数量随输入维数的增加呈指数增长,从而形成指数搜索空间。(2)数据窥探偏差-高维空间中的每一个点都显示为异常。如果有足够多的可选子空间,则每个点至少可以找到一个特征子空间,以使其出现。 作为异常。(3))不相关的特征-高比例的不相关特征有效地在输入数据中产生噪声,这掩盖了真实的异常。

SVM在理论上是有吸引力的,原因如下:当参数被适当配置时,它们提供了良好的泛化,即使训练集有一些偏差;它们是 唯一的解,因为损失函数是凸的;在原则上,当选择合适的核时,它们可以建模任何训练集。

大量的输入特性导致维数现象的诅咒,导致浅层结构的泛化误差增加, 有大量不相关和冗余的特性.因此,用紧凑的数据表示来捕捉大部分变化,既可以减轻维数的诅咒,又可以降低算法的计算复杂度。

最近几年出现的另一类分类算法是深度信念网(Dbns),它是一种多类分类器和降维工具。DBN是一种多层生成模型,每次从未标注的数据中学习一层特征。然后将提取的特征作为训练下一层的输入。这个 高效、贪婪的学习之后,可以细化权重,以提高整个网络的生成或鉴别性能。DBN的一个主要限制是损失函数是非凸的,因此模型往往收敛于局部极小,不能保证全局极小值的存在。此外, DBN分类器是半监督的算法,需要一些有标记的例子来进行区分性的微调,因此使用无监督的dbn生成模型,称为自动编码器。

优点:混合dbn-1SVM支持向量机避免了非线性核机器的复杂性,达到了目前最先进的自动编码器的精度,同时大大降低了训练和测试时间。

  1. background
    2.1 deep and shadllow architectures

2.2. 1SVM, DBN and hybrid DBN-1SVM

  1. DBN-1SVM hybrid model

标签:训练,DBN,特征,算法,编译器,序列,异常,向量
来源: https://blog.csdn.net/qq_40364351/article/details/102772001