首页 > TAG信息列表 > 马氏
【数字挖掘学习笔记】第二章__数据
1、数据类型与对象 什么是数据? 数据是数据对象的集合;数据对象用一组刻画其基本性质的属性描述;属性是对象的性质或者特征; 属性值:为了分析属性,我们为他们赋予的数字或符号,称为属性值。 属性分为离散型和连续型。 非对称属性:只重视少部分非零属性值才有意义,称该属性为非对称属机器学习中的数学——距离定义(六):马氏距离(Mahalanobis Distance)
马氏距离(Mahalanobis Distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系并且是尺度无关的,即独立于测量尺度。对于一个均值为相似度 / 距离计算
Ref: 《统计学习方法》 目录 L p L_p Lp 距离 (高斯分布和马氏距离
高斯分布 x ∈ R p x\in \mathbb{R}^p x∈Rp机器学习常用的距离度量公式
1 欧式距离(Euclidean Distance): 欧式距离也称欧几里得距离,是最常见的距离度量,衡量的是多维空间中两个点之间的绝对距离。 举例: X=[[1,1],[2,2],[3,3],[4,4]]; 经计算得: d = 1.4142 2.8284 4.2426 1.4142 2.8284 1.4142 2 曼哈顿距离(Manhattan Distance第二章 基于距离的分类器
预习笔记 MED分类器 基于欧式距离的分类器,欧式距离 \(d(x1,x2)=(x2-x1)^{T}*(x2-x1)\) 判别方法: \((x-μ_{1})^{T}(x-μ_{1})<(x-μ_{2})^{T}(x-μ_{2})? C1类 : C2类\) 受特征的量纲、分布不同的影响,易导致分类错误,一般不直接用欧式距离进行分类 MICD分类器 基于马氏距离的分数据之间的相似度的度量 马氏距离 欧氏距离 PCA相关
目前凭印象说一下,可能不准,反正说给我自己的哈哈、 PCA就是找出一些特征的线性组合,这些线性组合能够有效地区分出不同数据点,数据点在这些PCA找出来的方向上的投影点方差最大(同时重建误差最小,参考PCA) 欧氏距离是最直观最简单的,也就是两个点之间的几何距离,也就是原始数据各个维(一)谱序参考文章 谱牒,身之本也!——序《马氏家谱》
马保荣1935年生,我是1938年生,他大我三庚,故以兄称谓。我们都是洛滨镇人,地相连,村相伴,经纬交织,犹如近邻,三华里之距。他居马湖村,马湖之南马庄村是我的故乡。我俩相识已六十五年了,同学于马湖完小,因春季中学不招生,我们是1952年7月完小毕业之后上中学。解放后几十年他于陕南山阳县供职,我19过采样方法用于数据集不平衡问题
过采样方法用于数据集不平衡问题 Random based (1)Random Oversampling 该方法只是随机的在原有的少数类中重复少数类的样本,从而增加少数类 Synthesising New Data (2)SMOTE 假设过采样比例为少数类别样本数的n倍,对于每个属于少数类的样本X,可以利用k近邻算法找到X,在少数类中