其他分享
首页 > 其他分享> > 【无标题】

【无标题】

作者:互联网


目录

知识点

然后求其特征值和特征向量,具体求解方法不再详述,可以参考相关资料。

【参考:由上文知道,协方差矩阵C是一个是对称矩阵,在线性代数上,实对称矩阵有一系列非常好的性质:

1)实对称矩阵不同特征值对应的特征向量必然正交。

2)设特征向量λ重数为r,则必然存在r个线性无关的特征向量对应于λ,因此可以将这r个特征向量单位正交化。

由上面两条可知,一个n行n列的实对称矩阵一定可以找到n个单位正交特征向量,设这n个特征向量为

我们将其按列组成矩阵:

则对协方差矩阵C有如下结论:

其中Λ为对角矩阵,其对角元素为各特征向量对应的特征值(可能有重复)。】

求解后特征值为:

其对应的特征向量分别是:

其中对应的特征向量分别是一个通解,c1和c2可取任意实数。那么标准化后的特征向量为:

因此我们的矩阵P是:

可以验证协方差矩阵C的对角化:

最后我们用P的第一行乘以数据矩阵,就得到了降维后的表示:

降维投影结果如下图:

Lingluan
在基本K均值算法里,当邻近度函数采用下面哪种距离时,合适的质心是簇中各点的中位数

1、曼哈顿距离: 质心:中位数。目标函数:最小化对象到其簇质心的距离和

2、平方欧几里德距离。质心:均值。目标函数:最小化对象到其簇质心的距离的平方和

3、余弦。质心:均值。最大化对象与其质心的余弦相似度和

4、Bregman 散度。质心:均值。目标函数:最小化对象到其簇质心的Bregman散度和

数据不平衡应该用precision和recall来计算模型准确率

TP:正例预测正确的个数

FP:负例预测错误的个数

TN:负例预测正确的个数

FN:正例预测错误的个数

准确率(accuracy)

精确率(precision)

描述的是在所有预测出来的正例中有多少是真的正例

准确率与精确率的区别:

在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点击)acc 也有 99% 以上,没有意义。

召回率(recall) ,描述的是所有正例我能发现多少

F1值——精确率和召回率的调和均值

只有当精确率和召回率都很高时,F1值才会高

欠拟合(高偏差):增加特征种类;增加多项式的次数;降低正则化项的系数;过拟合(高方差):增加数据集;删除部分特征;增加正则化项的系数。 若模型欠拟合,用copy数据的方法补充训练数据没有用

循环(迭代)与递归的区别

转载:https://blog.csdn.net/wuxiuyong/article/details/77529401

递归和迭代都是循环的一种。

简单地说,递归是重复调用函数自身实现循环。迭代是函数内某段代码实现循环,

而迭代与普通循环的区别是:循环代码中参与运算的变量同时是保存结果的变量,当前保存的结果作为下一次循环计算的初始值。

递归循环中,遇到满足终止条件的情况时逐层返回来结束。

迭代则使用计数器结束循环。当然很多情况都是多种循环混合采用,这要根据具体需求。

数据泄露会导致模型过拟合

代码
enumerate()
函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。

以下展示了使用 enumerate() 方法的实例:

defaultdict()
用于产生一个带有默认值的dict。主要针对key不存在的情况下,也希望有返回值的情况。

对于普通的dict,key不存在就报错。

但是对于defaultdict,key不存在就会返回默认值。

那么默认值如何设定?通过给defaultdict()方法传参,传入的是一个函数(或叫做方法),当key不存在时,返回的就是这个函数的默认返回值。

此时就不会报错。而且返回值是0。

我们还发现了,原来int这个内置函数的默认值是0。看这个示例:

这里的函数可以是任意自定义函数,只要又default的return即可。

sqrt()
方法返回数字x的平方根。

sorted()
函数对所有可迭代的对象进行排序操作。

sort 与 sorted 区别:
sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。

list 的 sort 方法返回的是对已经存在的列表进行操作,无返回值,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。

代码随想录-leecode题
数组
二分查找

这道题目的前提是数组为有序数组,同时题目还强调数组中无重复元素,因为一旦有重复元素,使用二分查找法返回的元素下标可能不是唯一的,这些都是使用二分法的前提条件,当大家看到题目描述满足如上条件的时候,可要想一想是不是可以用二分法了。

  1. 二分查找

  2. 搜索插入位置

  3. 在排序数组中查找元素的第一个和最后一个位置

  4. x 的平方根

二分查找法

公式法

  1. 有效的完全平方数

哈希表
242. 有效的字母异位词

  1. 两个数组的交集

  2. 快乐数

两数之和

  1. 四数相加 II

  2. 赎金信

双指针
15. 三数之和

双指针法

链表法

  1. 四数之和

双指针法

  1. 移除元素

链表
206. 反转链表

双指针迭代

递归解法

  1. 反转链表 II

一次遍历「穿针引线」反转链表(头插法)

穿针引线

  1. 删除链表的倒数第 N 个结点

双指针

计算链表长度k

两数相加

示例 1:

递归

循环(迭代)

模拟过程
59. 螺旋矩阵 II

标签:迭代,特征向量,矩阵,无标题,链表,质心,函数
来源: https://blog.csdn.net/weixin_51246899/article/details/123607502