【无标题】
作者:互联网
目录
知识点
然后求其特征值和特征向量,具体求解方法不再详述,可以参考相关资料。
【参考:由上文知道,协方差矩阵C是一个是对称矩阵,在线性代数上,实对称矩阵有一系列非常好的性质:
1)实对称矩阵不同特征值对应的特征向量必然正交。
2)设特征向量λ重数为r,则必然存在r个线性无关的特征向量对应于λ,因此可以将这r个特征向量单位正交化。
由上面两条可知,一个n行n列的实对称矩阵一定可以找到n个单位正交特征向量,设这n个特征向量为
,
我们将其按列组成矩阵:
则对协方差矩阵C有如下结论:
其中Λ为对角矩阵,其对角元素为各特征向量对应的特征值(可能有重复)。】
求解后特征值为:
其对应的特征向量分别是:
其中对应的特征向量分别是一个通解,c1和c2可取任意实数。那么标准化后的特征向量为:
因此我们的矩阵P是:
可以验证协方差矩阵C的对角化:
最后我们用P的第一行乘以数据矩阵,就得到了降维后的表示:
降维投影结果如下图:
Lingluan
在基本K均值算法里,当邻近度函数采用下面哪种距离时,合适的质心是簇中各点的中位数
1、曼哈顿距离: 质心:中位数。目标函数:最小化对象到其簇质心的距离和
2、平方欧几里德距离。质心:均值。目标函数:最小化对象到其簇质心的距离的平方和
3、余弦。质心:均值。最大化对象与其质心的余弦相似度和
4、Bregman 散度。质心:均值。目标函数:最小化对象到其簇质心的Bregman散度和
数据不平衡应该用precision和recall来计算模型准确率
TP:正例预测正确的个数
FP:负例预测错误的个数
TN:负例预测正确的个数
FN:正例预测错误的个数
准确率(accuracy)
精确率(precision)
描述的是在所有预测出来的正例中有多少是真的正例
准确率与精确率的区别:
在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点击)acc 也有 99% 以上,没有意义。
召回率(recall) ,描述的是所有正例我能发现多少
F1值——精确率和召回率的调和均值
只有当精确率和召回率都很高时,F1值才会高
欠拟合(高偏差):增加特征种类;增加多项式的次数;降低正则化项的系数;过拟合(高方差):增加数据集;删除部分特征;增加正则化项的系数。 若模型欠拟合,用copy数据的方法补充训练数据没有用
循环(迭代)与递归的区别
转载:https://blog.csdn.net/wuxiuyong/article/details/77529401
递归和迭代都是循环的一种。
简单地说,递归是重复调用函数自身实现循环。迭代是函数内某段代码实现循环,
而迭代与普通循环的区别是:循环代码中参与运算的变量同时是保存结果的变量,当前保存的结果作为下一次循环计算的初始值。
递归循环中,遇到满足终止条件的情况时逐层返回来结束。
迭代则使用计数器结束循环。当然很多情况都是多种循环混合采用,这要根据具体需求。
数据泄露会导致模型过拟合
代码
enumerate()
函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
以下展示了使用 enumerate() 方法的实例:
defaultdict()
用于产生一个带有默认值的dict。主要针对key不存在的情况下,也希望有返回值的情况。
对于普通的dict,key不存在就报错。
但是对于defaultdict,key不存在就会返回默认值。
那么默认值如何设定?通过给defaultdict()方法传参,传入的是一个函数(或叫做方法),当key不存在时,返回的就是这个函数的默认返回值。
此时就不会报错。而且返回值是0。
我们还发现了,原来int这个内置函数的默认值是0。看这个示例:
这里的函数可以是任意自定义函数,只要又default的return即可。
sqrt()
方法返回数字x的平方根。
sorted()
函数对所有可迭代的对象进行排序操作。
sort 与 sorted 区别:
sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。
list 的 sort 方法返回的是对已经存在的列表进行操作,无返回值,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。
代码随想录-leecode题
数组
二分查找
这道题目的前提是数组为有序数组,同时题目还强调数组中无重复元素,因为一旦有重复元素,使用二分查找法返回的元素下标可能不是唯一的,这些都是使用二分法的前提条件,当大家看到题目描述满足如上条件的时候,可要想一想是不是可以用二分法了。
-
二分查找
-
搜索插入位置
-
在排序数组中查找元素的第一个和最后一个位置
-
x 的平方根
二分查找法
公式法
- 有效的完全平方数
哈希表
242. 有效的字母异位词
-
两个数组的交集
-
快乐数
两数之和
-
四数相加 II
-
赎金信
双指针
15. 三数之和
双指针法
链表法
- 四数之和
双指针法
- 移除元素
链表
206. 反转链表
双指针迭代
递归解法
- 反转链表 II
一次遍历「穿针引线」反转链表(头插法)
穿针引线
- 删除链表的倒数第 N 个结点
双指针
计算链表长度k
两数相加
示例 1:
递归
循环(迭代)
模拟过程
59. 螺旋矩阵 II
标签:迭代,特征向量,矩阵,无标题,链表,质心,函数 来源: https://blog.csdn.net/weixin_51246899/article/details/123607502