考研数学一:高数、线性代数、概率论的一些个人认为抽象概念的形象解释【从几何、深度学习角度】
作者:互联网
抽象概念的解释:
①矩阵就是线性变换!矩阵就是线性变换!矩阵就是线性变换!#什么是线性变换?Ax=b Ax=0 这种线性方程就可以理解为线性变换
②A~B :A相似于B,同一线性变换在不同基下的表示 有什么用?化简运算
相似矩阵用途,就是把一个矩阵化简,让这矩阵的特点更加突出,找到这类矩阵相应的特征。比如说亚洲人的外貌,对个体来讲,每个亚洲人外貌特点都不一样,但可以通过相似比较得出,亚洲人特征是 黄皮肤,黑头发。
你的论文用聚类【无监督学习】 可能是想看看先提取矩阵的特征,然后比较这些特征的相似性,相似度高的作为一类。
③简单来说,相似就是一个矩阵在不同基下的变换(同一空间)。而合同就是这个矩阵在不同的相互垂直的基下的变换。所以,合同是相似的一种特殊情况
④
A,B均为n阶方阵,若存在可逆矩阵P,使B=P*(-1)AP,则A,B相似。A,B均为n阶矩阵,若存在可逆矩阵P,使B=P(T)AP,则A,B合同。当且仅当P为正交矩阵即P*(-1)=P(T),才有矩阵相似与合同等价。但是A,B合同,可以直接推出A,B等价。
⑤矩阵A等价矩阵B :A与B维度相同即R(A)=R(B) 从空间的角度来说,它们是同一种空间。如果两个矩阵等价,一个矩阵表示线,另一个矩阵也表示线,一个矩阵表示面,另一个矩阵也表示面,但不一定表示同一条线和同一个面,只是类型相同.
note:以上都为个人认为的精华,如果看不懂,我很理解,因为这部分知识本身就有点抽象,不过给大部分同学讲了后,都能理解,所以贴出来
正交矩阵有那些性质?
ATA=AAT=E(定义)
性质:
①对定义两边取行列式,得|A|=±1
②任意两行或两列相互垂直(正交矩阵A的行向量组以及列向量组都是标准正交的向量组)
③每行或每列都是单位向量
结合②③等价于每行每列都为单位正交向量
④逆也是正交阵,对于一个正交矩阵来说,它的逆矩阵同样也是正交矩阵;积也是正交阵 #抛开考试体制计算,如果应用在计算机运算方面,一个简单的理论可能省去一大部分计算时间、人工、比如二次函数求零点、直接用求根公式就可以得到答案,比非要去带入输入值无限枚举得到零点 快速、高效得多
二次型化为标准型和规范型:
目的 它们是“最佳形态”便于观察 方法 【①正交变换法:其对角矩阵元素为特征值②配方法:其对角矩阵元素不一定为特征值】#来源于宇哥的《基础30讲》在讲二次型这块有介绍,下次来看的时候一定配图!现在先掠过!Sorry
惯性定理:正负惯性指数 1>若二次型的rank为r,则r=p+q 2>两个二次型(实对称矩阵合同的充要条件)具有相同的正、负惯性指数,或具有相同的秩及正(或负)惯性指数.还是附一个人家解释不错的链接,不过没基础不建议看这个,但你看到这里了说明你还是有基础的,废话太多了,来了,接住:
#对于2>因为r=p+q 若知道其二则知道其三
二次型正定的必要条件:
①aii>0 ②|A|>0
这个可以用正定二次型的定义du来解释。以三元zhi二次型为例,dao对于不全为零的x1,x2,x3来说,二次型的值必大于零。这里可以令x2,x3为零,二次型只剩下a11*x1^2,所以a11必须大于零。同理可以推出a22,a33都大于零。
正定矩阵的前提:实对称矩阵3
实对称矩阵若相似必有合同 (因为具有相同的正负惯性指数) #前提是实对称矩阵啊!有举例说 两个矩阵相似但不一定合同,合同也不一定相似。之前考研的时候,就认为相似一定合同,没有考虑对象矩阵实对称的前提!!
与正定矩阵合同的矩阵也必为正定矩阵 #这些概念的证明,个人喜欢就去网上搜罗吧,个人不是太感冒,
单位矩阵的伴随矩阵是什么?
直接用伴随矩阵的基本性质,AA*=|A|E (E为单位矩阵)
则
EE*=|E|E
故E*=E
二阶矩阵的逆简单口诀求法:
是由“主对换,副变号”得到其伴随矩阵,还要乘上原矩阵的determinant A-1=1/|A| * A*
什么是行阶梯矩阵?①有零行必在其下方②往下连续的零依次增多
什么是最简行阶梯矩阵?在①②的基础上有③台脚起始元素为1,台脚对应上方全为0.
引用《线性代数的几何意义》的描述:“矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。”
概率论:
统计量与假设检验
区间估计:以u在某区间的概率 来估计u的值 分为两种情况 总体方差已知 和 未知
点估计:估计分布函数的未知参数
①矩法估计:以样本原点矩去估计总体原点矩(一般一阶就够了)得到位置参数的函数【样本均值=总体期望】#可以结合深度学习训练模型理解,利用统计学的方法得到最佳参数估计
未知参数的估计量大写,估计值小写,多做两题就清楚了
②最大似然估计:当α取和值时,X1取x1...Xn取xn的P{X1=x1,...,Xn=xn;α} 最大 步骤:①写出似然函数②取对数③求导另为0,若不可求导,根据定义发等... 还有一般求某参数的估计量(值)是间接通过求其它估计量 如P=e^a ,求P的估计量 就得先求 a 的估计量 #近年来常考答题,21年没考,考了一道多元函数变量的分布和求概率利用卷积公式的题,跪了,跪了,考前没复习好!大意了
切比雪夫不等式:一级运动员打一枪离期望应该不远 DX存在 n→∞ lim P{|X-/X<e|} ≥ 1-Dx/e^2 在证明 估计量的 选取标准 第三个性质 一致性(相和性的时候常用)
大数定理
样本足够打的情况下 说明 样本随机变量 的 期望 依 概率 收敛于 样本均值的期望
①切比雪夫大数定理 两个条件 ② 辛勤大数定理 三个条件 【注】:如何识别考察的是大数定理
列维-林德伯格 :条件 :独立 同分布 且EXi DXi 存在 (“缺一不可”) 独立同分布随机变量的和 近似服从正态分布N(nu,na^2) 【要理解且会推】
棣莫弗-拉普拉斯定理:由列维-林德伯格 中心极限定理可推
“随机变量的期望存在,则方差不一定存在。但方差存在,则期望一定存在。”
方差、标准差和均方根误差的区别总结#
:那么问题来了,既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢? 原因是:方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。
数列收敛和级数收敛区别:
1、项数不同:数列收敛是N项是有限项之和收敛,而级数是无穷项之和收敛。
2、意义不同:数列收敛是指Un的极限LimUn存在;级数收敛是指Sn的极限LimSn存在。
联系:级数是指将数列的项依次用加号连接起来的函数。级数的每一项数列都收敛那么该级数收敛
数学三大法宝:肉眼观察,显然成立,暴力代值
密度均匀为常数时,质心就是形心,密度不均匀时,只有质心,没有形心
非齐次线性方程组:常数项不全为零的线性方程组。AX=b 常数项是b
调和级数(英语:Harmonic series)是一个发散的无穷级数。
做题的一些思想:
数学大题第二问遇到瓶颈了注意第一小文结论!!!!
时刻问自己这题考察什么,想考察什么!!!(思想非常重要)凡是看到函数都要看一看它的奇偶性!!!事半功倍!!!
函数单调递增还应该考虑到y=tanx这种特殊的图
一些特殊值:
根号2=1.414... (3)^(1/3)=1.44....
极限里面的 因式有(e^x-1)(a^x-1)都要上心啊~~ a^x-1 ~xlna
三角锥体的体积:Vtriange=1/3*S*h,椭圆体积=4/3*(Πabc)等边三角形面积公式:S=((√3)/4)a²
tanx的导函数是什么?什么函数的导函数是tanx?①sec^2x=1/(cosx)^2②-ln| cosx | + C内积- 内积 (inner product) 又称数量积 ,(scalar product) 点积 、(dot product) 他是一种矢量运算,但其结果为某一数值,并非向量。
矩阵的秩及其求法 Address: https://wenku.baidu.com/view/7f3df2d9b0717fd5370cdc39.html
Taylor公式(泰勒公式)通俗+本质详解 Address: https://blog.csdn.net/qq_38646027/article/details/88014692
怎么判断它是0/0型未定式呢?积分上下限相等积分必为零 Address: https://zhidao.baidu.com/question/1176705626331413099.html
向量及向量的基本运算 Address: https://wenku.baidu.com/view/fd6011d87f1922791688e878.html
调和平均数,几何平均数,算数平均数,平方平均数 Address: https://blog.csdn.net/qixinlei/article/details/98184316导数是研究函数性态的基本工具!
最值定理:f(x)在[a,b]上连续,标签:函数,奇函数,矩阵,偶函数,正交,抽象概念,高数,向量,考研 来源: https://blog.csdn.net/weixin_43332715/article/details/112383581