其他分享
首页 > 其他分享> > 统计学笔记

统计学笔记

作者:互联网

相关系数:
当一个变量发生变化时,另一个变量如何变化。相关系数是反映两个变量之间关系的量化指标。值域范围-1到1。反映变量发生变化时,变化的方向是相反的还是相同的。如果相同,则是直接相关或正相关。如果相反,则是间接相关或负相关。讨论的是一个群体在两个变量上的表现,而不是特定的个人。相关系数的绝对值反映相关强度。相关系数用r表示,r的下标表示相关的两个变量,如rXY表示变量X与变量Y之间的相关系数。如果一个变量的值不发生变化(如年龄都相同,那么年龄就不能算为变量),那么两个变量之间不相关,相关系数为0。如果对两个变量之间的关系很感兴趣,就尽量收集充分的离散数据,这样才能得到最具代表性的结果。
如何计算简单的相关系数:
计算公式见QQ。将一个变量的变化解释为由另一个变量引起的。实际上,接近.70和.80的r值可能就是你看到的最大值了。
相关矩阵:计算一系列变量两两之间的
相关系数,在excel中可以使用data toolpak。
如何解释相关系数的值:
见QQ。
决定系数:相关系数的平方。为了确定一个变量的方差可以被另一个变量的方差解释的程度。两个变量共享的特征越多,共享的方差越大,一个变量可以更多地解释另一个变量表示出的信息。
相关表示两个变量之间存在关键,但和因果关系无关,比如冰激凌和犯罪。

其他类型的相关系数:用于测量两个以上变量之间的关系,暂不做讨论。

测量的内容:信度和效度:
信度:我怎么知道我每一次使用的检验、量表和工具等能够测量我想测量的内容。如果你用来收集数据的工具是不可信或无效的,那么任何假设检验的结果都不会有结论。
独立变量:不同速度的实验曲目
依赖变量:研究者想要观察的在一定试验条件下可能发生变化的变量。愉悦度、紧张度、喜爱度。
定类(了解一些人富裕一些人贫困)、定序测量水平、定距、定比(准确地知道每一个人收入的多少)。任何的测量结果都能够归属到四个测量尺度中的某一个。
信度系数:值域为.00到+1.00。误差越小,信度就越高。在进行测试时,我确保对所有题项的设置都是标准化的。增加项目或者观察的数量。去掉有歧义的项目。调整测试的难易度。减少外部事件的影响。建立具备合理的心理特征的测验工具的第一步是建立信度。

信度的不同类型:再测信度(一个测试在不同时间是否可信。计算时期1和时期2相同测试的两次值之间的相关系数。被试内在的一致性)、评分者信度(被试之间的一致性。对一个观察结果的评价是否具有一致性。检验不同评分者一致结论的百分比。例如,最佳着装足球运动员的不同评分者信度是.91,表示不同裁判的一致程度很高)。你必须确保你测量的内容是以可信的方式测量的,这样你得到的测试结果才可能与每个个体每个时间的值更接近。
每个范畴的得分在1(悲伤)到5(快乐)之间。

效度:可重复性。观察值=真实值+误差值。误差来源的原因可能是外界某些因素。我们的工作是尽量减少误差,从而增加信度,使观察值能和真实值更匹配。即:误差越小就越可信。
建构效度:是基于测试或测量背后的基本的结构或概念的。如果你没有得到你想要的效度证明,这是由于你的测试没有测试到你要测试的内容。如果你关注准则效度,你可能需要重新检验测试的项目的性质,并且回答你期望人们的回答与你选定的准则之间有多大的相关程度的问题。如果你寻求建构效度并且不能找到,最好要认真思考支持你建立测试的理论基础。
第一是我测的是我想测的量,第二是我测得的程度,待测量对真值的代表程度。

无论一个测试,测试的是什么,都可以
重复进行,这就是信度。测试可能是可信却无效的,但有效的测试不可能没有信度。如果一个测试确实测量了要测量的内容,那么这个测试就必然能够实现一致的测量。效度的最大值等于信度系数的平方根。测试的效度受到测试的信度的局限。二者关系密切。与信度和效度密切相关的还有:
难度检验,同质检验(是否等价),主成分分析

基本的测量尺度:
100个人之间的一致性,结果的散点分布,有一个人严重偏离,冒出了野点,那么就应该去掉这个被试的数据,然后看其余99个人的数据的相关系数、胡相关系数、方差等来反应被试间的一致性。它们的根源都是方差,都是偏离程度,所以选哪个都行。
素材,对象的同质性、难度有点问题,导致不同实验对象之间的等效性,相关系数是最简单的方法。
再结合自己的主观判断,首先自己应该有一个判断,期望相关还是不相关,希望.7更大还是更小,进一步结合文献分析。
讨论的深度来自于对这个问题的理解程度,对文献的理解程度。

标签:变量,信度,相关系数,测量,笔记,统计学,测试,效度
来源: https://blog.csdn.net/qq_44250700/article/details/119347972