Z-score(Z值)的意义--转载
在进⾏空间数据分析的时候,
很多结果都是基于 Z-score 和P-score 的。
P值 我⼤概明⽩,指的是最终数据落到这个区间的可能性。但是Z 值到底是什么⼀直不明⽩,
⽽且这玩意还对应着⼀张表,查了这个还要查正态分布图,搞得我⼀直都很晕
⽹上查,也仅仅给出了Z值的计算⽅式,或者⽞乎⼜⽞的统计学意义让我更晕
今天终于明⽩啦!
Z值只是⼀个临界值,他是标准化的结果,本⾝没有意义,有意义的在于在标准正态分布模型中它代表的概率值。通过查表便可以知道。
举个例⼦来说
⼀个班级有100个同学
那么我们就有了100个智商值。从60 到180 不等
假设平均值(mean)是90
那么有的⼈是60,有的⼈是110.和平均值的差值 平⽅再开⽅就是 ⽅差(Variance)⽅差可以帮助看出来这个⼈离平均值有多远,差距有多少但是如果数量很⼤的话数据就不好计算了
⽐如,⼀个⽅差5 ⼀个⽅差10 还有⽅差20 的太⿇烦
这就引⼊ Z 值
Z值就是⼀个衡量⽅差的标准 或者说是 单位(unit)在这个例⼦中,⽐如,我们设定单位是10那么⽅差5的同学,Z score 就是 5/10=0.5⽅差10 的同学 Z score 就是1⽅差20的同学就是2
然后我们⼜知道最⼤的是10这就很好标记
这就是为什么要有⼀个Z值表对应正态分布的原因
只看Z值是没有意义的,每个例⼦中 单位(unit)不⼀样在正态分布这个情况下,其实单位已经给定义好了所以只要知道Z值, 就可以知道这位同学的⽅差啦也就相当于知道了这位同学的智商距离平均数有多远
实例:
某次期中考试,⼩明数学考了112,英语考了108.那么他的成绩好么?他的数学成绩好还是英语成绩好?已知全市数学平均成绩是 108, ⽅差21 , 英语的平均成绩是97,⽅差18通过求Z 值和查Z值表,我们可以得知
⼩明的数学成绩 在全市成绩的排名是57.53%, 英语成绩是72.91%所以他的数学成绩中等,英语成绩⽐较好。