统计学---数据的标准化

xiaoxiao2021-02-28  105

北京2017年中考科目有6门,其分值分别是语文120,数学120,外语120,物理100,化学80,体育40,总分580分。

那么问题来了,数学考了100分就一定比物理考了90分强吗?语文100分与外语100分的含金量是一样的吗?

我们假设拿到了10位同学的英语和语文成绩,如下表所示

序号英语语文11098521081083889541168451028069679789728100100972681088102平均分96.887.3

我们看到,英语100分,离平均值96.8较近,略高于平均分;而语文100分,离平均值87.3较远,且远高于平均分;因此同样是考100分,但各自的含金量是不同的,显然语文考100分的含金量更大。

我们假设再拿到了10位同学数学和英语的成绩,如下表所示

序号英语数学110911921081183888841167851026869699789115810010097291108892平均分96.896.8

2门科目的平均分是一样的,都为96.8,那么英语和数学都是100分的含义是一样的吗?

我们算一下英语和数学2门科目的标准差,英语科目的标准差是:12.29;而数学科目的标准差是:16.14。

前期的文章《统计学—掌握数据的整体状态》提过,标准差越小,代表这组数据的“离散程度”也越小,换句话说,比起数学,大家在英语科目上的成绩更为接近,也就是说,在英语科目中的1分价值更高,因为可能甩开更多的人,会大大影响排名。所以,在2门科目平均分一样的情况下,英语的100分比数学的100分含金量更高。

那么,结合平均值和标准差这2个指标,可以通过”标准化(standardization)”来比较2个不同种类的数值。其计算方法是:

=

我们算一下,语文、英语、数学3门科目都是100分时的标准计分: 三门课的平均值分别是:87.3,96.8,96.8;标准差分别是:12.69,12.29,16.14。

那么:

=10087.312.69=1.0 =10096.812.29=0.26 =10096.816.14=0.198

这说明同是100分,语文的含金量最高,其次是英语,最后是数学。

标准计分有2个特点:一是平均值为0;二是标准差为1。这个从上面的公式就可以推导出来。

有了标准化,满分100分和满分120分的科目就可以进行比较了;甚至数据的单位不同,也可以进行比较了。

转载请注明原文地址: https://www.6miu.com/read-50697.html

最新回复(0)