SPSS软件数据中心化、标准化和归一化
一、中心化
意义:数据中心化和标准化都是为了减小由于量纲不同、自身变异或数值差异较大所导致的结果的误差。
首先描述项将指标添加,并于选项出选中平均值即可。
第二步:构造新变量:互联网普及率评价和计算机服务业就业容纳力【平均值减去观测值】
第三步:对所有变量作描述性统计
发现新变量平均值为0,因为所有观测值均减去了均值,但方差未改变。
二、标准化
目的:去除量纲,减小误差。原理:观测值减去平均值再除以标准差,使得到的值服从0-1标准正态分布。
其中,Xi为观测值,u为均值,σ为该列指标数据方差。
三、归一化处理
目的:去除量纲,将数据缩小,便于处理。(又称离差标准化)
以数字普惠金融指数为例,调出计算变量项目,利用统计函数得到归一值【值得一提的是用max或min函数只能比较两列指标大小值,无法用于乘除加减计算】
别忘了在分母处加括号