SPSS软件数据中心化、标准化和归一化

一、中心化

意义:数据中心化和标准化都是为了减小由于量纲不同、自身变异或数值差异较大所导致的结果的误差。

首先描述项将指标添加,并于选项出选中平均值即可。

第二步:构造新变量:互联网普及率评价和计算机服务业就业容纳力【平均值减去观测值】

第三步:对所有变量作描述性统计

发现新变量平均值为0,因为所有观测值均减去了均值,但方差未改变。

二、标准化

目的:去除量纲,减小误差。原理:观测值减去平均值再除以标准差,使得到的值服从0-1标准正态分布。

其中,Xi为观测值,u为均值,σ为该列指标数据方差。

三、归一化处理

目的:去除量纲,将数据缩小,便于处理。(又称离差标准化)

以数字普惠金融指数为例,调出计算变量项目,利用统计函数得到归一值【值得一提的是用max或min函数只能比较两列指标大小值,无法用于乘除加减计算】

别忘了在分母处加括号

经验分享 程序员 微信小程序 职场和发展