Excel数据分析学习笔记(五)数据的清洗和加工
**
第四章 数据的清洗和加工
** **
1,数据清洗
** 目的:将多余的、错误的数据清洗出去,留下有价值的数据。
1)删除重复项的方法: ① 单击【数据】选项卡下【数据工具】组中的【删除重复值】,设置删除列。 ② 根据人名排序,找到重复值,进行人工排查是否重名,然后进行删除。 ③ 选中某一列数据,选择【开始】选项卡下【条件格式】下拉菜单当中的【突出显示单元格规则】选项,再选择【重复值】选项。
2)处理默认值的方法 ① 找出默认值。大多数情况下默认的数据会以空白单元格显示。使用【Ctrl+G】组合键打开【定位】对话框,单击【定位条件】。设置定位条件时选中【空值】按钮,然后查看结果。 ② 处理默认值: 替换。可以用平均数、回归分析之后的数据模型,还可以通过查找其他资料将其补上。 删除。当样本充足时可以删除包括默认值在内的一组数据。 忽略。当样本量足够大时还可以选择忽略默认值。 ③ 深度检查数据逻辑 使用IF函数进行检查,其语法为IF(logical_test, value_if_true,value_if_false) 使用条件格式进行检查。可以判断数据是否处于某一正常区间内。选择一定的区域,【开始】选项卡当中的【条件格式】下拉菜单当中的【突出显示单元格规则】,再选择联级选项当中的【大于】选项。 ⚠️注意 不要忘记检查格式!!! 检查格式的方法:在【开始】选项卡下【数字】中对选中的数据进行查看,必要时打开【设置单元格格式】,调整数据格式。
**
2,数据加工
** 目的:数据加工可以增加数据表的信息量,改变数据表的表现形式,以激发更多的数据分析思路,发现更多有价值的数据信息。
1)数据计算 使用常用的函数,计算项目的乘积、和、平均数、众数、中位数。 对函数的命名方法要熟悉,例如A1单元格到B6单元格区域的命名方法是“A1:B6”。Excel的【公式】选项卡提供了常用函数的快捷插入。 对于一些不常见的函数,打开【插入函数】对话框,可以根据函数类型进行查找,确定公式类型之后根据对函数的描述来确定是否是自己想要的函数;如果无法确定所需要的函数需要哪个类型,输入到函数描述,单击【转到】按钮,根据推荐函数描述确定是否为所需要的函数。
2)数据转换 ① 行列转换,可以使用【选择性粘贴】当中的【转置】 ② 记录方式转换:分析数据规律—>选择目标形式—>思考:不符合形式的数据应该如何改进—>找到替换的方法 ③ 按【Ctrl+H】组合键打开【查找和替换】窗格
3)数据分类 通过一定的标准将项目归到不同的组别,从而判断数据的表现状况。使用VLOOKUP函数,该函数是一个纵向查找的函数可以用来返回数据所在分组的名称。 该函数的语法是VLOOKUP(要查找的值,要查找的数据表区域,返回数据在查找区域的第几列数据,模糊匹配或精确匹配) 有时会在要查找的列表区域输入 表 示 绝 对 引 用 , ( 格 式 : 表示绝对引用,(格式: 表示绝对引用,(格式:$E 3 : 3: 3:$F$6)以保证在向下拖动复制公式时该区域保持不变。
拓展阅读: https://m.toutiao.com/is/dxMeKmL/ 它才Excel函数中的NO.1,vlookup函数十大用法详解,高效完成工作
4)数据重组 ① 拆分:使用Excel中的【分列】功能。 ② 合并:v& 逻辑连接词,表示让数据合并显示,例如A4&B4 TEXT 将数据转化为文本格式 CONCATENATE 将单元格数据内容合并显示文本 ③ 数据抽取 从一列当中抽取部分数据:使用LEFT函数,从文本字符串的左边开始,返回指定个数的字符。或者使用RIGHT函数,表示从字符串的右边开始截取指定个数的字符。 从多列当中抽取部分列:可以使用vlookup函数