如何用excel做数据分析?——九数云
excel是数据分析的最基础的工具,它是日常工作中最常用的工具,在不考虑性能和处理数据量的情况下,用excel做数据分析完全可以应付大部分的数据分析工作。
前提:明确目的
用excel做数据分析的一定要知道分析方向和目的,一切数据分析都是以业务为核心目的,而不是以数据为目的。
数据用来解决什么问题?是进行汇总统计制作成报表?是进行数据可视化,作为一张信息图?
是验证某一类业务假设?是希望提高某一个指标的KPI?
1、提出问题
2012到2015年的销售额的变化趋势?反映了什么样的销售规律?
总销售量前三的产品是哪些类别?各自占比?
男、女婴儿的占比?
什么年龄段的婴儿购买量较大?
2、理解数据
理解数据中各字段的含义以及字段记录的信息,是非常重要的。
用excel做数据分析的过程中常用的数据类型主要有:字符串、数值、逻辑。
注意:字符串形成存储的数值,属于字符串类型。文本类型不能计算,只有转换为数值类型,才能计算。
3、数据清洗
(1)数据检查
选择子集:
若是直接操作原始数据,对不需要的字段进行隐藏,对于数据尽量不要删除,不需要可以隐藏。此处,因为不直接操作原始数据,选中数据分析中所不需要的数据字段,做删除处理。
(2)列名重命名
将英文字段转换成我们习惯的中文字段,方便理解、查看,便于后续用excel做数据分析。
注:最好直接将英文字段修改成中文字段,此处演示只是为了方便对比。
(3)数据类型转化
日期数据处理:对于存在的不规则日期、时间数据,先转换成统一格式。
有时候,需要用到分列功能。
(4)数据去重
根据分析目的不同,也可以不做去重处理。是否执行去重操作,具体看分析业务需要!
(5)缺失值处理
缺失值的主要处理逻辑有:填充数据和删除数据。至于选择填充数据还是删除数据,根据数据量和业务需求而定。若数据量较多,且删除不影响数据分析,就删除。若数据量较少,建议选择填充数据。
(6)数据排序
本案例按“降序”排列。
(7)异常值处理
a、表2 婴儿信息表中,“出生日期” 字段,通过筛选或升序排列,可以发现,有婴儿“出生日期”为:1984-06-16,与当前表中数据有明显差异,做删除处理
b、表2 婴儿信息表中,“性别”字段,通过筛选发现婴儿性别出现2,可能是用excel做数据分析时数据统计出错,考虑到当前数量较大,异常值仅仅占极小一部分分,故进行删除处理。
上一篇: 一分钟!掌握数据图表在线制作——九数云
下一篇: 九数云教你几分钟搞定产品销售报表