如何用excel做数据分析?——九数云 | 帆软九数云

九数云BI小编 | 发表于:2023-03-09 8:57:47

前提:明确目的

用excel做数据分析的一定要知道分析方向和目的,一切数据分析都是以业务为核心目的,而不是以数据为目的。

数据用来解决什么问题?是进行汇总统计制作成报表?是进行数据可视化,作为一张信息图?

是验证某一类业务假设?是希望提高某一个指标的KPI?

1、提出问题

2012到2015年的销售额的变化趋势?反映了什么样的销售规律?

总销售量前三的产品是哪些类别?各自占比?

男、女婴儿的占比?

什么年龄段的婴儿购买量较大?

2、理解数据

理解数据中各字段的含义以及字段记录的信息,是非常重要的。

用excel做数据分析的过程中常用的数据类型主要有:字符串、数值、逻辑。

注意:字符串形成存储的数值,属于字符串类型。文本类型不能计算,只有转换为数值类型,才能计算。

3、数据清洗

(1)数据检查

选择子集:

若是直接操作原始数据,对不需要的字段进行隐藏,对于数据尽量不要删除,不需要可以隐藏。此处,因为不直接操作原始数据,选中数据分析中所不需要的数据字段,做删除处理。

(2)列名重命名

将英文字段转换成我们习惯的中文字段,方便理解、查看,便于后续用excel做数据分析。

注:最好直接将英文字段修改成中文字段,此处演示只是为了方便对比。

(3)数据类型转化

日期数据处理:对于存在的不规则日期、时间数据,先转换成统一格式。

有时候,需要用到分列功能。

(4)数据去重

根据分析目的不同,也可以不做去重处理。是否执行去重操作,具体看分析业务需要!

(5)缺失值处理

缺失值的主要处理逻辑有:填充数据和删除数据。至于选择填充数据还是删除数据,根据数据量和业务需求而定。若数据量较多,且删除不影响数据分析,就删除。若数据量较少,建议选择填充数据。

(6)数据排序

本案例按“降序”排列。

(7)异常值处理

a、表2 婴儿信息表中,“出生日期” 字段,通过筛选或升序排列,可以发现,有婴儿“出生日期”为:1984-06-16,与当前表中数据有明显差异,做删除处理

b、表2 婴儿信息表中,“性别”字段,通过筛选发现婴儿性别出现2,可能是用excel做数据分析时数据统计出错,考虑到当前数量较大,异常值仅仅占极小一部分分,故进行删除处理。

热门产品推荐

九数云BI是一个人人都可轻松上手的零代码工具,您可以使用它完成各类超大数据量、超复杂数据指标的计算,也可以在5分钟内创建富有洞察力的数据看板。企业无需IT、无需大量资源投入,就能像搭积木一样搭建企业级数据看板,全盘核心指标综合呈现,用数据驱动商业决策。

随时随地在线分析

现在注册,即可领取15天高级版免费使用,体验数据扩容、自动化数据预警、 每日定时更新等20+项强大功能
立即使用