干货!在线数据统计分析步骤详解——九数云

标签: 在线数据统计分析 | 发布时间: 2023-03-07 9:00:00

数据分析是收集数据、分析数据,使之成为信息的过程,可帮助人们做出判断。在线数据统计分析的具体步骤是如何进行的?

以下是在线数据统计分析的步骤,以excel为例

1 .明确问题

进行在线数据统计分析前,首先要明确问题。

2 .理解数据

根据研究问题采集相关数据查看数据集信息(描述统计数据、字段含义),清楚在线数据统计分析中数据的具体含义。

3 .数据清洗

在线数据统计分析中数据清洗包括:

选择子集(列隐藏,尽量不删除;全选表格-开始-格式-隐藏和取消隐藏)

列名重命名(双击列名单元格修改)

删除重复值(数据-删除重复项-取消全选-勾选列-确定)

缺失值处理(通过查看列对应的计数判断)

通过人工手动补全(选中列-开始-查找和选择CTRL+G-定位条件-空值-输入一个,按Ctrl+Enter)

删除缺失值,用平均值代替缺失值/用统计模型计算值代替缺失值。

一致化处理分列(点击列号-复制-最后一列后空白列-粘贴;数据-分列ALT+A+E-分隔符号)

文本转为数值截取字符串(find/left/right/mid函数)

字符串形式数字转换成数字类型( 插入-复制-选择性粘贴-数值-分列)

数据排序(选中列-开始-排序和筛选ALT+H+S-降序-扩展选定区域)

异常值处理数据

透视表原理:数据分组(split)应用函数(apply)组合结果(combine)应用(插入-数据透视表ALT+N+V-新工作表-拖拽行/列/值-行标签-其它排序选项-降序排序-计数项-插入函数IF判断是否包含关键字筛选数据)。

4 .数据分析或构建模型

以工作城市职位数的在线数据统计分析为例:

(插入-数据透视表-行(城市)-列(工作年限)-值(城市)-城市-其它排序选项-排序降序-计数项-总计列任选一单元格-右键-值显示方式-列汇总的百分比)。



上一篇:
下一篇:
相关内容