数据清洗、数据预处理工具怎么使用—九数云
当数据量少的时候,我们还可以手动修改调整一下。数据量大的时候,就不得不借助数据清洗工具、数据预处理工具来进行批量处理。
九数云-数据清洗、数据预处理工具
九数云是帆软软件的一款SAAS BI产品,是一个零代码的在线数据分析工具,能帮助各行各业的人员快速地进行百万级别以上的数据分析,并搭建各类报表系统。就数据清洗来说,九数云提供了一系列便捷功能,帮助分析者快速完成数据预处理工作:
1)删除重复数据
进行数据清洗时,我们首先最容易遇到的是“数据重复”问题。例如,业务员重复提交数据、多人记录同一条数据......这些原因都造成数据表里有重复数据,最终的数据中我想要删除重复的数据,想根据 ID 和负责人的信息,一个公司只留下一条信息。
对此,可以使用数据预处理工具——九数云:对于字段较少的场景,我们可以使用【分类汇总】功能,按照我们想去重的字段进行分类即可。字段较多时,可以直接使用【删除重复数据】快捷功能。
2)修改表格数据
分析前,如果我们发现数据有误,那么怎么修改呢?如果是自定义表格、上传的excel和csv数据,可以在九数云数据源界面上直接进行修改。修改/删除单元格数据、删除行数据、新增行数据......
如果是数据库数据、API接口数据、企业数据,则需要新建一个分析步骤流程,通过分析步骤去修改数据。
3)行列转换
九数云提供行转列、列转行、字段拆列、字段拆行等功能。行列转换的意义是将一维表和二维表相互转换,转换成更容易分析的状态。拆行拆列则是
- 一维表:也常被称为流水线表格。一般有固定的列名,平常输入数据只需要一行一行的添加即可。
- 二维表:是一种关系型表格,通常数据区域的值需要通过行列同时确定。更符合我们日常的阅读习惯,信息更浓缩,适合展示分析结果。
4)自定义赋值
有的用户想对基础数据进行加工后存储,可以使用九数云的自定义赋值功能,支持分类赋值、条件赋值、累积值等等。例如,用户想将省份按照大区进行分组:
将「山东省、江苏省、江西省、浙江省、安徽省、福建省、上海市」归为一类,赋值为“华东”;
将「河南、湖北、湖南」归为一类,赋值为“华中”;
将「河北、山西、内蒙古、北京、天津」归为一类,赋值为“华北”;
以上就是关于数据清洗工具、数据预处理工具——九数云的一个简单介绍了。除了数据清洗功能,九数云还提供强大的数据分析、图表制作、报表制作、故事板、数据大屏等功能。欢迎大家来体验!
上一篇: 一文教会你如何用九数云进行销售报表分析!
下一篇: 库存分析怎么做?教你一个好用库存分析方法—九数云