excel数据去重:海量数据删除重复项原来只需要两个步骤
很多人在使用Excel删除重复项时经常出现的问题,九数云是如何轻松解决的?
在excel分析数据时,最头疼的莫过于数据清洗。数据清洗作为数据分析全过程的必要步骤,会占据分析过程的50%—80%的时间,其结果质量会直接影响模型效果和最终结论,而删除重复数据(excel数据去重)往往是数据清洗的第一步。
提到删除重复数据,一般都会想到利用Excel来处理,常见的处理的方式大概有三种:公式、删除重复项、高级筛选。然而,在使用Excel时很容易出现很多变数。删除重复数据时“如何迅速汇总海量表格,将步骤化繁为简”成为人心所向,九数云功能之一就此应运而生。
下面小九就很多人在使用Excel删除重复项时经常出现的问题,谈谈如何用九数云轻松解决。
Excel数据去重
用户在使用Excel时会遇见很多问题
- 汇总庞大的数据,,只能一一复制粘贴众多表格,还没进行到删除重复项的步骤,电脑早已严重卡顿。
- 某些数据有多个不同的值,无法选择第一项或者最后一项。
- 设置删除重复项的比较列时少选择了几列,导致误删数据。一步错步步错,发现筛选结果出错后只能从头再来。
- 版本低的Excel有时候用删除重复项和高级筛选功能达不到目的,只能利用公式:
-
- 用COUNTIF函数得出结果时,再筛选提取次数为1的数据实在太麻烦;
- 想用UNIQUE函数优雅地删除数据,发现自己版本不支持;
- 零基础小白想学习用普通数组函数提取,却只能看着公式缓缓打出一个问号。
九数云数据去重
跳过由excel数据去重,因为海量数据导致卡顿的“环节”,在九数云依次上传需要的表格后,就可以正式开始丝滑删除重复数据了。
1. 删除整行重复数据
01 点击示例表「重复数据>分析表」,选择「确定」创建分析表。
02 选择全部字段,然后点击「+」。
在「更多」中添加「删除重复数据」分析步骤,就可实现效果。
03 删除完重复数据后会自动进入预览界面,可以看到数据从40条变成了27条。
2. 部分字段去重计数
在使用Excel批量删除重复项功能的时候,往往只会保留第一条不重复数据。但倘若我们需要的是最后一条不重复数据,就南辕北辙了。
举个例子,公司名称存在重复记录,需求是保留有公司全称的数据,这时用Excel筛选就不太方便了,因为不能自由选择项。
九数云可以去重保留第一项或最后一项,在正常删除重复数据后,将需要的字段从「分类」拖拽到「汇总」,再选择你要的项,就可达到部分去重计数的结果。
3.更新源数据自动完成数据清洗
后续不想进行重复的步骤,可以点击「更新Excel」,上传新的表格后九数云将会自动复用你上次的操作。
总结
在处理少量数据时,Excel凭借其强大的基础功能和容易上手的操作性,在数据分析领域占有绝对的统治地位,大多数用户想要删除重复数据也会第一时间想到它。但对海量数据进行数据分析,Excel数据去重就因操作严重卡顿影响效率而失去优势。
九数云简化了Excel数据去重步骤,并且相较于Excel的一次性分析模式,作为自助式BI的九数云能解放用户的双手,提供一种一劳永逸、事半功倍的数据分析模式,即同样的分析模式制作一次,后面都可以复用。当用户的表格更新,需要再一次删除重复数据时,要做的只是简单地动动手指,上传Excel更新数据,然后等待九数云自动清洗数据即可,极大地提高了用户的效率。
上一篇: 什么是购物篮分析?购物篮分析的三个指标是什么?
下一篇: 不要只会用Excel数据可视化,大神们都在用九数云、简道云