数据分析师是干嘛的?一篇文章带你了解——九数云

标签: 数据分析师是干嘛的 | 发布时间: 2023-07-12 16:25:16

随着大数据的发展,数据分析师成为一种高新热门职业,那你知道数据分析师是干嘛的吗?下面让小九告诉你

第一部分——产生数据

数据分析师是干嘛的?首先是产生数据,这里所说的产生数据,并非做开发或做数据采集。而是每当业务上有新的功能点需要开发上线的时候,数据分析师需要围绕着这些功能会产生那些业务变化、功能上线的目的是什么、上线之后该衡量效果等一系列问题.在功能上做好数据的埋点,以及可以衡量最终效果的指标。这样当功能上线的时候,你才可以快速地衡量业务效果。

1. 数据分析师是干嘛的:指标设计

什么是指标设计?对于指标的概念相信大家都有所了解,对于一款 app 常见的指标包括每日活跃用户数、次日留存率、七日留存率等等,这些指标主要是在 app 层面的指标,一个 app 下面还会有很多不同的功能模块,运营也会经常推出不同的活动,每当产品或运营上新功能或新活动时,数据分析师需要去确定该用哪些指标去衡量这些功能或活动的效果,以及如果后续要做一些更深入的分析,还需要考虑设计一些更深层的指标,这些都是属于指标设计的范畴。

下面是数据分析师需要知道的数据指标:

数据指标分为:用户数据、行为数据、业务数据。

1)用户数据指标:新增、活跃、留存

  • 新增用户数:产品在一定时间内新增的用户数,根据不同渠道新增的用户,判断各渠道引流效果
  • 活跃用户数 DAU :产品日活跃用户数量,同一设备记录一次,去除重复用户,衡量产品用户粘性,明确产品用户体量,判断产品是否成功的重要指标
  • 留存用户数:通过渠道新增的用户,经过一段时间后有部分流失,剩余留下的就是留存用户,按时间分为次日留存、7日留存、30日留存等,反应不同时期新用户的流失情况,评估用户粘性

2)行为数据指标

  • PV :在一定时间内,产品的点击量,同一个用户点击多次都计入统计
  • UV :访问人数,即独立访客,一定时间内,产品的访问用户数,一个用户多次访问只记录一次·点击率:页面上某一内容点击与显示次数比,反应内容的受关注度,多用于广告
  • 完成率:完成与开始操作次数比,衡量操作的流畅度,产品设计中重要指标之一,完成率越高,产品的操作体验越好,直接影响用户体验
  • 跳出率:只访问首页与总访问量比,衡量内容的重要指标
  • 平均访问页面数:一段时间内,用户访问页面数的平均值,衡量用户访问深度,值越大,用户粘性也越高,
  • 平均停留时长,每次访问到离开的的时间平均值

3)业务数据指标

  • GMV :商品成交总额,包含付款、未付款及退款,衡量平台的交易量
  • 转化率:达成目标用户数与进入页面目标数之比,与具体业务相关,衡量产品盈利的重要指标,
  • NPS 净推荐值:口碑,是一种统计用户将会向其他人推荐某个企业或产品可能性的指数,用户满意度指标,直接反应用户对产品的忠诚度

2.数据分析师是干嘛的: 数据埋点

通俗的来讲,就是互联网公司收集用户行为数据的一种手段。在确定好指标后,分析师下一步需要思考我要收集哪些数据才能计算出所需要的指标?为了收集这些数据,我需要在 app 的哪些位置埋点?

数据分析师是干嘛的?一篇文章带你了解——九数云插图1

埋点一般会分成2种,【业务埋点+监控埋点】:

1)【业务埋点】

就是预先在用户可能操作的"点",埋下上报的代码,一旦用户发生了操作,我就上报该用户操作的详细信息

举个例子比如:

进入某个界面,客户端上报" xx 用户进入了 xx 页面",离开时再上报" xx 用户离开了 xx 页面"本质上是跟踪用户的行为,用户什么时候打开了应用,点击了哪些标题/功能入口/广告,逗留了多长时间,这就是所谓的大数据了,可以分析出用户对什么样的内容感兴趣,从而更精准的向用户推荐内容。

即使用户不操作,也会触发上报,举个例子比如:

"进入了 xx 页面 n 秒钟没有操作"。

要说明的是,这种埋点和具体你用哪种开发语言无关

数据分析师是干嘛的?一篇文章带你了解——九数云插图3

2)【监控埋点】

这种埋点不是给产品和运营分析用户的,是让开发/运维对自己的程序有个更精准的认识。

举个例子比如:

  1. 定时采集服务器的 cpu 负载,内存占用情况, io 负载, java 的 gc 信息
  2. 程序执行某个功能的耗时,进行远程调用时的耗时
  3. 程序在一段时间内捕捉到了哪些异常
  4. 在一段时间内,远程接口的平均响应时间,请求次数,成功返回次数,失败次数,超时次数等等

数据分析师是干嘛的?一篇文章带你了解——九数云插图5

这种埋点有助于开发、运维分析程序的性能问题,监控程序的健康程度,提早进行异常的告警。

这样的埋点称为 metric , grafana就是一款很优秀的开源的 metric 监控,你只需要定时把埋点数据提交给它,可以查看各项 metric 的统计曲线,并设定告警规则,当某个 metric 达到告警阈值,可以通过邮件、短信、即时通信程序( IM )向你推送告警信息。

由于这样的埋点对业务代码有很严重的侵入,所以很多公司会开发通用的埋点框架,采用反射等方式进行运行监控。

那埋点的最基本流程是?

埋点就是通过植入一段代码到某个页面或某个按钮,从而监听用户行为并进行收集上报。

第1步【埋点采集】:通过部署埋点,收集数据。

第2步【数据传输】:将埋点收集到的数据,进行传输。

第3步【数据存储】:定义数据存储的库,如果数据量较小建议采用 mysql , oracle 等关系型数据库;数据量较大,建议采用 hive , hbase 等分布式数据库。定义好数据存储的表结构,属性尽可能采集全面。

第4步【数据统计】:根据业务需求进行 etl 开发,输出业务所需的数据。

第5步【数据应用】:业务人员验证和使用数据。

3.数据分析师是干嘛的:报表建设

在埋点开发完毕后,用户的行为数据就会被上报到数仓中,还记得在指标设计阶段我们定好的指标吗,数据分析师在这一阶段的工作就是对埋点上报的原始数据进行加工,计算出所需要的指标,并根据不同的主题用一张张不同报表将数据储存下来方便以后使用,在这个阶段会大量使用到 SQL 。

4. 数据分析师是干嘛的:  看板建设

报表建设完毕后,最后一步分析师还需要将这些数据展现给业务方。因为业务方的需求可能多且杂,如果每次需求分析师都写 sql 跑数的话会很浪费时间,所以一般会将一些常见的查询需求使用自动化看板的方式展示出来,这样大部分的数据业务方可以自行到看板上查询解决,会大大节省数据分析师的跑数时间。

数据分析师是干嘛的?一篇文章带你了解——九数云插图7

第二部分——提供数据

数据分析师是干嘛的:数据提供

提供数据可能是作为一个数据分析师每天都要做的事情,甚至有时候大半天都在做这件事情。数据需求的来源是多方的,各种业务方以及产品经理。如果产品和运营的人数比较多,这些需求就会让分析师比较头疼,一个分析师可能会对接10+的运营和产品。

对于这种情况,数据分析师一是要学会收敛产品和运营的数据需求,比如需求可以统一先由一个人收集整理,定期提出;或者对于常见的需求,可以做成看板的形式让运营和产品自己去取数。二是要能够评估需求的收益和优先级,有些时候运营和产品可能会提一些不靠谱的需求,如果评估后觉得没有收益,可以考虑说明原因,然后直接拒绝掉这些需求。


第三部分——解释数据

撰写数据分析报告可以说是数据分析师最核心的工作,是数据分析师核心价值的体现,常见的报告包括以下3种:

数据分析师是干嘛的: 数据摸底:

在某某功能或某某策略上线后,数据分析师通常要对功能或策略的表现情况进行一次整体的复盘评估,并尽量根据数据现状发现一些可以深入分析的问题,留待后续分析。

数据分析师是干嘛的:指标波动:

某某指标下降 or 上升后,分析下降或上升的原因。

数据分析师是干嘛的:主题分析:

针对不同的业务主题进行分析,不同的业务分析的主题也会不同,范围非常的广泛。常见主题包括比如增长分析、内容分析、新用户承接分析、流失分析等等,这些主题可以是业务方向你提出,也可以是你通过观察数据自己发现问题自己分析,自主探索是一名优秀的数据分析师应掌握的能力。


第四部分——探索数据

数据分析师是干嘛的:数据探索

光有解释数据是不够的,因为数据分析并不是解决能看出来的问题,还要能提出发现解决一些探索性的问题

这里举一个例子:某宝店铺销量下滑原因分析?

分析某宝销售额下降的原因首先我们知道:销量=下单数*(1﹣订单取消率﹣退货率)

通过这个公式就可以把销量用【下单数】、【订单取消率】、【退货率】三个维度去量化。

  • 下单数=咨询数*(1﹣咨询流失率)+浏览量*(1﹣浏览流失率)
  • 订单取消率=支付取消数/下单数
  • 退货率=订单退货数/已支付订单数

因此又会引出【咨询流失率、浏览流失率、支付取消数、订单退货数】等多个衡量指标,经过这样一层一层公式化的量化,找到那些"不可分割的指标",进而发现本质的问题所在。

探索数据通常是一个长期的比较大的项目,探索数据并不存在一个标准的答案,也通常可能是几个月出不了一个好的结论。


第五部分——影响数据

数据分析师是干嘛的:影响数据

一个业务问题问如何分析,如何提升?例如我们如何分析短视频的数据效果不好,是推荐流没有好的内容还是推不出好的内容?

①从供给情况和消费情况分析推荐流内的数据情况,如发布时间、播放量分层等,得到推荐流内的总体情况

②从高粉 up 主的稿件消费情况看是否被消费

③查看被消费高的稿件内容情况

④得出一些用户喜欢的短视频稿件特征,与运营和算法沟通,进行 A / B Test,向一部分用户多推荐这种内容,看数据效果是否提升明显( A / B Test:将评估对象随机抽样成两组,一组是对照组,一组实验组。针对实验组施加策略干预,比较两组之间的效果。)

A / B Test 是为了探索更好的方向,更受用户喜欢的功能。

数据分析师是干嘛的?一篇文章带你了解——九数云插图9

通过数据论证可以说服业务方听询数据分析师的意见。

推送的消息文本应该怎么发?发给几个实验组看看效果?这个按钮应该设计成什么颜色,配上什么文字?

多设计几套,上线几个不同分组看效果。通过不断的 A / B Test ,数据分析师会更好的辅助产品的迭代,影响数据的产生。

能通过数据来探索更好的方向,去"忽悠"影响业务!


数据分析师的真正职责是通过使收集的数据具有洞察力和易于理解,从而为公司增值,并为客户提供附加价值,帮助他们为业务做出明智的决策。

数据分析师是干嘛的?说白了,数据分析师和其他工作最终目的是一致的,为公司增值。只不过我们的工具是数据,其他工作则不同。



上一篇:
下一篇:
相关内容