深入解析网站日志流量数据分析:从系统日志到埋点日志的全面指南
文章目录5-网站日志分析案例项目回顾与点击流数据分析项目介绍
参考:
一、网站日志流量数据分析 1.背景:
在互联网应用里,日志属于非常重要的数据。因为互联网项目通常要求 7 乘 24 小时不间断运行,所以能够获取到监控系统运行的相关日志数据并进行分析就很重要。网站流量统计是改进网站服务的重要手段之一。通过获取用户在网站的行为数据并进行分析,就能得到有价值的信息,然后基于这些信息对网站进行改进。
2.日志种类
系统日志是开发人员在系统后台代码中添加的用于输出日志的语句。若使用 Java 语言,通常会借助 log4j 或 slfj 框架技术来输出一些日志语句。然而,这类输出信息存在局限性,不够全面,无法细致地将系统运行信息进行输出。
埋点日志:在现有的系统中集成相应的代码,对系统特定的事件进行捕捉,然后输出一些与之相关的信息。
3.分析指标
①PV(Page View)
访问量也被称作点击量,意思是在一天的时间内,整个网站里的页面被访问的次数,并且对同一个页面进行重复访问的话,也会被记为不同的 PV。
②UV( )
独立访客数指的是在一天之内访问网站的人数,并且需要注意的是,同一个人在一天之内即便多次访问网站,也只能被算作一个 UV。
③VV(Visit View)
会话总数指的是在一天之内会话的总体数量。一次会话意味着从访问第一个页面开始,会话就开始了,一直到访问最后一个页面结束,所有页面都关闭了,会话才结束。会话可以被认为是在访问第一个页面时开始的,当访问完所有页面并关闭,或者超过了指定的时长且没有后续访问时,就认为会话结束了。
④BR( Rate)
跳出率是一天之内跳出的会话总数占所有会话总数的比率。一个会话中只访问过一个页面会话就结束了,这就叫跳出。跳出会话占全部会话的比率被称为跳出率。此指标在评价推广活动的效果时很有用。
⑤NewIP
https://img2.baidu.com/it/u=3764661205,2481848534&fm=253&fmt=JPEG&app=138&f=JPEG?w=627&h=379
新增 IP 指的是一天内访问网站的所有 IP 去重后,那些在历史数据中未出现过的 IP 数量,也就是新增的 IP 总数,这个新增 IP 总数的指标能够在一定程度上体现网站新用户的增长情况。
⑥
新增独立访客数指的是,在一天之内访问网站的人群里,有多少人是在历史记录中未曾出现过的。此指标能够从另一个视角展现网站用户增长的状况。
⑦
一个会话的访问时长指的是会话结束的时间减去会话开始的时间。将一天之内所有会话的访问时长进行求平均值,所得到的就是平均访问时长,而这个指标能够体现出网站对用户的粘性大小。
⑧
一个会话的访问深度指的是该会话中所有源地址去重后计数得到的指标。将一天之内的所有会话的访问深度求平均值,就得到了平均访问深度。这个指标能够体现出网站对用户的粘性大小。
4.日志流量数据分析系统
二、点击流日志数据分析 1.点击流和网站日志
用户在网站上持续访问会留下轨迹,这就是点击流(Click )。大家都知道,用户每次访问网站都包含一系列点击动作行为,这些点击行为所产生的数据构成了点击流数据(ClickData),它能代表用户浏览网站的整个流程。目前获取点击流数据的方法有多种。其中包括通过 JS 来进行事件捕获,发布客户端应用以进行采集,还有对网站日志进行分析等。本文只是以网站日志分析为例来进行阐述。
点击流与网站日志是不同的概念。点击流从用户角度出发,注重用户浏览网站的整个流程。网站日志面向整个站点,包含用户行为数据、服务器响应数据等众多日志信息。我们通过对网站日志进行分析,能够获得用户的点击流数据。若想了解关于点击流数据更系统的解释,推荐阅读《点击流数据仓库》一书。
点击流数据是网站运营分析的重要数据依据。通过用户的点击流数据,能够进行诸如用户行为、用户忠诚度、用户价值、系统优化等多方面的分析。那么用户的点击流数据具体包含哪些内容呢?我们又该如何获取这些点击流数据呢?首先让我们来了解一下网站的构成以及用户访问网站所遵循的一些基本原理。首先,网站由多个网页构成。当用户访问多个网页时,网页之间是通过参数来标识上级网页的来源的。这样,我们就能确定网页被依次访问的顺序。其次,用户对网站的每次访问,可被视为一次会话。在网站日志中,会用不同的标识来唯一标识每次会话。结合之后,我们就能确定每个用户依次访问网站的网页顺序。若把 Page 当作“点”,那么我们便能轻易地将其描绘成一条“线”,即用户的点击流数据轨迹曲线。
2、点击流流程
点击流是指用户在网站上持续访问所形成的轨迹,会记录用户浏览站点的整个过程,且会形成点击事件。
3.原始数据样式:
4.页面点击流模型表
https://img0.baidu.com/it/u=3668435761,3626804940&fm=253&fmt=JPEG&app=138&f=JPEG?w=500&h=2126
为一个用户,用户对网站的每次访问。
5.点击流模型表
(按聚集的页面访问信息)
这是点击流模型。当 WEB 日志转变为点击流数据时,许多网站分析度量的计算变得简便了,这便是点击流的“魔力”体现之处。基于点击流数据,我们能够统计出诸多常见的网站分析度量。
三、如何进行数据分析
3. 上层是对数据的深入挖掘与解读,以得出有价值的结论和决策依据。
改善小说网站的运营,以获取更高投资回报率(ROI)。
1.网站流量质量分析
流量对于每个网站而言都很重要,然而流量并非越多就越好,我们应该更注重流量的质量,也就是说要关注流量能够为我们带来多少收入。
### 2.网站流量多维度细分
细分就是通过不同的维度来对指标进行分割,去查看同一个指标在不同维度之下的表现,接着找出存在问题的那部分指标,然后对这部分指标进行优化。
3.网站内容及导航分析
对于所有网站来说,页面都可以被划分为三个类别:
页:
[1]