十分钟构建双十一交互分析大盘

news/2024/7/7 15:56:39 标签: 运维, 人工智能, python

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

提到双十一很多人第一印象是一张成交金额跳动的炫酷大屏,的确大盘在阿里双十一中几乎是每个团队标配,例如:

  • CEO看业务:把重要数据放到一张大屏上,简洁而有冲击力
  • 运营看效果:把多个指标放在一起,有利于综合分析定制投放策略
  • 开发看流量:服务请求延时,排队情况,掌握实时性能与动态
  • 监控看水位:集中监控整体服务的状态,有利于快速的做出响应

大盘方案选型

典型方案是流式计算架构:

  • 数据采集:利用Agent、API、SDK等采集各源头数据
  • 中间存储:利用类Kafka软件进行生产系统和消费系统解耦
  • 实时计算:环节中最重要环节,订阅实时数据,通过计算规则对窗口中数据进行运算
  • 结果存储:计算结果数据存入SQL和NoSQL
  • 可视化:通过API调用结果数据进行展示

在阿里集团内,有大量成熟的产品可以完成此类工作,一般可供选型的产品如下:

image.png | left | 827x392

对大盘进一步诉求

虽然前期做了大量准备工作,但运营、研发和运维等除了看大盘外,还会围绕整个活动的运行做大量工作,例如:

  • 运营对每个类目的细节,下单数目,用户量预期水平等进行大量分析,对某些用户群体激活和促销
  • 研发关注请求流量,用户延时体验,定位和分析各种原因
  • 运维分析系统的水位,查看各资源的分布,调度资源以确保稳定性

image.png | left | 827x187

从上述例子中可以看到,除了数据的呈现之外,我们需要对大盘融入“交互式分析”的能力。给大家介绍一种选择:通过日志服务(LOG,原SLS)一站式的查询分析LogSearch/Analytics API 直接对接可视化大屏。
​ 
大屏的选择可选方案有日志服务Dashboard,Grafana,Datav等,也可以通过API、JDBC接口对接自己的可视化大屏和第三方的软件(例如Tableua)。日志㐏对三种大屏提供了插件,只需在配置中直接使用SQL进行计算,并展示结果。

 交互分析平台支撑实时性定时刷新视图支持适合场景
日志服务DashboardPC丰富运维、运营、开发等
Grafana PC​ 一般时间序列数据场景
DataV PC​、移动端、大屏丰富适合于presentation场景
基于JDBC或OpenAPI自建可视化前端      

日志服务Dashboard主要面需要交互式分析的查询需求,例如发现错误时,需要下钻定位原因。跟踪到某个类目中查看细节,对比同比与环比数据。该方案有如下特点:

  • 实时性强

    • 从数据产生,秒级别即可在日志服务看到数据。
    • 动态刷新,秒级别即可计算出指标,展示在大屏上。
  • 秒级精度

    • 日志时间精确到秒级别。
  • 灵活查询

    • 使用SQL进行交互查询,可以进行探索式分析,快速进行假设和验证。可反复在原始数据上进行任意维度的计算。而流计算在计算完原始数据后,即抛弃了原始数据,若想回溯调整查询,基本不可能。所以日志服务的交互式查询可谓灵活很多。
  • 机器学习支持

    • 时序类机器学习函数,帮助发现业务规律与趋势
    • 分类与聚类函数,帮助发现与定位异常

image.png | left | 827x193

使用步骤

以日志服务dashboard对接为例,要对接一个大屏,首先要接入数据,然后编写SQL,配置仪表盘视图。

1. 接入数据

日志服务提供30+数据接入手段可以满足各种数据源诉求,具体参考文档。

image.png | left | 827x210

2. 调试SQL+机器学习函数

我们在日志服务查询页面,通过SQL语法,计算出需要的指标。SQL语法参考语法文档。

image.png | left

3. 配置视图并保存

SQL调试好后,配置视图的参数,添加到仪表盘:

 

 

在配置好的大屏中,使用下钻深入分析结果:

image | left

日志服务控制台内置14+类型视图,用于可视化展示SQL计算结果,具体参考文档

image | left

基于日志服务大盘案例

  • 从日志到双十一大屏只要一步:LOG/SLS+DataV 打通
    DataV无缝支持LOG API,使用SQL进行实时计算,统计Nginx日志的PV、UV网络等指标。

image.png | left

图:datav大屏

  • 5分钟搭建网站实时分析:Grafana+日志服务实战

image.png | left

图:grafana大屏

  • 日志服务Nginx dashboard:使用日志服务内置的地图、饼图、折线图等可视化Nginx日志指标

image.png | left

图:日志服务dashboard

  • Pangu 2.0 秒级监控
    Pangu2.0是阿里云自研的新一代普惠智能新存储系统。Pangu基于日志服务搭建秒级监控,Pangu 日志产生后,秒级采集到日志服务,并在秒级别计算出各个机器的IOPS、延时、吞吐。可迅速发现负载高的机器,及时跟进处理。

image.png | left | 827x486

  • Fuxi 双十一资源画像为混部保驾护航资源调度大屏:
    伏羲是阿里云自研的分布式调度系统。在双十一期间,为了监控所有集群的容量、负载信息,伏羲团队搭建了基于日志服务+dataV的可视化大屏。一张大屏囊括了所有的集群信息,看到这张大屏,就像拥有了一张地图,在双十一波涛汹涌的流量面前,做到胸有成竹。

image.png | left

转载于:https://my.oschina.net/u/3827390/blog/2989963


http://www.niftyadmin.cn/n/1818983.html

相关文章

移动端开发-Day1

什么是Node? 它是一个基于Chrome v8引擎的js运行环境,采用高效轻量级的事件驱动,非阻塞式的I/O模型。 非阻塞I/O? 例如,当程序运行到某一函数时,调用后立即返回,不需要等待函数执行完成&#xf…

建议是在公司发不出工资前换好工作

在移动互联网兴起的这几年,无论是从网上还是身边都看到了很多程序员被无良公司拖欠工资,可能是公司倒闭,也可能是老板跑路。我个人感觉程序员是一个相对单纯的群体(很好骗),尤其是刚工作的年轻人。油腻的创…

何谓Kubernetes以及企业如何从DevOps趋势中获益

什么是容器,Kubernetes适合应用于什么地方,成功部署需要什么工具?当前,容器的使用可谓如火如荼。不仅受到开发人员的喜爱,而且也倍受企业追捧。如果贵公司的IT部门正在寻找一种更快速、更简单的应用开发方式时,那您应…

生命周期图示

转载于:https://www.cnblogs.com/huge-666/p/10140826.html

主数据管理项目建设经验分享

一、主数据建设的术法道随着企业信息化系统建设逐渐增多,领导、业务部门对信息系统支撑决策、管控、业务运行难度也随之提高,导致解决业务系统间的交互困难和数据多头管理不一致等问题成为信息化建设的难点和重点。借鉴业界成熟的信息化建设思路&#xf…

一文读懂随机森林的解释和实现

如今由于像Scikit-Learn这样的库的出现,我们可以很容易地在Python中实现数百种机器学习算法。它们是如此易用,以至于我们通常都不需要任何关于模型底层工作机制的知识就可以使用它们。虽然没必要了解所有细节,但了解某个机器学习模型大致是如…

JavaScript ES7/8/9 新特性

JavaScript ES7/8/9 新特性 ES7 新特性 (ECMAScript 2016) ES7 在 ES6 的基础上主要添加了两项内容: Array.prototype.includes() 方法求幂运算符(**)Array.prototype.includes() 方法 includes() 方法用来判断一个数组…

教程:使用Data Lake Analytics读/写MongoDB数据

Data Lake Analytics 作为云上数据处理的枢纽,最近加入了对于MongoDB 的支持, 这篇教程带你玩转 DLA 的 MongoDB 支持。 创建数据库 在 DLA 里面创建一个底层映射到 MongoDB 的外表的语法如下: CREATE DATABASE mongo_test WITH DBPROPERTIES (catalog mongodb,loc…