百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

封神-核心功能 | 钉钉告警+数据网关

ccwgpt 2024-10-12 02:40 20 浏览 0 评论

1. 开发背景

1.1 用户痛点

①租户侧运维能力弱
问题:租户侧,客户没有有效途径,及时地获取实例级的状态、性能、容量的数据。
现状:每日固定时间,驻场需要人肉收集数据,钉钉定时推送给客户。
②问题排查效率低
问题:应用业务有问题,云平台产品正常,客户并不认可,需要帮助客户解决问题。
现状:发现应用实例出现性能、容量被打满的问题,这个排查过程往往冗长, 效率很低。
③监控能力缺失
问题:云平台监控不全,容量管理、性能管理等报表能力缺失。
现状:驻场需要通过大量人肉巡检,或者编写脚本。
④监控 方式时效性低
问题:业务侧总会优先于应用与云平台感知到故障,运维非常被动 。
现状:客户发现问题,通知应用,应用检查后,再溯源到云平台,排查链路串行并且低效。

1.2 解决方案

①保障业务稳定
通过云产品的服务能力的变化情况及业务仿真模型的建立,提前预知客户业务健康度,低于基线后便会触发告警。
②SLA化展示
触发阈值自动报警,量化产品健康状况。

2. 开发设计

2.1 系统架构

封神系统架构如图1所示,分为CLIENT与SERVER端两大模块。

  • CLINET端:部署在经典网铜雀容器内,通过定时任务控制去采集云内各产品数据。
  • SERVER端:部署在VPC内ECS上,系统框架为FLASK,分为数据处理与数据存储两大部分。
  • ①数据处理是指通过提供API接受CLIENT的数据并进行入库操作以及数据的前端展示。
    ②数据存储是指借助阿里云RDS数据库,对数据进行持久化操作作。

2.2 业务架构

封神业务架构如如2所示,分为五大板块。

  • 姜子牙:租户侧告警,主要包括ECS、RDS等云产品实例性能以及业务相关告警。
  • 申公豹:运维侧告警,主要包括云产品健康状态、水位容量等相关告警。
  • 雷震子:硬件告警,主要包括坏盘,物理机带外等告警。
  • 比 干:安全告警,主要来自云盾相关安全类告警。
  • 杨 戬:故障告警,主要对各产品数据进行SLA算法处理,设置P0,P1等级故障阈值。

3. 钉钉告警

3.1 告警分类

机器人创建方式可参考文后资料[1]了解详情。

姜子牙

申公豹

雷震子

比 干

杨 戬

3.2 告警展示

4. 数据网关

数据网关分为两大模块:获取数据、接收数据。

  • 获取数据分为告警数据、全量数据、性能数据。
  • ①告警数据:分别对应钉钉机器人推送的告警信息,封装成相应的数据格式,以API接口形式对外提供数据。
    ②全量数据:数据库源表数据,不做任何加工处理,以API接口形式对外提供数据,可操作性较高。
    ③性能数据:产品性能数据会定期存储到时序数据库,存储时间长,可查询历史性能数据。
  • 接收数据:提供对外API接收客户自定义监控数据,封装成MARKDOWN格式,实时进行钉钉告警。

4.1 获取数据

4.1.1 告警数据

4.1.1.1 请求接口

请求方式:POST请求
URL地址: http://{ip}:{port}/api/v1/search/monitor
ip:封神ecs_ip
port:9170
PARAM:参数列表可查看文后资料[2]了解详情。

4.1.1.2 DEMO

import sys
import requests
url = "http://{ip}:{port}/api/v1/search/monitor/"
data = {"product":"MQ", "title":"积压告警", "stime":"2020-01-04 00:00:00", "etime":"2020-01-04 00:01:00"}
res = requests.post(url=url, json=data)
print res.content
curl -H "Content-Type:application/json" 
-X POST -d '{"type":"ALL"}' http://{ip}:{port}/api/v1/search/monitor/

4.1.1.3 数据返回

①当前存在告警
{"code":0, "data":[{"info":"0.0.0.0,ecs,95% \n 0.0.0.1,ecs,95% ", "product":"ECS", "title":"性能告警", "level":"告警", "robot":"姜子牙", "monitor_time":"2020-01-14 00:00:00", "columns":"IP,产品,值"}]}
②当前未存在告警数据(告警恢复正常)
{"code":0, "data":[{"info":"", "product":"ECS", "title":"性能告警", "level":"告警", "robot":"姜子牙", "monitor_time":"2020-01-14 00:00:00", "columns":"IP,产品,值"}]}
③未查询到数据:
{"code":0, "data":[]}
④查询异常:
{"code":500, "data":"异常信息"}

4.1.2 全量数据

4.1.2.1 请求接口

请求方式:POST请求
URL地址: http://{ip}:{port}/api/v1/search/data/
ip:封神ecs_ip
port:9170
PARAM:参数列表可查看文后资料[2]了解详情。

4.1.2.2 DEMO

import sys
import requests
url = "http://{ip}:{port}/api/v1/search/data/"
data = {"product":"MQ", "title":"TIME", "stime":"2020-01-04 00:00:00", "etime":"2020-01-04 00:01:00"}
res = requests.post(url=url, json=data)
print res.content

4.1.2.3 数据返回

4.1.3 性能数据

4.1.3.1 请求接口

请求方式:POST请求
URL地址: http://{ip}:{port}/api/v1/influxdb_query/
ip:封神ecs_ip
port:9170
PARAM:参数为INFLUXDB SQL

4.1.3.2 DEMO

import sys
import requests
url = "http://{ip}:{port}/api/v1/influxdb_query/"
data = {"sql":"infudb sql"}
res = requests.post(url, data)
print res.content

4.1.3.3 数据返回

4.2 接收数据

4.2.1 请求接口

请求方式:POST请求
URL地址:http://{ip}:{port}/api/v1/insert/third
ip:封神ecs_ip
port:9170
PARAM:

4.2.2 DEMO

import sys
import requests
url = "http://172.0.0.1:9170/api/v1/insert/third/"
data = {"title":"ecs性能监控", "level":"预警", "source":"云监控", "product":"ecs", "msg":"ip:10.0.0.1 cpu:98% ip:127.0.0.1 mem:99%", "robot":"姜子牙", "submitor":"高德臣", "monitor_time":"2021-03-10 16:00:00", "details":"兄弟 关注下"}
res = requests.post(url=url, json=data)
print res.text

4.2.3 告警展示

本文为阿里云原创内容,未经允许不得转载。

相关推荐

MFC、Qt、WPF?该用哪个?(mfc和wpf区别)

MFC、Qt和WPF都是流行的框架和工具,用于开发图形用户界面(GUI)应用程序。选择哪个框架取决于你的具体需求和偏好。MFC(MicrosoftFoundationClass)是微软提供的框架,...

一款WPF开发的通讯调试神器(支持Modbus RTU、MQTT调试)

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!项目介绍Wu.CommTool是一个基于C#、WPF、Prism、MaterialDesign...

关于面试资深C#、WPF开发工程师的面试流程和问题

一、开场(2-3分钟)1.欢迎应聘者,简单介绍公司和面试流程。2.询问应聘者是否对公司或岗位有初步的问题。二、项目经验与技术应用(10-20分钟)1.让应聘者详细介绍几个他参与过的C#、...

C# WPF MVVM模式Prism框架下事件发布与订阅

01—前言处理同模块不同窗体之间的通信和不同模块之间不同窗体的通信,Prism提供了一种事件机制,可以在应用程序中低耦合的模块之间进行通信,该机制基于事件聚合器服务,允许发布者和订阅者之间通过事件进行...

WPF 机械类组件动画制作流程简述(wps上怎么画机械结构简图)

WPF机械类组件动画制作流程简述独立观察员2025年3月4日一、创建组件创建组件用户控件,将组件的各部分“零件”(图片)拼装在一起,形成组件的默认状态:二、给运动部分加上Rend...

C#上位机WinForm和WPF选哪个?工控老油条的"血泪史"

作为一个从互联网卷进工控坑的"跨界难民",在这会摸鱼的时间咱就扯一下上位机开发选框架这档子破事。当年我抱着WPF的酷炫动画一头扎进车间,结果被产线老师傅一句"你这花里胡哨的玩意...

【一文扫盲】WPF、Winform、Electron有什么区别?

近年来,随着软件开发的不断发展,开发人员面临着选择适合他们项目的各种框架和工具的挑战。在桌面应用程序开发领域,WPF、Winform和Electron是三个备受关注的技术。本文将介绍这三者的区别,帮助...

一个开源、免费、强大且美观的WPF控件库

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!项目介绍HandyControl是一套基于WPF(WindowsPresentationF...

WPF 根据系统主题自动切换浅色与深色模式

WPF根据系统主题自动切换浅色与深色模式控件名:Resources作者:WPFDevelopersOrg-驚鏵原文链接[1]:https://github.com/WPFDevelopers...

WPF与WinForm的本质区别(wpf与maui)

在Windows应用程序开发中,WinForm和WPF是两种主要的技术框架。它们各自有不同的设计理念、渲染机制和开发模式。本文将详细探讨WPF与WinForm的本质区别,并通过示例进行说明。渲染机制W...

Win10/Win11效率神器再进化:微软发布PowerToys 0.90.0版本

IT之家4月1日消息,微软今天(4月1日)更新PowerToys,在最新发布的0.90.0版本中,修复多个BUG之外,引入多项功能更新,为Windows10、Windows...

一款非常漂亮的WPF管理系统(wpf架构及特性)

我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!WPFManager项目介绍该项目是一款WPF开发的管理系统,数据库采用的MSSqlserv...

WPF 实现描点导航(wpf按钮的点击事件)

WPF实现描点导航控件名:NavScrollPanel作者:WPFDevelopersOrg-驚鏵原文链接[1]:https://github.com/WPFDevelopersOrg/WPF...

微软更新基于Win11的Validation OS 2504:增强 .NET与WPF

IT之家5月1日消息,科技媒体NeoWin今天(5月1日)发布博文,报道称微软公司更新基于Windows11的ValidationOS,增强支持.NET和WPF,并优...

WPF的技术架构与优势(wpf的前景)

WindowsPresentationFoundation(WPF)是一个现代化的用户界面框架,专为构建Windows应用程序而设计。它通过分层的技术架构和丰富的功能集,提供了全面的应用程...

取消回复欢迎 发表评论: