为什么监控?
对系统不间断的时时监控,并反馈当前状态,通过监控运维可以比较及时的发现问题,保证业务持续运行。
帮助我们自动发现产品或底层架构存在的问题,减少故障率,减小范围的扩大(如果等用户反馈的话,会直接影响用户体验)
可以根据已有的问题作历史问题的追溯
作性能的评估和对未来业务综合情况的参考
数据采集-数据存储-数据分析-展示和告警
怎么来监控?
zabbix不大适用于容器监控。—传统的,非容器的
Open-Falcon小米公司开源的—传统的,非容器的
Prometheus 全能的容器监控,容器没兴起的时候,很少人知道,k8s占据市场,成为容器的老大后,Prometheus也非常时候监控mysql,nginx,系统,容器都支持,全能的。
———————当下建立监控系统的首选Prometheus
监控什么?
http://prometheus.io/docs/instrumenting/exporters 有很多现成的导出器
日志监控还不擅长,elk用
安全监控其实也不怎么擅长
不仅仅只是说服务挂没挂,要说出一些具体指标。
硬件监控:cpu,主板,内存,硬盘,raid卡,电源等的硬件温度(过高可能超负荷运行,过高可能会导致故障),硬件故障等—–本身不支持,但是有社区插件,理解成agent
系统监控:cpu,内存,硬盘,网卡流量,tcp状态,进程数(资源利用率层面,cpu分为用户态和内核态,cpu利用率可以说是这来两个之和。。wa达到5%说明很繁忙了cpu)
应用监控: nginx,tomcat(最典型的就是堆内存的溢出),php,mysql,redis——————qps(并发量)
日志监控: 系统日志,服务日志,访问日志—–可以用elk
安全监控:waf(防火墙,应用层的,自己做的话用nginx+lua),敏感文件监控(可执行目录下的文件)
api监控 :可用性,接口请求,响应时间—(一般是http提供的,get,post之类的)
业务监控 : (一般是从数据库读取展示,用granfa去作仪表盘去展示重要数据)例如点上网站,每分钟产生多少订单,注册多少用户,多少活跃用户,推广活动效果—–要自己写agent,因为业务是根据你自己的情况来定
流量分析 : 根据流量获取用户相关信息,例如用户地理位置,某页面访问情况,页面停留时间。(业务流量,比如人的分布地区,卖暖气产品来自北方—–或者多个产品,访问哪个产品比较多(关注度))—-也不是很擅长,主要看你数据从哪里来,不过作绘图还是很好的。
http://localhost:9090/metrics 文本形式暴露出来让你去采集
实列:被监控的目标,target 目标,就是实列。 作业:具有相同目标的实列集和称为作业(job)

发表评论

邮箱地址不会被公开。 必填项已用*标注