架构设计之日志、监控与告警
记录日志的作用
- 方便排查异常错误。
- 数据分析统计。
什么场景需要做日志
- 核心功能模块。
- 不稳定、新接入的服务。
日志如何做记录
- 按级别记录,比如
errror
级别,notice
级别。 - 并发量比较小时可用文件日志,如果并发比较大,可以通过消息队列。
如何做好监控
- 基于 API 监控,实现方式:定时请求某个接口,是否能够正常响应。
- 基于服务监控,比如数据库服务,定时跑脚本检测服务或端口是否存在。
- 基于系统监控,监控系统负载,CPU 使用率,内存使用率。
- 基于日志监控,定时监控某个路径下的日志文件,如果有修改或写入,则触发告警。
告警有哪些形式
- 邮件
- 短信
- 微信
- 钉钉
- 第三方服务
什么级别需要触发告警
- 核心功能,如果告警太多,会导致无视告警的通知。
降级预案
- 设置开关,如果服务短时间内无法快速修复,可提前做好开关,实现不影响整个系统提供服务。
- 容错机制,提前准备备用服务,比如发送短信,A 公司的短信服务不可用,那么可以使用 B 公司的短信服务。
1 评论 在 "架构设计之日志、监控与告警"
赞一个