当前位置: 首页 > 科技观察

企业如何做好业务监控?

时间:2023-03-12 19:42:33 科技观察

为什么要做业务监控?一般情况下,大部分企业都会做基础设施监控,认为做基础设施监控可以解决大部分问题。至于业务监控,我们可以等到有人说了再去处理。殊不知,这种思路会存在很多隐患:1、运维部门往往比业务部门更晚发现业务问题。因为业务问题会最先爆发,往往几分钟后基础设施问题才会出现。此时业务可能已经耗尽。2、由于发现业务问题的时间较晚,此时相互调用关系的业务也可能出现问题。这使得服务故障定位变得困难。如果我们做业务监控,做到优秀的监控,那么当大量业务出现问题的时候,我们可以判断出是哪个业务故障引起的,第一时间告警。3、损害公司利益和自身前途。第三点也是最要命的。由于以上两个问题,运维会给业务部门乃至整个公司带来负面影响。长此以往,不仅会给企业带来经济损失,对自身的前途也十分不利。因此,做好业务监控可以说是每个运维人员必须完成的任务。业务监控应该做什么?1、网站监控对于公网服务网站,无论是SAAS还是我们自己部署的站点,都需要进行站点URL监控。对于公共网站监控,建议使用商业服务进行监控,因为这些服务通常可以从多个区域检测您当前的站点访问,通常是站点状态代码和响应速度监控。服务于内网的网站也需要监控,因为不能从公网访问内网,所以推荐使用自建的Prometheus来监控站点的状态和响应速度。2、健康检查接口这里监控服务健康检查接口,提供一个或多个监控API,监控应用本身的状态,监控应用与数据库的连接状态,监控应用的连接状态和中间件。健康检查接口建议统一使用/health路径下的接口。如果是三个接口,那么/app_health代表服务,/db_name_health代表数据库连接状态,/middleware_name_health代表中间件连接状态。单个接口返回APP_OK、db_name_OK、middleware_name_OK,多个接口返回OK表示服务、数据库、中间件正常。一些JavaSprint框架自带健康检查接口,可以直接使用。3、日志监控首先,所有的业务日志都要接入日志中心。需要提醒哪些关键字?需要项目经理和开发负责人一起讨论并给出。确保警报有必要的关键字,以避免警报泛滥。4.Linktracking可以有选择地访问链接跟踪。如果业务比较简单,正常运行没有问题,可以不访问。对于一般的业务,如果上下游调用链较多,业务逻辑比较复杂,并发量大,响应速度要求高,可以接入。主要是让用户找出响应时间长的API,检查功能是否有问题。一些商业链接跟踪工具也可以发现SQL语句的问题。这些可以帮助开发者更好更快的解决业务代码中的问题。5、大屏监控对于业务大屏,首先要考虑的是哪些业务数据应该放在大屏上?建议放业务领导或管理层关心的数据。例如:在线用户数。·用户订单实时交易量数据。这些数据可以让企业领导或管理层直观地看到当前的业务状况。也可以为一些估计的异常值配置警报。如何做好业务监控做好业务监控并不容易,所以这也是很多企业没有做或者做的不完善的原因。做好业务监控必须循序渐进。首先你要有业务监控,其次我们要梳理业务监控,确保所有的监控项都是有意义的。最后,我们要有业务监控巡检和告警处理的流程和机制,保证所有的业务监控都能及时发现和处理。此外,业务监控不限于上述5类。如果企业有与业务相关的监控需求,不属于上述类型,可以通过一些工具或定制手段进行定制。业务监控需求。只有做好业务监控,才能充分体现运维的价值。