Kubernetes主导容器编排市场,推动企业向微服务演进。微服务的每个实例都会生成大量日志事件,这些事件很快就会变得难以管理。但更复杂的是,当出现问题时,由于服务之间的复杂交互和可能的故障模式,很难找到根本原因。潜在的问题使得Kubernetes日志管理工具变得非常重要。企业总是试图找到合适的工具来满足他们的需求,并尽可能高效和快速地进行监控、日志记录和故障分析。Zebrium你可能优先考虑普罗米修斯(Prometheus)还是ELK?但Zebrium也可以作为首选。这家刚刚起步的初创公司最近被Gartner评为2020年值得关注的25家企业软件初创公司。说到最佳实践,Zebrium最近还帮助Sweetwater将事件跟踪时间从3小时缩短到几分钟。Zebrium甚至可以发现以前未发现的隐藏问题。这是一个很棒的功能,因为它有助于在问题影响客户之前发现问题。那么,是什么让Zebrium在竞争中脱颖而出?Zebrium使用人工智能来发现问题并自动发现根本原因,而所有其他工具都依赖于用户手动添加规则。Zebrium也可以用作独立的日志管理平台或与ELKStack或其他日志管理器集成。优点:容易上手;只需复制/粘贴自定义HELM或kubectl命令;自动检测问题和根本原因,无需手动规则;可以用作独立的日志管理工具或现有的日志管理工具(例如ELKStack)机器学习插件。缺点:免费计划限制为每天500MB,保留3天;支持Kubernetes、Docker和大多数常见平台,但不支持Windows。Sematext的日志管理和应用程序性能监控解决方案。Sematex提供系统状态的全栈可见性。Sematext不仅限于Kubernetes日志,还可以监控和Kubernetes(基于指标和日志)。收集的日志会自动解析/构造为几种不同的已知日志格式,用户还可以为自定义日志提供模式。它还公开了ElasticsearchAPI,因此也可以使用任何与Elasticsearch配合使用的工具,例如Filebeat和带有Sematex的Logstash。它可以用作ELK的变体或与本地Sematext生态系统一起使用。此工具有助于创建特定规则以监视特定条件并捕获异常。借助Sematex全面的实时仪表板,客户可以控制和监控所有服务。关注农民工技术之路公众号,回复1024领取2TB资料一份,帮助大家更好的学习技术。优点:与其他Sematext云工具集成;可配置的超限以防止日志被接受以控制成本;ELK的灵活性。缺点:不能在一个仪表板上混合使用Sematext小部件和Kibana;自定义解析需要在logshipper中完成,Sematext只在服务器端解析Syslog和JSON;跟踪很弱,但已经计划进行改进。LokiLoki是一个受Prometheus启发的多租户和高可用性日志聚合工具。该工具有助于收集日志,但用户需要为其创建手动规则。Loki与Grafana、Prometheus和Kubernetes一起工作。Loki可以使内部流程更有效率。例如,它为PaytmInsider节省了75%的日志记录和监控成本。Loki不会为您的日志内容编制索引,而只会为每个事件流编制一组标签,因此效率很高。优点:拥有庞大的生态系统;丰富的可视化功能;由于未索引的日志内容提高了效率。缺点:未针对Kubernetes日志管理进行优化;模式规则的大量手工工作;缺乏内容索引可能会限制搜索性能。ELKStackELK是最著名的日志管理开源工具。ELK是Elasticsearch、Logstash和Kibana的首字母缩写。每个组件负责日志记录过程的不同部分。Elasticsearch是一个强大且可扩展的搜索系统,Logstash聚合和处理日志,而Kibana提供一个分析和可视化界面,帮助用户理解数据。它们共同为Kubernetes提供了全面的日志记录解决方案。但是ELKStack还有很多其他的变种,比如EFKStack,它由Elasticsearch、Fluentd和Kibana组成。ELK被Adob??e、T-Mobile和沃尔玛等许多大公司使用,因此可以证明其可生产性。所以ELK是一个可靠且经过验证的工具。但他会带来复杂性和大量资源来完成这项工作。优点:ELK众所周知,拥有庞大的社区;非常广泛的平台支持;Kibana丰富的分析和可视化功能;需要复杂的日志分析和手动定义的警报规则。缺点:难以保持规模;需要大量调整,尤其是对于大型环境;大量资源需求;某些功能需要付费许可证。FluentdFluentd是一个跨平台的开源数据收集器,提供统一的日志层,但它不是一个独立的日志管理器。一款流行的工具,拥有5,000多家客户,包括Atlassian、Microsoft和Amazon。看到这些大客户充分说明了其可靠性和性能。此外,Fluentd创建了一个统一的日志记录层,有助于更有效地使用数据并在软件上快速迭代数据。它可以帮助您每秒处理120000条记录。优点:大型社区和插件生态系统;统一日志层;经过验证的可靠性和性能。不到10分钟即可安装完毕。缺点:难以配置;对转换数据的支持有限;不是一个完整的日志记录解决方案。结论你可能会问为什么Prometheus不在列表中,因为本文主要介绍日志监控工具,而Prometheus不支持日志处理指标。所以,如果你不擅长手动搜索日志,或者不愿意构建和管理警报规则,你应该尝试基于机器学习算法的Zebrium。这可能会节省大量时间并摆脱创建大量规则的繁琐任务。如果您正在寻找更主流的东西并且知道要创建哪些规则,请尝试Loki或Sematext,它们将是出色的生产力工具。另外,如果想在公有云中使用日志监控,不妨使用云提供商提供的服务,比如AWS的CloudWatch,他们只支持自己云中的业务。如果你的日志有多个或唯一的来源,你可以尝试Fluentd和它的统一日志层,但你仍然需要一个日志工具。原文:https://www.toutiao.com/i6889...作者:云知时代
