2020年Kubernetes中7个最佳日志管理工具

Kubernetes在容器编排市场中占主导地位,通常用于托管微服务。但是,微服务的每个实例都会生成大量日志事件,这些日志事件很快就会变得难以管理。更糟糕的是,当出现问题时,由于服务间的复杂交互以及不可预知的故障模式,很难找到根本原因。

目前,我们有这么多日志工具?是否有一个完美的工具可以满足所有需求,并使监视,日志记录和故障原因分析尽可能地高效和快速?

大多数Kubernetes日志管理工具都是ELK的变体,具有相似的功能并且具有同样的局限性。这些工具可帮助你访问日志和搜索信息。但要,这些工具大多数还需要解析日志规则和警报规则才能正常工作。

接下来,我开始为你介绍2020年Kubernetes最佳日志管理工具。

1. Zebrium

我将Zebrium放在首位,因为我发现该工具有潜力成为Kubernetes日志管理中的下一个重要工具。

这家新成立的初创公司,最近入选“ Gartner 2020年值得关注的25家初创企业”和“福布斯AI 50:美国最有前途的人工智能公司”。

Zebrium最近还帮助Sweetwater将事件跟踪时间从3小时减少到只有几分钟。Zebrium甚至可以发现以前未发现的软件问题。这是一项出色的功能,因为它可以帮助你在问题出现之前就发现问题。

那么,什么使Zebrium在竞争中脱颖而出?Zebrium使用人工智能(AI)来发现问题以及自动发现,而所有其他工具都依赖于用户手动添加规则。Zebrium也可以用作独立的日志管理平台,也可以与ELK Stack或其他日志管理器集成。

这听起来像梦想成真,所以我在一个非常简单的项目上进行了测试。在此测试中,Zebrium能够自动检测到网络超时的问题。我没有为此建立任何规则,也没有手动监视系统。Zebrium通过其基于ML的算法解决了这个问题,并立即通知我。

优点:

  1. 易于启动,只需要简单的helm或kubectl命令。
  2. 自动检测问题和软件故障,无需手动配置规则。
  3. 可以用作独立的日志管理工具,也可以用作现有日志管理工具(例如ELK Stack)的ML附件。

缺点:

  1. 免费计划:日志限制为每天500MB,只保留3天的记录。
  2. 支持Kubernetes,Docker和大多数常见平台,但尚不支持Windows。

官网链接: https://www.zebrium.com/

2. Sematext

Sematext是用于日志管理和应用程序性能监视的解决方案。Sematex提供了系统状态的可见性。

Sematext不仅限于K8s日志记录,还可以提供监视和警报功能。收集到的日志,会自动根据不同的已知日志格式进行解析/结构化,并且用户还可以提供自定义的日志模式。

Sematext还公开了Elasticsearch API,因此你也可以使用任何与Elasticsearch配合使用的工具,例如Filebeat和Logstash与Sematex。

Sematext可以创建特定规则,以监视特定情况并捕获异常。借助Sematex全面的实时仪表板,用户可以控制和监视所有服务。

优点:

  1. 与其他Sematext Cloud工具(如监视)集成。
  2. 配置方便灵活。
  3. ELK的灵活性。

缺点:

  1. Sematex和Kibana不能在一个仪表板上混合使用。
  2. 自定义解析需要在日志传送器中完成,Sematext仅在服务器端解析Syslog和JSON。
  3. 跟踪功能较弱,尽管他们计划进行改进。

官网链接:https://sematext.com/

3.Grafana的Loki

K8s日志监视工具列表中的第三位不是ELK,而是Loki。

Loki是一个受Prometheus启发的,支持多租户和高度可用的日志聚合工具。该工具有助于收集日志,但是用户需要为其手动建立规则。

Loki与Grafana,Prometheus和Kubernetes合作。Loki可以使你的内部流程更有效率。例如,它节省了Paytm Insider 75%的日志记录和监视成本

Loki不会索引你的日志内容,而是仅索引每个事件流的一组标签,因此效率很高。

优点:

  1. 大型的生态系统。
  2. 丰富的可视化功能。
  3. 由于未索引日志内容而提高了效率

缺点:

  1. 未对Kubernetes日志管理进行优化。
  2. 大量的手工操作。
  3. 缺少内容索引可能会限制搜索性能。

官网链接:https://grafana.com/oss/loki/

4. ELK Stack ( Elastic Stack)

ELK名列第四。一般而言,ELK可能是最著名的日志管理开源工具。ELK是Elasticsearch,Logstash和Kibana的首字母缩写。每个组件负责日志记录过程的不同部分。

Elasticsearch是一个功能强大且可扩展的搜索系统,Logstash聚合并处理日志,而Kibana提供了一个数据分析和可视化的界面,可帮助用户理解数据。它们共同为K8s提供了全面的日志记录解决方案。

请注意,ELK堆栈还有许多其他变体(例如EFK Stack -Elasticsearch,Fluentd和Kibana)。

ELK被AdobeT-MobileWalmart等许多大公司使用,因此你可以相信它的健壮性。通常,这是一个可靠且经过验证的工具。

但是,由于它的复杂性和所需的大量资源,我将其放在第四位。

优点:

  1. 该工具是众所周知的,并且拥有庞大的社区。
  2. 非常广泛的平台支持。
  3. Kibana中丰富的分析和可视化功能。
  4. 需要手动定义的警报规则,日志分析复杂。

缺点:

  1. 维护困难
  2. 在大型环境中,需要调整很多属性
  3. 大量的资源需求
  4. 某些功能需要付费

官网链接:https://www.elastic.co/cn/what-is/elk-stack

5.Google Operations (Stackdriver)

Google Operations(也称为Stackdriver)是在Google环境中用于监视,故障排除和提高应用程序性能的工具。

它收集整个Google Cloud和你的应用程序的指标,日志信息和软件跟踪信息。Google Operations与AWS上的CloudWatch等效,并且与CloudWatch一样,它是一个具有日志记录和监视的解决方案。

Cloud Logging与GKE紧密集成,默认情况下会添加到你创建的每个GKE群集中。你的日志存储在Logging的数据存储中,并为搜索和可视化编制索引。

Cloud Logging支持灵活的查询,并且可以与Google基础架构中的其他工具无缝集成。

优点:

  1. 实时的日志管理和分析。
  2. 内置大规模的度量指标。
  3. 可以集成Google基础架构中的其他工具。

缺点:

  1. 由于请求会通过Google Cloud Platform(GCP)的各个级别,因此很难跟踪实际的延迟。
  2. 仅适用于GCP环境。
  3. 复杂的定价系统。很难预先估计要花多少钱。

官网链接:https://cloud.google.com/products/operations

6. CloudWatch

CloudWatch是Amazon Web Services的产品。

它从AWS中收集数据,并在单个自动化仪表板中将其可视化。这使你可以查看日志和指标并将它们相互关联,以了解问题的根本原因。

用户可以使用CloudWatch自己专用的查询语言来分析日志,该语言支持聚合,过滤器和正则表达式。你还可以通过Lambda将日志发送到Elasticsearch。

总体而言,如果你已经在使用Amazon服务,则CloudWatch是一个不错的选择。它也可以用于混合云体系结构,并使用代理或API来监视软件资源。AirWatch,Deliveroo,9GAG等许多知名品牌都在使用CloudWatch。

优点:

  1. 专为监视AWS资源而设计。
  2. 具有指标爆发性属性
  3. 详细的监视和自动缩放组。

缺点:

  1. 它只能用于AWS服务。
  2. 仪表板的定制选项不多。
  3. 不支持事务跟踪。

官网链接:https://aws.amazon.com/cloudwatch/

7.Fluentd

Fluentd是跨平台的开源数据收集器,提供了统一的日志记录层(但它不是独立的日志管理器)。

Fluentd是一个颇受欢迎的工具,拥有Atlassian,Microsoft和Amazon等5,000多个用户。Fluentd有很高的可靠性和性能。

此外,Fluentd还创建了一个统一的日志记录层,可帮助你更有效地使用数据。该工具可以像LINE一样帮助你 每秒处理120,000条记录

优点:

  1. 大型的社区和插件生态系统。
  2. 统一日志记录层。
  3. 经过验证的可靠性和性能。
  4. 安装简单

缺点:

  1. 配置复杂
  2. 对数据转换的支持有限。
  3. 不是完整的日志记录解决方案

官网链接:https://www.fluentd.org/

结论:如何选择合适的日志管理工具?

首先,我应该解释一下为什么我没有将Prometheus 列入名单,原因是本文专注于日志管理工具,而Prometheus是处理指标而不支持日志。

因此,如果你讨厌手动搜索日志,或者讨厌构建和管理警报规则,则应尝试使用基于AI和ML的算法的Zebrium。这可能会节省大量时间,并使你摆脱创建大量规则的繁琐任务。

但是,如果你正在寻找更主流的东西,并且知道要创建哪个警报规则(或者你不信任AI),请尝试使用LokiSematext,如果你以前没有使用过日志监视工具,它们将是非常适合你的高效工具。如果你已经在使用Grafana或Sematext Cloud / Enterprise的产品,它们将特别有用。

如果你在项目中使用Google的GCP产品,则Google Operations的可能是一个很好的选择。

如果你的日志有多个或特殊的来源,请尝试使用Fluentd及其统一的日志记录层。

当然,如果你是AWS用户,则CloudWatch将是你的自然选择。

译文链接:https://dzone.com/articles/7-best-log-management-tools-for-kubernetes-2020

K8S中文社区微信公众号

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址