你的监控够高级吗?
复杂的架构、更快部署的压力以及对最佳性能的需求给监控团队带来了更大的压力。因此,越来越多的人正在寻求实施更先进的监控技术。在本文中,我们以 Postgres 为例来区分基本和高级监控。 基本监控与高级监控 基本监控是红灯/绿灯监控,例如你的...
复杂的架构、更快部署的压力以及对最佳性能的需求给监控团队带来了更大的压力。因此,越来越多的人正在寻求实施更先进的监控技术。在本文中,我们以 Postgres 为例来区分基本和高级监控。 基本监控与高级监控 基本监控是红灯/绿灯监控,例如你的...
在调试微服务时,开发人员可能很难确定问题的根本原因。即使有日志,但需要在多个服务中搜索,花费大量时间往往是令人沮丧。 然而,面对所有这些挑战,还有一线希望——分布式追踪。 分布式追踪,为分布式应用的开发者提供了完整的调用链路还原、调用请求量...
在当今以用户为中心的IT环境中,越来越多的组织正在实施站点可靠性工程师 (SRE) 功能,以此来定义衡量系统的可用性和正常运行时间、提高发布效率和降低故障成本。用户需求也在不断推动系统频繁的变更。基于此,传统的监控方法根本无法满足SRE的监...
可观察性是DevOps团队的重要组成部分,它可以帮助组织从系统的输出信息,推断系统内部状态。它是一个持续的过程,从你的CI/CD流水线开始,并贯穿于应用程序的整个生命周期。 可观察的CI/CD流水线,使你能够主动监视问题并跟踪CI/CD构建...
作者 | 墨封 来源 | 阿里巴巴云原生公众号 一周前,我们介绍了《面对大规模 K8s 集群,如何先于用户发现问题》。 本篇文章,我们将继续为大家介绍 ASI SRE(ASI,Alibaba Serverless infrastructur...
本文将从 GPU-Operator 概念介绍、安装部署、深度训练测试应用部署,以及在 KubeSphere 使用自定义监控面板对接 GPU 监控,从原理到实践,逐步浅析介绍与实践 GPU-Operator。 GPU-Operator简介 众...
来源 | 阿里巴巴云原生公众号 作者 | 溪恒、遥方 一年一度的 “双11” 大促中,交易额每年都在刷新,承接这些交易商品的快递包裹的数量也在成倍增长。这些快速的增长对物流系统带来了巨大的挑战,让物流管理更加敏捷来应对 “双11” 成为了必...
近日,谐云成功入围上海浦发银行2020-2022年度敏捷管理及技术教练供应商,通过DevOps赋能浦发银行数字化创新。谐云凭借其过硬的产品质量,扎实高效的工作作风,卓越的专家团队和良好的企业信誉,以绝对优势顺利入围。 随着银行...
Kubernetes在容器编排市场中占主导地位,通常用于托管微服务。但是,微服务的每个实例都会生成大量日志事件,这些日志事件很快就会变得难以管理。更糟糕的是,当出现问题时,由于服务间的复杂交互以及不可预知的故障模式,很难找到根本原因。 目前...
作者 | 虚明 导读:自动化管理云上资源,不仅仅是降低财务成本,更重要的是能够降低技术门槛,同时提高效率,节省时间。 为何要自动化? 在服务客户的过程中,我们发现国外客户相比于国内客户,明显对自动化工具的依赖度要更高。许多观点认为这是由于国...
作者 | 三未 前言 弹性伸缩是一种为了满足业务需求、保证服务质量、平衡服务成本的重要应用管理策略。弹性伸缩让应用的部署规模能够根据实时的业务量产生动态调整,在业务高峰期扩大部署规模,保证服务不被业务冲垮;在业务低谷期缩减部署规模,避免资源...
作者 | 宿何 导读:前几篇我们主要站在应用发布的场景,描述在发布过程中会遇到的灰度、监控、回滚、优雅上下线等保障发布能顺利进行的注意事项。作为一个程序员 GG,可灰度的发布顺利上线往往意味着准点下班。而我们今天要分享的内容则关系到我们能否...