与京东交谈:Kubernetes、云原生和CNCF项目推动大数据和AI

京东首席架构师刘海锋与云原生计算基金会(CNCF)坐下来谈论云原生、京东的Kubernetes实施,以及对其它考虑开始采用开源的公司分享一些技巧和心得。以下是他们的采访。

CNCF:您如何看待您的CNCF成员资格和云原生技术,帮助京东实现“零售即服务”的愿景?

海锋:我们零售即服务(RaaS)战略的目标是开放我们的能力和资源,以增强我们的合作伙伴、供应商和其他行业的能力。这非常符合我们对开源技术的承诺。我们已经从参与的CNCF项目中获益匪浅,我们对CNCF的新承诺使我们能够与行业顶级开发商、最终用户和供应商建立更强大的合作关系,并最终使我们能够为开源社区贡献更多。我们正开发新的容器原生技术以实现我们的RaaS愿景,加入CNCF是我们迈出的重要一步。

CNCF:Kubernetes对您的公司和/或开发团队有何影响?

海锋:京东是Kubernetes最早期采用者之一。公司目前管理世界上最大的Kubernetes集群,多集群超过20,000多个裸机服务分布在多个地区的数据中心。

CNCF:Kubernetes如何帮助京东进行人工智能或大数据分析以彻底改变电子商务?

海锋:JDOS是我们定制和优化的Kubernetes版本,支持广泛的工作负载和应用程序,包括大数据和AI。JDOS提供了一个统一平台管理物理机和虚拟机,包括容器化GPU,并支持大数据和深度学习框架,如Flink、Spark、Storm和TensorFlow即服务。通过共同调度在线服务以及大数据和AI计算任务,我们显著地提高资源利用率并降低IT成本。

CNCF:京东运行的Kubernetes集群有多大?请描述一下您的团队使用Kubernetes。

海锋:JD目前管理世界上最大的Kubernetes集群,多集群超过20,000多个裸机服务分布在多个地区的数据中心

CNCF:Kubernetes和云原生如何赋能京东的开发者?哪些是他们现在能做而以前做不到的?

海锋:旧的部署工具对不同环境需要不同的流程,包括应用程序打包、容器应用程序、部署、配置和缩放。整个过程既复杂又耗时。Kubernetes的引入大大简化了流程。现在,应用程序自动打包成镜像并近乎实时地部署到容器中。缩放现在是一个简单的一键操作,可以在几秒内完成。

CNCF:京东运营世界上最大的Kubernetes集群之一,公司是如何克服障碍?

海锋:我们一直监控系统的性能。过去,为解决性能的问题,我们收集并分析了几个关键绩效指标,并生成了详细的瓶颈分析报告。然后,我们通过删除不必要的函数和优化默认的调度程序来定制Kubernetes。我们还增强了多个控制器以避免级联故障。此外,我们还开发了用于检查、监控、报警和故障处理的操作工具包,帮助操作员排除故障并快速解决可能出现的任何问题。

CNCF:京东刚刚庆祝大名鼎鼎的6月18日全民年中购物节(“618”),在18天期间交易量超过247亿美元。这是很大量的订单。您能谈谈您的系统如何处理这么多的订单吗?

海锋:JDOS使用基于预测的算法,主动分配资源以满足预测需求,提高资源利用率。它还提供毫秒级弹性扩展,处理极端工作负载。我们每年举办的618全民年中购物节,今年的交易量达到了247亿美元。我们的平台有超过3亿客户,在此期间我们看到显着的流量高峰。我们调度了大约460,000个容器(Pod)和3,000,000个CPU核心,以支持大量订单。

CNCF:告诉我们您的Vitess使用情况。有什么影响?

海锋:我们的弹性数据库是世界上规模最大、最复杂的Vitess部署之一。我们已经成功地扩展了Vitess,在JD的Kubernetes平台上管理大量复杂的交易数据。显著的功能包括支持RocksDB和TokuDB作为新的存储引擎、自动重新分片、自动负载平衡和迁移。我们的系统目前管理2,600个MySQL集群、9,000个MySQL实例、350,000个表、1,600亿条记录和65T数据,支持京东的各种业务应用程序和服务。Vitess的使用使我们能够更灵活、更有效地管理资源,从而显著降低运营和维护成本。我们正积极与CNCF社区合作,向Vitess添加子查询支持和全域交易等新功能。

CNCF:您公司对Kubernetes和其它云原生技术(GitLab、Jenkins、Logstash、HarbourElasticsearch和Prometheus)的下一步是什么?

海锋:我们的容器化平台通过在Kubernetes上部署DevOps堆栈来分离应用程序和基础架构层,包括Vitess、Prometheus、GitLab、Jenkins、Logstash、Harbour和Elasticsearch等。我们贡献了代码到其中一些项目。我们希望将来能够做出更多贡献。我们认为可以真正增加价值的一个例子是Vitess,CNCF的可扩展MySQL集群管理项目。我们不仅是Vitess的最大最终用户,也是一个非常活跃和重要的贡献者。我们期待与CNCF社区的其他人一起为Vitess添加新功能,包括子查询支持、全域交易等。另外,我们正在扩展Prometheus以创建实时和高性能的监控系统。我们希望改进Kubernetes以支持多种不同的工作负载,并希望为Kubernetes贡献代码。

我们也计划发布我们的内部自研项目。在github.com/tiglabs上能找到很多。我们还计划提出新的CNCF项目。其中一个项目是ContainerFS。它是一个与Kubernetes无缝集成的大规模容器原生集群文件系统。

CNCF:您目前也正在评估哪些技术或实践(DevOps,CI / CD)?

海锋:我们正在积极开发以云原生或容器原生软件和技术为中心的开源项目,从计算、存储和中间件到应用程序。其中一个重点是用于各种工作负载的容器平台,包括在线服务、数据分析、边缘计算和物联网。另一个重点是容器平台的可扩展和高性能数据存储。

CNCF:对于刚刚开始使用云原生的其他中国公司,最重要的事情是什么?

海锋:借助Docker、Kubernetes和微服务,您可以从云原生获得很多价值而无需承受高额成本。云原生解决方案不仅可以在云中运行。它非常灵活,可以部署在内部环境、私有云、公共云和混合环境中。重要的是要密切关注新技术和行业趋势,利用开源技术并积极参与开源社区。

CNCF:对于希望部署云原生基础架构的其他公司,您有什么建议?

海锋:从生态系统的角度考虑如何满足您的业务需求,包括容器化基础设施、数据存储、微服务平台、消息传递和监控系统等。在容器编排和管理方面,Kubernetes是事实上的标准,是肯定的能押注的。您还应该利用新兴的无服务器架构来简化应用程序开发、打包、部署和管理的过程。

CNCF:为什么云原生对京东的商业是如此势在必行?

海锋:除了我们的商家外,我们拥有超过3亿客户,我们的基础设施必须具有可扩展性和极高的效率。五年前,我们的产品图像系统中有大约20亿个图像。今天,有超过一万亿,这个数字每天增加1亿。此外,作为中国最大的在线或离线零售商,同时也是中国最大的电子商务物流基础设施的运营商,完全由内部自力开发,我们的业务复杂且日新月异。因此,我们的基础架构必须非常灵活,并支持广泛的工作负载和应用场景,如在线服务、数据分析、AI、供应链、财务、物联网或边缘计算等。云原生技术非常适合处理我们不断变化的需求。

CNCF:这是京东加入的第一个开源基金会吗?

海锋:对。我们坚定地相信开源,并且与我们自己的战略密切配合。通过CNCF,我们的目标是与开源社区建立更多更强大的交流互动,并充分发现为开源社区做出贡献的潜在互利。作为全球以收入计算第三大互联网公司,京东已经开发了许多领先的技术创新,我们认识到我们有责任在开源社区中发挥领导作用。

CNCF:您打算如何与CNCF携手合作?

海锋:我们可以合作的领域是无限的。当我们推进一些新项目,加入CNCF并与其他成员合作将非常有帮助。此外,CNCF为我们提供了平台,提高我们某些项目的推广认识,招募领先的开发者,进行协作并为我们的工作做出贡献。

CNCF:您对KubeCon + CloudNativeCon中国论坛的内容感到兴奋吗?

海锋:我们期待与行业顶级开发商、最终用户和供应商会面,并继续了解最新的技术发展。我们还计划展示自己的工作,并确定与公司、最终用户和独立开发者的潜在合作机会。

想更多地了解中国的技术领导者如何利用云原生技术?11月14日至15日,参与我们在上海举办的首届KubeCon + CloudNativeCon中国论坛。希望能在那里见到您!

K8S中文社区微信公众号

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址