作者 | Steef-Jan Wiggers
译者 | 张卫滨
策划 | 丁晓昀
谷歌最近为其消费提供了云基础设施可靠性指南,该指南结合了工程师的最佳实践和专业知识。
该指南的受众是那些希望为云基础设施做出正确决策以托管其工作负载的消费者。在 Google Cloud 的博客文章中,谷歌的高级工程师 Nir Tarcic 和跨产品解决方案开发者 Kumar Dhanagopal 这样说到:
Google Cloud 的基础设施可靠性指南能够带领你了解 Google Cloud 中构建基块的可靠性,以及这些构建基块如何影响云资源的可用性。你会更深入地理解 region、zone 以及部署在单个 zone、多个 zone 和跨 region 的应用的平台级可用性指标。
在该指南中,消费者可以找到可供选择的部署架构,以便在不同的地点分配资源和部署冗余资源:
单 zone 架构对能够容忍工作负载停机或者企业在必要时能够在另外一个位置快速部署应用的场景来说是足够的。
多 zone 架构适用于对 zone 中断需要保持韧性,但是能够容忍 region 中断造成停机的工作负载。
多 region 部署架构是业务关键工作负载的理想选择,在这种场景下,高可用性至关重要,比如零售和社交媒体应用。
图片来源: https://cloud.google.com/architecture/infra-reliability-guide/design#deployment_architectures
消费者还可以找到关于流量和负载管理的技术,比如容量规划、自动扩展和变更管理指南,以减少基础设施资源的可靠性风险。
与之类似,其他公有云供应商也有关于可靠性的指南和产品。例如,微软有一个专门的网站,提供与 Azure 可靠性相关的产品概述、培训和文档。AWS 提供了一份 文档(可靠性支柱)作为其 Well-Architect 框架的一部分。
谷歌的开发者关系和对外管理总监 Richard Seroter 在 LinkedIn 的帖子中表示:
公有云中有许多韧性相关的功能,你甚至不需要自己去考虑它们。有些事情就是在你不做任何事情的情况下也能更好地工作!但总的来说,系统韧性是一个架构问题。这是你需要在意的工作。这个新的 Google Cloud 指南可以帮助你在应用程序运行的地方建立更可靠的基础设施。
最后,谷歌提供了更多的指导,包括构建可扩展和韧性应用程序的模式和最佳实践。
Google Delivers Comprehensive Cloud Infrastructure Reliability Guide(https://www.infoq.com/news/2023/01/google-cloud-reliable-infra/)