AWS上构建共享自服务平台服务去中心化研发团队
近期在一个 Webinar 分享了如何在 AWS 上服务去中心化研发团队构建共享服务平台,核心观点总结如下, 这里的去中心化团队是同理想的完全化的 DevOps 团队(负责设计、开发、测试、运维以及运营等所有环节)相对立的。 在较大型的组织中,账户管理、网络规划、服务审计等模块会由平台,基础设施或安全团队所负责, 多个研发团队会负责各个业务系统的开发、测试、运维等。 如今组织的健康运营对安全性合规性要求越来越高,通常基础设施团队外加安全团队负责承担安全、合规需求的整体策略规划及实施。 但是满足安全、合规需求通常是同业务交付速度期望是相悖的。一方面,平台、安全团队要为应用上线或变更进行安全性与合规性审查, 而研发团队需要投入更多的资源 …
Read More应用程序弹性设计
AWS架构的完善(AWS Well-Architected)框架涉及了五大支柱, 其中可靠性支柱要求侧重于确保工作负载在预期的时间内正确、一致地执行其预期功能。 这要求应用程序系统具备弹性设计,可从故障中快速恢复,以便满足业务和客户需求。 然而设计、开发、且验证具备弹性设计的应用程序,对经验和实践能力都有很高的要求。 利用成熟的经验和良好的工具将加快构建符合预期的弹性应用程序。 Application Resilience Workshop是一套课程和动手实践学习如何进行实验来观察系统的行为, 例如,极端系统负载和网络中断情况下,使用不同的软件模式来减轻这些实验对系统稳态的影响。 整个实验也是分为假设、方法、观测和缓解等步骤,同混沌 …
Read More混沌工程是一种帮助系统满足弹性需求的技术,它起源于Netflix的工程实践,著名的猴子军团。 AWS一直提倡架构的完善(AWS Well-Architected),混沌工程正是卓越运营和可靠性支柱的实践。 因此在 re:Invent 2020 AWS发布了Fault Injection Simulator服务来简化开发者在AWS上的混动工程实践。 AWS FIS作为AWS上原生的混沌工程服务,目前已同EC2,ECS,EKS,RDS,CloudWatch,甚至是IAM Role API集成,可以触发这些服务中资源的变更来假设故障, 例如,重启或终止EC2实例,重启RDS实例等。 Chaos Engineering on AWS是一份非 …
Read MoreI'm trying to upgrade my Macbook Pro to macOS Monterey, however the installation can not be started due to the disk is encrypted by Filevault 😕 I have to turn off Filevault to disable disk encrpytion before installing macOS Monterey. I found this support article on how turning off Filevault, but it does not work at …
Read MoreI met a case to mirror existing Helm charts to another repository. It might be caused by network availability or compliance requirements. There are multiple ways to host a Helm repository, for example, Nexus OSS Repository, Github Pages, AWS ECR and so on. Amazon Elastic Container Registry (Amazon ECR) is a fully …
Read MoreAmazon Neptune is a managed Graph database on AWS, whose compute and storage is decoupled like Amazon Aurora. Neptune leverages popular open-source APIs such as Gremlin and SPARQL, and easily migrate existing applications. After exploring Neptune few months in solution, I have below few learnings, Bulk loading Always …
Read MoreLast year I shared the production-ready, cloud native solution to deploy Sonatype Nexus Repository OSS on AWS. The solution has an update with below notable changes, support specifying EKS version, v1.20, v1.19, and v1.18 are supported versions support provisioning to existing VPC support provisioning to existing …
Read More本方案的起因是,一个源代码托管在Github上的项目fix一个重要的bug后,在AWS上的持续部署流水线一直失败。分析日志后,发现流水线中的数个步骤需要克隆源代码,但是访问Github的网络非常不稳定,这数个流水线任务持续因连接超时,连接拒绝等网络错误而失败。而流水线任务大量使用了CodeBuild, Lambda等AWS托管服务,无法为执行环境配置可靠的网络连接。 本方案思路如下, 在 VPC public subnets 中创建 NAT instance 即 EC2 虚拟机, 配置 NAT instance,使用 tunnel 网络访问 github, 修改 private subnets 的路由表,添加 github …
Read MoreInfrastructure as Code is the trend to manage the resources of application. AWS CloudFormation is the managed service offering the IaC capability on AWS since 2011. CloudFormation uses the declarative language to manage your AWS resources with the style what you get is what you declare. However there are cons of …
Read More