Em 17 e 18 de dezembro uma das zonas de disponibilidade da Amazon Web Services em São Paulo apresentou diversas falhas de funcionamento: a nuvem caiu! Vários serviços foram afetados. Durante algumas horas, vários clientes da AWS tiveram problemas com seus sistemas, servidores de email, sites e bancos de dados. Ao longo do dia 18 os serviços foram sendo gradualmente restabelecidos, e tudo voltou ao normal. Essa não é a primeira vez que um evento desse tipo acontece, seja com a Amazon, com a Microsoft, com o Google e diversos outros provedores de serviços de Cloud Computing ao redor do mundo. Certamente, também não será a última.

shutterstock_182554532_regioes_planeta

Passada a crise, que lições podemos tirar dela?

Antes de mais nada, é importante ressaltar que os problemas da AWS em São Paulo se restringiram a apenas uma das duas zonas de disponibilidade. Para entender melhor, os serviços de Cloud Computing da AWS estão distribuídos por várias regiões do mundo. Cada região é completamente independente e isolada das outras. Atualmente, os serviços da AWS estão distribuídos em oito regiões distintas:

Regiões da AWS

Código Região
ap-northeast-1 Asia Pacific (Tokio)
ap-southeast-1 Asia Pacific (Singapura)
ap-southeast-2 Asia Pacific (Sidney)
eu-west-1 EU (Irlanda)
sa-east-1 South America (São Paulo)
us-east-1 US East (Northern Virginia)
us-west-1 US West (Northern California)
us-west-2 US West (Oregon)

Cada região, por sua vez, oferece duas ou mais zonas de disponibilidade. Em São Paulo, por exemplo, há duas zonas de disponibilidade. Cada zona de disponibilidade é um data center completo, com infraestrutura independente. Dentro de cada região, as zonas de disponibilidade são conectadas por links de baixa latência (isto é, velozes e com tempo de resposta baixo). A figura abaixo exemplifica a relação entre regiões e zonas de disponibilidade:

NUVEM CAIU F2

 

Zonas de Disponibilidade

A AWS oferece ainda alguns recursos específicos de integração e replicação que facilitam a instalação de uma solução em mais de uma zona de disponibilidade dentro da mesma região. Naturalmente, essas facilidades visam incentivar a construção de soluções que ofereçam alta disponibilidade justamente por poder suportar falhas em apenas uma das zonas.

Portanto, soluções que foram concebidas considerando a possibilidade de falha em uma zona de disponibilidade não apresentaram problemas durante o período de instabilidade ocorrido em São Paulo.

Maior redundância, maior custo

Ainda, um sistema de missão realmente crítica, cuja indisponibilidade gere grandes prejuízos, pode ser concebido para rodar em mais de uma região da AWS, visando minimizar situações ainda piores, como catástrofes naturais ou problemas na infraestrutura de comunicação de um país.

Entretanto, cada nível de redundância fatalmente acarreta em aumento de custo dos serviços utilizados. Nem sempre o cliente está disposto a arcar com os custos adicionais de uma solução de alta disponibilidade. Nesse caso, ele terá que se conformar com esse fato da vida: a tecnologia de Cloud Computing, embora ofereça vários mecanismos que minimizam falhas, ainda está baseada em recursos que podem deixar de funcionar momentaneamente, exatamente como acontece com os data centers tradicionais.

Em nossa experiência, temos observado que o baixo entendimento sobre o funcionamento de Cloud Computing muitas vezes leva algumas organizações a acreditarem em poderes mágicos associados a essa tecnologia. Recentemente, constatamos que um sistema baseado em banco de dados, ao ser levado para a nuvem, não implementou nenhuma solução de backup. Ou seja, se o sistema apresentasse qualquer falha na gravação de dados, sobrescrevendo informações importantes do banco de dados, ou se o gerenciador de banco de dados apresentasse alguma falha momentânea que acarretasse na corrupção de alguma de suas tabelas, havia o risco de ocorrer a perda irrecuperável de dados relevantes para a operação da organização.

Uso Adequado e Segurança Real

Portanto, Cloud Computing só vai gerar os benefícios que pode proporcionar se sua adoção for realizada de maneira ordenada, e se seus recursos forem utilizados da maneira adequada. Caso contrário, essa adoção poderá gerar uma falsa impressão de  segurança, por puro desconhecimento, e quando os riscos se materializarem, os prejuízos podem ser imensos. Em muitas situações, temos visto que a migração de soluções para a nuvem se assemelha àquele aluno que se sente bem apenas por se matricular na academia de ginástica, tirando um peso da consciência, mas não vai a nenhuma sessão de exercícios. Depois, reclama que não conseguiu entrar em forma física e culpa a academia…

 

Google Cloud Computing
Oracle Cloud Computing – Vale a Pena Apostar?

Compartilhe

Compartilhe este post com seus amigos