Amazon EC2: un downtime che non ci voleva
Negli scorsi giorni Amazon EC2, la piattaforma di cloud computing di casa Amazon, ha subito un nuovo downtime, l'ennesimo nel giro di pochi giorni, causato da una tempesta nella zona della Virginia, come spiegato anche nel nostro articolo. Brutta storia, perchè tanti marchi del mondo Internet sono ospitati proprio in quel data center e nonostante dovessero avere ridondanze adeguate, molti di loro sono finiti offline: per darvi una idea di chi popola i rack della cloud di Amazon vi sono nomi come Netflix, come Instagram, e decine di altri clienti che per ovvie ragioni non possono nemmeno dire di avere le proprie istanze virtuali in quello specifico data center di Amazon.
Un articolo di TechCrunch si chiede se ci sia modo per queste compagnie di evitare questi fastidiosi downtime, facendo intendere che queste compagnie investono milioni di dollari nelle loro infrastrutture e un semplice downtime rovina il lavoro di mesi da parte dei system architectures. Ovviamente torna utile la lezione di Twillio, startup che oltre un anno fa spiegò come poteva evitare il downtime all'interno di Amazon grazie alle scelte intraprese. Amazon EC2 in questo momento è tornato alla normalità, il problema è stato di natura elettrica e ha quindi fermato l'intero data center dal punto di vista dell'alimentazione, una casistica che è molto frequente in tutti i data center del mondo.
Bisogna dire che la tempesta ha lasciato al buio più di 1 milione di persone nell'area di Washington DC lo scorso Sabato pomeriggio, il che significa un evento di portata non sempre prevedibile nemmeno per Amazon. Come sempre accade ora l'attenzione è su Amazon EC2, ma nel mondo accadono milioni di eventi simili ogni anno, a provider di dimensioni davvero inferiori: la strategia secondo il VP di Nirvanix, un'altra concorrente di Amazon, è quella di utilizzare più soluzioni di cloud computing contemporaneamente. Altri fanno notare che molti data center, nella stessa zona di Amazon, sono rimasti online senza alcun problema, semplicemente utilizzando i generatori elettrici.
AWS è rimasto comunque disponibile in tutte le altre regions e data center nel mondo, il che significa che compagnie come Heroku, che a loro volta forniscono servizi di cloud computing, non sono ancora riuscite a trovare il giusto compromesso per poter offrire i loro servizi: i downtime di questo genere spesso generano maggiore downtime perchè riguardano lo spegnimento improvviso di istanze che contengono database o servizi che non possono essere arrestati improvvisamente. Anche qualora AWS torni online in tempi molto rapidi, significa spendere ore con i propri sysadmin per le verifiche all'integrità dei file system e dei servizi attivi.
