Microsoft BPOS – Fail 1 – atualizado as 22:55

Araraquara (bad news). Uma dos grandes questionamentos que são feitos quando uma empresa adota uma solução SaaS, ou qualquer outra solução de cloud computing, é sobre a disponibilidade e qualidade do serviço. A Microsoft tem trabalhado com uma qualidade exemplar no BPOS, até ontem. Nós da América do Sul estamos sofrendo com problemas no Exchange Online desde ontem. Esse é o relato do health dashboard, com as respectivas informações:

image
Visão geral dos serviços que estão com problemas.

image
Problemas com o OWA aparentemente sanados.

image
Fluxo de e-mail no Exchange: a Microsoft está trabalhando, mas a situação ainda não está 100% normalizada.

Vamos esperar e ver qual será os próximos passos dados para a solução do problema. O twitter do time de serviços online, @msonline, já enviou um pedido de desculpas sobre o problema.

image
Informações sobre o problema disponibilizadas pelo twitter do @msonline.

De acordo com eles, a causa do problema já foi solucionada, mas a fila para entrega das mensagens ainda é grande. O twitter recomenda que seja monitorado o helth dashboard para novas informações.

Esse é o ponto quando falamos de cloud computing: tudo vai bem quando a carga ou o volume que o serviço trata é moderado. Mas agora que o Exchange Online cada vez mais está sendo utilizado é a  hora que a Microsoft deverá provar que tem uma ótima infraestrutura e suporte para SaaS. Particularmente, continuo acreditando que sim.

É esperar para ver.

22:55 – Atualizando:

O pessoal do Time de Serviços Online solucionou o problema. Segue os trechos mais importantes no health dashboard:

image
Print com as informações abaixo.

Time
Description

8:45 PM
Additional information
The BPOS Operations team has resolved the problem affecting Exchange Online mail flow for customers served from this region. All mail queues are fully drained and all mail flow has returned to normal. The team will provide a full post mortem of this incident and also will provide final updates on how our service level agreement (SLA) was impacted.

8:07 PM
Performance degradation
The BPOS Operations team continues to monitor email flow in the environment. 90% of email queues have drained and new email is being sent and received without delays. Next update will be within one hour or when new information is available.

7:12 PM
Performance degradation
The BPOS Operations team continues to monitor email flow in the environment. 80% of email queues have drained and new email is being sent and received without delays. Next update will be within one hour or when new information is available.

6:12 PM
Performance degradation
This is a short update on work underway to resolve problems that have occurred with the Exchange Online Service on May 12 2011 and the actions that the team is taking to resolve these problems. Starting at 9:10am PDT, service monitoring detected malformed email traffic on the service. This malformed email traffic resulted in problems sending and receiving email until 10:03am PDT, when the problem was rectified. The offending mail was removed from the service, and service restored. Email was delayed by ~45minutes during this time. A second issue was detected via monitoring at 11:35am PDT, with email stuck in end users outboxes. The issue was remediated at 12:04pm PDT. During this time, more than 1.5 million messages had queued on the service awaiting delivery. This email is now flowing through the system, however because of this large volume of email; we are experiencing delays of as long as 3 hours. The team continues to work to fully resolve the issue, and will provide a full post mortem of this incident following service restoration, and also will provide additional updates on how our service level agreement (SLA) was impacted.

5:12 PM
Service interruption
The BPOS Operations team continues to monitor email flow in the environment. Email queues continue to drain, but we still see delays of up to 3 hours based on the significant amount of email that is queued. Next update will be within one hour or when new information is available.

4:19 PM
Service interruption
The BPOS Operations team continues to monitor email flow in the environment. The team has resolved issues with users seeing email stuck in draft or outbox. Users with mail that was previously queued in their outbox may see delays of up to 3 hours for final delivery based on the significant amount of email that is queued. Microsoft is closely monitoring the situation and expects mail queues to reduce to normal levels in the next several hours. Next update will be within one hour or when new information is available.

 

Nesse informativo, vejo uma informação importantíssima: será informado como o SLA foi afetado. Vamos aguardar essas informações e ver quais serão os próximos passos após esses problemas.

Abraços,

Carlos Monteiro.

Tags: , , , , , , , , , ,

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s


%d blogueiros gostam disto: