Microsoft 365 サービス停止の範囲が意外と広かったようです

2022 年 1 月 25 日に発生した Microsoft 365 の大規模アクセス不能障害ですが、サービスの正常性のを見ていると前後に 3 件ほど同様の障害が発生していたようです。

1.2023 年 1 月 25 日 16:00 ~ 21:40 ごろに起きた Microsoft 365 アクセス障害

2.2023 年 1 月 25 日 16:50 ~ 18:20 ごろに起きた Dynamics 365 アクセス障害

3.そして 2023 年 1 月 26 日 9:00 ~ 11:30 ごろに起きた Teams を中心としたアクセス障害

障害が起きたことは残念ですが、かなりスピード感をもって復旧に臨んでいたことも同時にわかりますね。

1の障害は以下のように WANの構成変更に伴うものだったようです。

WAN の変更ということですから、 Azure AD の IPv6 化などを行っていたのかもしれませんね。

2の障害も原因は似たようなものとなっており、ネットワークのコンフィグをミスしてしまった。ということのようですね。これを見てもわかりますが、ネットワーク周りは影響範囲が広くなりがちです。これを局所化できるような考え方が出てくるとよいのですが、共通コンポーネントという概念はどこまで行ってもなくならないので、範囲などを区切ってみていくしかないんでしょうね。

3つめの障害はちょっと他とは異なっており、 Teams 会議の作成に問題があったようですね。

Teams の問題はさらに面白いことが書かれており、なんと自己解決になっているんですよ。

問題が発生したのちに自動復旧する。やっぱりこういった対応がなされているのはよいですね。

今回はちょっと大きめの問題となりましたが、復旧までの時間は本当に短いと感じます。引き続きより良いサービスを提供してくれることを願いたいと思います!

音楽:I'm not straight