2022 年 1 月 25 日に発生した Microsoft 365 の大規模アクセス不能障害ですが、サービスの正常性のを見ていると前後に 3 件ほど同様の障害が発生していたようです。
1.2023 年 1 月 25 日 16:00 ~ 21:40 ごろに起きた Microsoft 365 アクセス障害
2.2023 年 1 月 25 日 16:50 ~ 18:20 ごろに起きた Dynamics 365 アクセス障害
3.そして 2023 年 1 月 26 日 9:00 ~ 11:30 ごろに起きた Teams を中心としたアクセス障害
障害が起きたことは残念ですが、かなりスピード感をもって復旧に臨んでいたことも同時にわかりますね。
1の障害は以下のように WANの構成変更に伴うものだったようです。
WAN の変更ということですから、 Azure AD の IPv6 化などを行っていたのかもしれませんね。
2の障害も原因は似たようなものとなっており、ネットワークのコンフィグをミスしてしまった。ということのようですね。これを見てもわかりますが、ネットワーク周りは影響範囲が広くなりがちです。これを局所化できるような考え方が出てくるとよいのですが、共通コンポーネントという概念はどこまで行ってもなくならないので、範囲などを区切ってみていくしかないんでしょうね。
3つめの障害はちょっと他とは異なっており、 Teams 会議の作成に問題があったようですね。
Teams の問題はさらに面白いことが書かれており、なんと自己解決になっているんですよ。
問題が発生したのちに自動復旧する。やっぱりこういった対応がなされているのはよいですね。
今回はちょっと大きめの問題となりましたが、復旧までの時間は本当に短いと感じます。引き続きより良いサービスを提供してくれることを願いたいと思います!
音楽:I'm not straight