Microsoft 365 大規模障害の早期レポートがダウンロードできるようになっていました

2022 年 7 月 21 日に発生した Microsoft 365 の大規模な障害ですが、はやくも一報のレポートがダウンロードできるようになっていました。

Microsoft 365 管理センターよりサービスの正常性に入り、問題の履歴ページからダウンロードできます。

直接の URL は以下となっています。 Microsoft 365 にサインインしてからアクセスしましょう。

https://admin.microsoft.com/admin/api/servicehealth/postincidentreport?url=https://servicecommsprod.trafficmanager.net/v1.1/serviceAnnouncement/issues(%27MO402741%27)/incidentreport

ファイルは Word で構成されており、問題となった原因が記されていました。

当初内部ストレージの接続が壊れた。という話でしたが、 Enterprise Configuration Service という内部のデータベースの更新が原因となったとのこと。

一般的な業務システムでも時々やってしまう、バージョンアップのタイミングに不整合が起きてスキーマとデータで不一致を起こすという感じのやつですね。

また、問題発生からの経緯もかかれており、やはり 2 時間半くらいで初動対策が行われていたようです。

問題の発生していたサービスは、皆さんが気が付いた Teams が中心となり、 PSTN サービスや Microsoft 365 関連の仕組み全般で何らかの問題が起きていたようです。

Microsoft 365 Apps では Word に影響があったようですが、これはちょっと面白い感じですね。なぜそこに行きつくのでしょうね。

最後に今後の流れが書かれています。

これを見ると 2023 年 1Q までかけて ECS 自体の障害耐性を高めていくとのこと。

仕様レベルのバグって感じなのでしょうね。それを何とかするために時間がかかるというのも納得です。

というわけで今回の騒動は一定の収束を見せていますが、実はレポートはもう一回出ると思います。

これは早期版なので、次は確定版でしょうか。その内容も追っていきたいですね。

音楽:月のくじら