Office 365 を利用している組織では、定義的に重要な情報を取り扱っているケースは多くあるものと思われます。
それらのデータはむやみやたらに存在するのではなくある程度マネージした環境にあるべきです。このデータの場所をマネージするために DLP というデータ損失防止機能が Office 365 にも搭載されています。
こういった重要な情報は組織ごとにパターンが異なるため、組織で定義していく必要があるのですが、 Office 365 ではいくつかのパターンを抽出条件として定義しています。
この定義が 2020年 12月 中旬よりライセンスのサービスプランとして抽出され、利用にはライセンスが必要となることがアナウンスされていました。
ここでいう抽出条件というのは、日本に関連するものとして以下 docs に記載されいている 8つ が定義されています。
例えば上記のように銀行口座などですね。
銀行口座の場合、 85% 程度の確率でランダムな情報から見つけ出してくれるようです。
実際は DLP と連携して利用することになるのですが、 Microsoft 365 セキュリティセンターの分類、機密情報の種類の項目で確認することができます。
https://security.microsoft.com/sensitiveTypes
データが含まれると思われるファイルを添付することで、ちゃんとひっかけてくれるか、テストすることもできるようになっています。
1MB 程度のファイルで動作確認してみたところ 30秒 程度で結果が返ってきました。
実際の利用は DLP の自動実行となるため、速度を意識することは少ないかと思いますが、テストだけでも面白く使えそうな気がします。まずはこの抽出の試験を試してみたいですね!
音楽:遥かなる山河