Microsoft Lens に OCR 機能が追加されていました

Microsoft Lens をご存じでしょうか。

スマートフォンのカメラアプリとなるのですが、 OneDrive アプリにカメラがついてから、すっかりその出番がなくなっていました。

そんなこともありほとんど利用していなかったのですが、久々に起動したところ、処理という新しい機能が追加されていました。

処理には 3 種類あって、認識されたテキストの抽出、認識されたテーブルの抽出、イマーシブリーダーです。

これらどれもが OCR の機能で、テキストの抽出なのですが、もともとホワイトボードモードで撮ったあとに Word で出力する機能があったため、その出力前の情報を抜き出せる機能のように見えます。

以下、利用前に出てきた機能紹介です。

【認識されたテキストの抽出】

f:id:mohessu:20210627020941p:plain

【認識されたテーブルの抽出】

f:id:mohessu:20210627021033p:plain

【イマーシブリーダー】

f:id:mohessu:20210627021053p:plain

認識されたテーブルの抽出のみ対応言語が絞られていますね。

どれも日本語は対応できているようでした。

さっそく動作を試してみましょう。
この前行った映画の半券をテキスト抽出モードで読み取りたいと思います。

f:id:mohessu:20210627020633p:plain

シャッターを押すと自動画像補正で、うまく正面から取れなくても対処してくれます。
斜めの場合は言葉が崩れそうですが、この感じでどこまで見てくれるでしょうか、、、

確認を押していきます。

f:id:mohessu:20210627020834p:plain

データの抽出に少し時間がかかるようで、ぐるぐると 10 秒くらい読み取っていました。

f:id:mohessu:20210627020721p:plain

こんな感じに読み取ることができました。
結構いい線いっているように思えます。

総じて惜しい！という感じなのですが、これ IME と連携して予測変換し AI が文字数などから最終判断するようにすればまともに読めるようになりそうな気がします。

f:id:mohessu:20210627020758p:plain

データはコピーして貼り付けたりできるので、二次利用も簡単にできそうですね。

今でも文字起こしの原型として利用できそうですが、これからの進化にも期待できそうな機能に仕上がっています。

アプリは無料ですので、利用されていない方は一度チェックしてみるとよいかもしれません。

音楽：松の実

（）のブログ