エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
画像になっている表組みを、表組みのままテキスト抽出する方法(WordのOCR機能) | kotalog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
画像になっている表組みを、表組みのままテキスト抽出する方法(WordのOCR機能) | kotalog
最近のOCR機能(テキストを読み取ってデジタルデータに変換する)は精度もよくなり、なにより手軽に取り... 最近のOCR機能(テキストを読み取ってデジタルデータに変換する)は精度もよくなり、なにより手軽に取り込めるものも増えてきました。MicrosoftのWordや、Google ドキュメントにもこの機能が搭載されています。 単なる文章のスキャンであれば簡単なのですが、今回は印刷された表組み(テキストを選択できないもの)のデータ化をご紹介します。 今回使う原稿 元原稿は、A4サイズの印刷物です。まずはデジタルデータにするのに、PCやスマホに画像として取り込まなければいけません。最近では、Office LensやEvernote Scannableと言ったスキャンアプリが人気です。傾きも自動で補正してくれますし、色味も整えてきれいなモノにしてくれます。しかしながら、文字をスキャンする際、ゆがみや汚れは誤認識の元になるため、今回はフラットヘッドスキャナで画像取り込みを行いました。原稿の大きさや状態が