タグ

InternetとOCRに関するtsupoのブックマーク (2)

  • 画像内の文字をコピー&ペーストする

    資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを

    画像内の文字をコピー&ペーストする
    tsupo
    tsupo 2007/10/31
    クセロReader ZERO / これはよさげ。これを使えば、はてなのCAPTCHAを(略) / クセロPDF の姉妹品
  • スパムに対抗しながら書籍をデジタル化、一石二鳥の「reCAPTCHA」

    Webサイトで画像に埋め込んだ変形文字を入力させる「CAPTCHA」を活用し、書籍デジタル化を支援するプロジェクトが提唱された。 Webサイトでユーザー登録する際などに、画像に埋め込んだ変形文字を入力させる「CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)。これを活用し、スパムを防止しながら書籍デジタル化を支援しようというプロジェクトを、米国の研究者が提唱した。 このプロジェクト「reCAPTCHA」は、米カーネギーメロン大学のコンピュータサイエンス校が取り組んでいる。CAPTCHAとは、コメントスパムなどを防止する目的で、機械には読み取れない画像の文字をユーザーに入力させるシステム(関連記事)。 研究チームの推計では、CAPTCHAが使われる回数は1日当たり約6000万回

    スパムに対抗しながら書籍をデジタル化、一石二鳥の「reCAPTCHA」
  • 1