タグ

pdfとOCRに関するrichard_rawのブックマーク (10)

  • Willus.com's K2pdfopt

    v2.55 26 Dec 2023 Download (Windows, Linux, OSX) Contrib (GUIs; Native Kindle PDF Viewer) Help (with videos) FAQ Forum Wiki History Source Arch Linux PDF Conversion Tips Linux Install Mac Install OVERVIEW K2pdfopt optimizes PDF/DJVU files for mobile e-readers (e.g. the Kindle) and smartphones. It works well on multi-column PDF/DJVU files and can re-flow text even on scanned PDF files. It can also

    richard_raw
    richard_raw 2013/02/08
    複雑な書式のPDFを電子書籍端末に適したレイアウトに変換してくれるソフトウェア。OCRオプションがあるから自炊したものも……無理か。
  • いよいよラノベ登場!『スターダスト・シティ』は1巻目が広告無しPDF - (株)Jコミックテラスの中の人

    何と、Jコミにライトノベルが登場!! 巨匠・笹祐一先生の『スターダスト・シティ』です。 1巻目は広告無しのPDFで公開。 2巻目は広告付きのアルヌールでどうぞ。 http://www.j-comi.jp/book/comic/3401 作者の笹祐一先生は、大ヒットシリーズ『ARIEL』で有名ですよね。またイラスト担当は『イクサー1』の平野俊弘(現・平野俊貴)さんです。 1巻目の広告無しPDF版は、OCR(文字認識)によって、単語の検索などが出来るようになっています。文章をマウスでなぞると、文字が認識されていることが分かるはず・・・。

    いよいよラノベ登場!『スターダスト・シティ』は1巻目が広告無しPDF - (株)Jコミックテラスの中の人
    richard_raw
    richard_raw 2011/04/25
    ライトノベルも配信するんですな。しかもOCR済み。
  • Google Docs、画像から日本語を抽出するOCR機能搭載 | ネット | マイコミジャーナル

    Create and edit web-based documents, spreadsheets, and presentations. Googleは2月28日(米国時間)、Google DocsのOCR機能に新しく29のサポート言語を追加したことを発表した。この結果、Google DocsがサポートするOCR向け言語は34となる。今回の機能追加で日語もサポートされるようになっており、日語を含んだ画像やPDFをアップロードして、日語テキストを抽出することができる。 OCRによるテキスト抽出の機能を利用するには、画像をアップロードする段階で「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」にチェックを入れて、言語として「日語」を選択すればよい。画像とともに抽出されたテキストも表示されるようになる。 マイコミジャーナルに掲載された記事の画像 Go

    richard_raw
    richard_raw 2011/03/02
    精度はこれから、といったことろでしょうか。
  • 保存できる、ほぼA4サイズのデジタルノート(NoteSlate) : monogocoro ものごころ

    描いて消すだけのブギーボードに保存機能が着いた!といった感じの重さ280gで厚さ6mmでお値段99ドル(!)のe Inkのノート。 ディスプレイ面は、190x270mmなのでA4(210x297mm)より少し小さいだけ。 iPadKindleとの比較表は以下。 WiFi対応で、メールは見られるけどブラウザはNG。保存はSDカードやUSBで。MP3の再生、PDFtextが読める、180時間の長時間稼働、いずれOCRにも対応予定という、個人的には超魅力的な99ドルで13インチサイズのデジタルノート。 面白いのは、描く線の色ごとに3つのカラーバージョンが販売予定なこと。いい。 リリース予定は、6月にBasic,White,Blackが、12月に赤、青、緑、そして最後にカラー版も登場予定(価格不明)とのこと。待ち遠しい。 Thanks!!: Engadget Original: N

    richard_raw
    richard_raw 2011/01/21
    「WiFi対応で、メールは見られるけどブラウザはNG。保存はSDカードやUSBで。MP3の再生、PDFとtextが読める、180時間の長時間稼働、いずれOCRにも対応予定という、個人的には超魅力的な99ドルで13インチサイズのデジタルノート
  • スキャン代行業者の実力を比較する(前編)

    電子書籍の普及に伴って台頭してきた「スキャン代行サービス」。この代行サービスを取り扱う短期連載の第2回は、実際に各業者に発注し、サービスの内容を具体的に検証する。 前回の記事「スキャン代行サービスの現状と内容比較」では、スキャン代行サービスの現状についてお届けした。各社のサービスの概要はサイトの説明ページを読めばおおむね理解できるものの、実際の納品物のクオリティ、および各業者の対応の詳細は、やはり実際に発注してみないと分からないところが多い。 このため今回は、同一の組み合わせパターンとなる書籍を用意し、各業者にほぼ同じ内容で発注を行い、サービス内容の検証を行った。あくまで一例ではあるが、参考にしてほしい。企画では全部で7社の業者に依頼を行ったが、今回はまず4社、次回で残る3社について、検証結果をお届けしたい。 なお、前回も触れたとおり、スキャン代行サービスは著作権法30条1項にある「その

    スキャン代行業者の実力を比較する(前編)
    richard_raw
    richard_raw 2010/12/01
    スキャン品質は自炊と変わりませんか……。
  • 本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました

    をそのまま送ると裁断機でバラバラにした後、スキャンしてPDFデータなどに変換してくれるという、電子書籍時代が始まっているにもかかわらず既存の出版社がノロノロしているその間隙を縫うかのようなタイミングで出現したサービス、それが「BOOKSCAN」です。その舞台裏がどうなっているのかを実際に行って取材してきました。 結論から言うと、2010年4月の設立から約7ヶ月が経過、その間に新規参入業者が山ほど出現しましたが、「BOOKSCAN」はさらなる劇的な進化を遂げて差別化に成功しており、最初の頃からは考えられないレベルに到達していました。正直、わずか7ヶ月でここまでできるのだという意味では、まるで海外のスタートアップ企業のようなスピード感と、アイディアを形にする確かな技術力を感じます。 戦慄すべきその恐るべき舞台裏の中身は以下から。BOOKSCAN(ブックスキャン) 低価格・書籍スキャンサービス

    本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました
    richard_raw
    richard_raw 2010/11/25
    なにこの成長っぷり!
  • 新しさが詰まった無印良品の手書きメモ 〜 MUJI NOTEBOOK | ZONOSTYLE

    昨日、ちょっとワクワクするような知らせが届いた。なんと、あの無印良品でおなじみの良品計画からiPadアプリがリリースされたらしい。しかも、カレンダーと手書きメモアプリというから、期待も高まるよね。すでに、Underscore NotifyやNoteshelf、Penultimateなど、そうそうたるメンツが出そろっているこの分野で、どんなオリジナリティーを発揮してくれるのか。 ツイッターでも#iCreのハッシュタグに「気になる」とのツイートがいくつか寄せられていた。中には「すでにいいのを持っているから人柱待ち」なんてのもあり、オレは「人柱引き受けます。感想は良かったらブログに、そうでなかったらツイートします」と答えた。でもって、いま、こうしてこのアプリについて書こうとしているということは……。そうなんです。けっこう気に入っちゃいました。こいつには不思議な魅力がありますよ! ところで、無印良

    richard_raw
    richard_raw 2010/11/05
    誰でも使えて、奥深い。/手書き文字認識(しかも独自辞書)だと!
  • 電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています

    まずは下の表を見てください。 Perlベストプラクティス 作者: Damian Conway,クイープ出版社/メーカー: オライリー・ジャパン発売日: 2006/08/24メディア: 大型購入: 11人 クリック: 153回この商品を含むブログ (155件) を見る |版 / ページ数|B5版 / 513ページ| |スキャン|白黒 600dpi /(表紙のみ)カラー 300dpi| |圧縮前のサイズ|89.2MB| |圧縮後のサイズ|28.1MB| これは前回のエントリー「ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実」で調査対象にしたPDF)を、Adobe Acrobat 9(Pro / Standard)を使って圧縮した結果です。*1 前回のエントリーでは、 ScanSnap でスキャンした後に Adobe Acrobat で OCR テキスト認識

    電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています
    richard_raw
    richard_raw 2010/05/31
    これは参考にする。自分でも試行錯誤してみる所存。
  • PDF OCR X - Mac & Windows OCR Software to convert PDFs and Images to Text

    What is PDF OCR X? PDF OCR X is a simple drag-and-drop utility for Mac OS X and Windows, that converts your PDFs and images into text documents or searchable PDF files. It uses advanced OCR (optical character recognition) technology to extract the text of the PDF even if that text is contained in an image. This is particularly useful for dealing with PDFs that were created via a Scan-to-PDF functi

    richard_raw
    richard_raw 2010/05/23
    おお、オプションで日本語にも対応してる!シェアウェアだけど単ページなら無料版あり。
  • 橋本商会 » scansnapと裁断機を買って本を電子化しまくる

    を解体する為にこの裁断機を買った。14000円ぐらい。 大型ペーパーカッター 裁断機 まだ必要ないので買ってないけど、替え刃も発見した。 コピー用紙500枚らくらくカット/人気 商品大型ペーパーカッター用『替え刃』 ジャンプぐらいの厚い雑誌でも切れる。このサイズの裁断機では妙に安い(他の半額程度)だが、そのかわり届いた時点で油でぬるぬるしている。 軍手とぞうきんを用意しておいて、よく拭いた。 刃の部分には茶色い油?が付着しているので、試しにいらないを裁断してみて油の拭き残しが無いか確かめる必要がある。 油がついた。(古ぐらしは新しいのを持っているので、2003年版を試し切りに使った) ■裁断する まずスキャンできるようにをバラバラにする。 表紙を外す しっかり押さえる 切る 切る。裁断機の刃が超鋭いので、あんまり力はいらない。 バラバラにしたをscansnapに入れる iPhon

    橋本商会 » scansnapと裁断機を買って本を電子化しまくる
    richard_raw
    richard_raw 2010/01/04
    私的にタイムリー。参考になります。
  • 1