タグ

bookとreCaptchaに関するmyrmecoleonのブックマーク (5)

  • 4億以上の単語を99%の正解率で解読:OCRで認識できない大量の文字をウェブ認証技術を使って人力で解読する”reCAPTCHA”

    4億以上の単語を99%の正解率で解読:OCRで認識できない大量の文字をウェブ認証技術を使って人力で解読する”reCAPTCHA”
  • 2007-11-22 - simpleA@hatena[書籍電子化]「アキラメない」連中の系譜

    書籍の電子化について、現状把握をしよーとしてんだけど、今回の切り口は、「OCRのあたり」。 書籍電子化の歴史と、OCR*1の発展の紆余曲折は、姉妹のよーなもの。 OCRの発展の紆余曲折を知ることはとっても大事。 ただ、紆余も曲折もぜーんぶ見ようとすると大変だから、とりあえず「アキラメない」面々に注目しましょ。 出発点:OCRってダメじゃん。使えねぇー。 使えないOCRを前にして、たいていはアキラメる。もーだめだ、書籍電子化なんて、やってられん、ってな感じで。(上図、右の矢印で出て行ってしまう。) ところが、世の中には、なかなかアキラメん連中がいるもので、時に彼らはとんでもないイノベーションをもたらす。*2 使えないOCRを前にして、それでもアキラメなかったのは、次の3派。 1.それでもかけっぱ派 (左派) 2.タグでいいじゃん派 (中道) 3.なんとしても修正じゃい派 (右派) 第1の「そ

    2007-11-22 - simpleA@hatena[書籍電子化]「アキラメない」連中の系譜
  • What is reCAPTCHA?

    Digitizing Books One Word at a Time reCAPTCHA is a free CAPTCHA service that helps to digitize books. A CAPTCHA is a program that can tell whether its user is a human or a computer. You've probably seen them — colorful images with distorted text at the bottom of Web registration forms. CAPTCHAs are used by many websites to prevent abuse from "bots," or automated programs usually written to genera

    myrmecoleon
    myrmecoleon 2007/05/27
    ハマるな,これ。
  • reCAPTCHA - ものがたり(旧)

    うちの、じゃなかった、GoogleのインターンBenが(というかCMUが)、何か楽しい物を公開している。 http://recaptcha.net/ CAPTCHAでわれわれ人類がキーボードを叩く10秒程度の作業も、スキャンした古い書籍類をデジタル化する時間にしたら、1日に約160,000時間もの作業量になる! というわけで、これでCAPTCHAの代わりにしてくれたら、その完全な代替とは言わないまでも、それに近いものになってくれるんじゃないか、という発想で作られたサービスがこのreCAPTCHAだ。 reCAPTCHAを出すと、入力テキストが2つ出てくる。このうち、「正解」をもっているのは1つだけだ。もう1つは、OCRでスキャンした時に判別できなかったテキストだ。reCAPTCHAは、1つの(正解のある)単語を正しく入力したユーザーエージェントは、もう1つの単語についても正しく入力した人間

    reCAPTCHA - ものがたり(旧)
  • カーネギーメロン大学,画像認証を書籍デジタル化に活用するサービス「reCAPTCHA」

    カーネギーメロン大学は米国時間5月24日,CAPTCHAと呼ばれる画像認証技術を書籍のデジタル化に活用するオンライン・サービス「reCAPTCHA」を発表した。同サービスでは,CAPTCHAによるユーザー認証を行う際,通常の認証用画像と一緒に,書籍デジタル化で歪んだ文字スキャン画像も表示し,両画像に対応する文字を入力してもらうことで認証と書籍デジタル化を同時に処理する。 CAPTCHAは,ユーザー認証などで必要なパスワード文字列を歪ませるなど,故意に読みにくくした画像として画面に表示し,入力された文字列と元の文字列を比較する。これにより,実際に人間が手作業で入力しているかどうかを判断でき,プログラムなどを使った不正アクセスやスパム・コメント投稿などを防ぐ。 reCAPTCHAでは,通常のCAPTCHAによる認証時に,デジタル化できなかった不鮮明な文字画像を表示し,適切な文字を入力してもらう

    カーネギーメロン大学,画像認証を書籍デジタル化に活用するサービス「reCAPTCHA」
    myrmecoleon
    myrmecoleon 2007/05/26
    「認証時に,デジタル化できなかった不鮮明な文字画像を表示し,適切な文字を入力してもらう」うわあ,この発想はなかった。
  • 1