米Googleは米国時間2009年9月16日,CAPTCHA(図)と呼ばれる画像認証技術を手がける米reCAPTCHAを買収したと発表した。reCAPTCHAは,CAPTCHAサービスを提供する際にOCR処理で歪んだ文字スキャン画像を表示することで,書籍のデジタル化(テキスト・データ化)活動を支援している。GoogleはreCAPTCHAの技術を利用して各種サービスの認証機能を強化するほか,「Google Books」「Google News Archive Search」のOCR精度を改善する計画。 reCAPTCHAは,CAPTCHA認証時にOCR処理でテキスト・データ化できなかった不鮮明な文字画像を表示する。ユーザーの入力する適切な文字を集めることで,書籍デジタル化時の文字認識精度を高めることが目的。カーネギーメロン大学が書籍デジタル化コンソーシアムOpen Content Alli