井野口さんが、10月2日の記に対してコメントしてくれて、こういう質問をしてくれた。 最近のスキャニング(+OCR)では、画像中の位置情報までメタデータとしてデータ化してしまう、ということは結構普通に行われていることなのでしょうか。 これに応えることは、とても重要だと思う。なぜなら、「この記が一番言いたいこと」に関係してるから。 いつものごとく、「この記が一番言いたいこと」は、「本の電子化は、人間が読むためじゃないよ」ってこと。 そうすると、普通に考えれば、OCRで単に文字データ化されれば、それで十分だよね。 言い換えると、 この画像(20KB、http://www.hti.umich.edu/cache/a/b/u/abu9581.0001.001/00000149.tifs.gif)に対しては、 PROBLEMS. 145 By express^^ algebraically, the