エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
日本IBM、国立国会図書館の全文テキスト化システム・プロトタイプを開発 | RBB TODAY
日本アイ・ビー・エムは1日、国立国会図書館が蔵書の大規模デジタル化作業の一環として実施した全文テキ... 日本アイ・ビー・エムは1日、国立国会図書館が蔵書の大規模デジタル化作業の一環として実施した全文テキスト化システムプロトタイプ構築事業において、全文テキスト化システムのプロトタイプを開発したことを公表した。 日本語は、ひらがなやカタカナに加え、多数の漢字(常用漢字2,136文字、旧字・異体字等を含め約10,000文字)を用いて表記されている。また、ルビ、縦横書きの混在など、表現も多様である。そのため、デジタル処理による全文テキスト化の実現が困難であった。今回のプロトタイプは、この様な日本語特有の問題を解消し、明治以降の各年代の日本語書籍の全文テキスト化作業の効率化を目指したものとなっている。 このプロトタイプは、「共同校正機能」(共同文字校正、共同仕上げ校正)、「共同構造化機能」(読み上げ順序修正、構造情報付与)の2つの機能を中心としたものになっている。共同校正機能では、Webブラウザ経由で
2011/08/01 リンク