タグ

青空文庫に関するakirakiのブックマーク (2)

  • 青空文庫形態素解析データ集

    青空文庫の作品の形態素解析データを無料で公開します。概要 青空文庫の作品に対し、textsearch_jaで形態素解析を行ったCSVデータを無料で公開しています。 CCライセンスの範囲内であれば、登録・報告作業の必要なしに、営利目的であっても ご自由にデータをダウンロードしてご利用いただけます。 データ形式はCSV形式で下記のようなイメージになります。詳しくは解析データ説明をご覧ください。 解析対象データ 2012年12月時点で青空文庫で公開されている作品中で、作品著作権フラグがない作品のうち 11,176件分のデータを解析しています。 解析対象データ一覧をこちらからCSV形式でダウンロードできます。 ※1作品に複数人の著者等が登録されているケースがあるため、レコード数は11,176件ではありません。 解析データダウンロード 解析データを作品別にダウンロードしたい場合は、 解析

  • AozoraEpub3 Wiki【5/21更新】

    青空文庫の注記入りテキストファイルをePub3ファイル(zip圧縮)に変換するツールです。 ・青空文庫txtのテキスト+画像ファイル(またはzip/rar)のePub3変換 ・Web小説HTMLを取得して青空文庫txt形式で保存→ePub3変換 ・画像zip/rarを画像ePub3に変換 が可能です。 利用上の注意 変換で対応していない注記があります。(同行の地付き、2段組) 青空文庫の仕様外の注記等があるとxhtmlエラーで章ごと表示されない場合があります。(※エラーは変換時のログに表示されます) 端末にフォントがない場合は空白または□のような記号で表示されます。 画面を縦横で回転できる端末では、画像がはみ出す場合があります。

    AozoraEpub3 Wiki【5/21更新】
  • 1