タグ

評価と読書に関するmyrmecoleonのブックマーク (1)

  • 読みやすさ度解析プログラム 2 | 丸山高弘の日々是電網 The First.

    この類いは、どうやら《特許》の対象にもなるらしいので、あんまりあれこれ書かない方がいいみたいなんだけど、そこはやっぱり書いちゃうんですよ。(^_^; これまで考えてきた中で、読みやすさ度を数値化するポイントがいくつかあります。 1.文章解析 いわゆる、テキストを形態素解析する考え方。日語の文章には、ひらがな/カタカナ/漢字/英数字(ローマ字、英単語)などが混じりあってできています。それらが、どのくらいの頻度で登場するのか、また、辞書などとつきあわせながら、使用頻度などを解析する方法。実はこの技術は、ワープロソフトや日本語入力(かつてはFEP: Frontend Processerとよび、今ではIME:Input MEthodと呼ぶもの)の変換率を高めるためにも使われている。さらには、検索エンジンに入力された語句から、検索語を抽出するのもこのあたりの産物。 ただ、これだけでは「の読みやす

    読みやすさ度解析プログラム 2 | 丸山高弘の日々是電網 The First.
  • 1