タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

正規表現と文章に関するefclのブックマーク (2)

  • 日本語の文章を単語に分割する(分かち書きをする) - DoboWiki

    DOBON.NET DOBON.NET プログラミング道 .NET Tips 最近1週間の人気の20件.NETプログラミング研究/93 ( 122 / 149 / 138075 ) ぱたうさ ( 79 / 98 / 30611 ) .NETプログラミング研究/111 ( 78 / 81 / 46565 ) XBOX360/Review/PGR4 プロジェクトゴッサムレーシング4 ( 59 / 39 / 10267 ) free/kanaxsCSharp ( 58 / 74 / 30003 ) .NETプログラミング研究/94 ( 57 / 60 / 59892 ) .NETプログラミング研究/112 ( 55 / 81 / 37008 ) .NETプログラミング研究/72 ( 51 / 71 / 48203 ) .NETプログラミング研究/98 ( 48 / 57 / 42320 ) .N

    efcl
    efcl 2011/12/29
    TinySegmenterの移植まとめ
  • 形態素解析もどきを改良してみた

    形態素解析もどきを改良してみた 「JavaScript形態素解析もどき」を少し改良してみました。今までは漢字、ひらがな、カタカナ、英数字、記号などで分けていただけなので、 「今日はいい天気でした。」 という文章を解析すると 「今日|はいい|天気|でした|。」 となって、「はいい」などと変な区切りができたりしていました。 そこで、助詞で区切ってから、その後で漢字、ひらがな、などで分けるようしてみました。そうすると 「今日|は|いい|天気|で|した|。」 という感じで分けることができます。 ただ、 「とても大きい」 という文章だと 「と|て|も|大|きい」 となってしまったりで、問題もありますが。 JavaScript のソースはこんな感じです。 function SimpleAnalyzer() { this.re = new RegExp; this.re.compile("[一-龠々

    形態素解析もどきを改良してみた
    efcl
    efcl 2010/11/15
    漢字、ひらがな、カタカナ、英数字、記号
  • 1