日本語の文章をデタラメだけれどそれっぽく再構成する 日本語シャッフル スポンサード リンク ・日本語シャッフル http://pencilsoftware.com/j_shuffle.html 日本語の文章を入力すると、単語に分解してランダムに並べ直してくれるソフトウェア。単語の分解(形態素解析)にはYahoo! JapanのWebサービスを利用している。合成文章はランダムとはいっても日本語の特徴を再現するように構成されている。 たとえば、先日のブログの文章 ・伝説のプラモ屋―田宮模型をつくった人々 http://www.ringolab.com/note/daiya/archives/005284.html を入力すると上のサンプル画面のような合成文章が出力される。ぼうっと文字を目で追っているだけだと、本当の文章であるかのように錯覚する。よく読むと意味が通らない不思議な感覚。 それで、ど
国が考えた犯罪予防策の一つ、ネットでの犯罪予告等を自動収集するシステム。 数億かけようとしていたシステムを、たった一人の男性が数万円(サーバー、回線費用等考慮)と2時間で作り上げました。 簡単なシステム概要を言えば、ネット掲示板などに書き込まれた犯罪予告と思われるコメントを自動的に収集するシステムです。 国内ITニュースサイトでは結構話題になっていますが、一般の方までもっと浸透してほしいという願いをこめて記事を書かせていただきます。 本来あまり国内で話題のニュースを取り上げるのは私のブログポリシーに反しますが、もしかしたら何かの検索結果(当サイトではモバゲー、mixiで検索されて来る人も多い)で私のサイトに偶然たどり着き、たまたまこの記事を発見する可能性もあると思ったからです。 まずはこの快挙を声を大にして伝えたい。 その男の価値。数億円。 犯罪予告検知のソフト開発へ=来年度予算で要求-通
Google Operating System: How Google Blog Search Ranks Resultsによると、Googleのブログ検索に関する特許が明らかになったそうです。ポイントは参照元の記事にも書いてありますが、勉強がてらその特許を読んでみたので以下に概要をまとめておきます。[]で囲まれる数字は、特許本文にある項目に対応しています。 Googleのブログ検索特許の全文(英語です) ポジティブな要因とネガティブな要因でスコアを調整する ブログのスコアは、まず検索キーワードとブログの関連性で決まるブログの初期スコア(first score)を求め、ポジティブ・インジケータ(positive indicator)とネガティブ・インジケータ(negative indicator)によって初期スコアの調整をおこなうことで決定するそうです。(see Claim 1.) ポジテ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く