タグ

GAEとdbに関するsifueのブックマーク (2)

  • Google App Engineで全文検索 - 星屑日記

    調べた限りGAEには(日語を)全文検索する機能はついてない。なのでちょっくら作ってみました。一応動くのは出来たけど、いろいろ不満な点が多い。転置インデックスはN-gramでN=2で作成。サンプルをサイトで公開してますが、検索は完全一致で結果の順位は考慮してません。最もシンプルなシステムで、検索語句を入力すると、Datastoreに格納されているその語句が含まれる文章を表示し、検索語句を強調表示します。また、100文字以下の文章ならDatastoreに格納できます。何故100文字以下かというと、文字数が多くなるとそれに伴い転置インデックスの作成量を増えていきます。となると、処理時間も長くなってGAEの処理時間オーバーのエラーが発生してしまう。うーん、もっと効率のよい転置インデックスの作成方法がないものか。全文検索の心臓部分のコードは以下の通り。GitHubにも置いてます。 http://g

    Google App Engineで全文検索 - 星屑日記
  • GAEでTwitter botを作った - すぎゃーんメモ

    初めて、Twitter botなるものを作ってみた。 http://twitter.com/zenra_bot 公式ページ:http://zen-ra.appspot.com/ フォローするとフォローし返します フォローを外されると同様にフォローを外します フォロワーの発言を拾って、勝手に全裸に書き換えます 例:「@sugyan が全裸で言った: ********」 非公開の発言は拾わないようにしています。 たまに独り言もつぶやきます 実装 Google App Engine(Python)で作りました。 ソースコードはGitHubにて公開しています。 GitHub - sugyan/Zenra: 全裸にする 基的にcronでフォロワーのチェック&更新、つぶやきを行っているだけ。 特に外部のライブラリを使わずにGAEのurlfetch APITwitter APIを直接叩いたり。 一番

    GAEでTwitter botを作った - すぎゃーんメモ
  • 1