タグ

ブログとTwitterに関するmidnightseminarのブックマーク (5)

  • 【Python】MeCabと極性辞書を使ったツイートの感情分析入門 - StatsBeginner: 初学者の統計学習ノート

    負のオーラを自動検出したい 前回のエントリで、著作権侵害にあたる違法アップロード動画を自分のTwitterで拡散してしまっている懸念を考えて、YouTube動画のリンクが貼ってあるツイートをまとめて削除しました。 前回のエントリでも言いましたが、著作権侵害モノ以外にも、「残しておくとまずいツイート」は色々ある可能性があり、たとえば誹謗中傷の類いがあるかと思います。誹謗中傷ツイートを自動抽出する方法はにわかには思いつきませんが、たぶん「クソ」とか「死ね」とか「バカ」とかそういう悪口の辞書が必要になりそうです。 ところで、言語データの分析手法として、単語ごとに感情特性を評価した辞書というものがあちこちで作られていまして、これを使ってツイートがどのような感情を帯びているか分析するということが、よくやられています。Yahoo!がそういうツールを提供してたりもします(参考リンク)。 Yahoo!のリ

    【Python】MeCabと極性辞書を使ったツイートの感情分析入門 - StatsBeginner: 初学者の統計学習ノート
  • Python作業メモ: 残しておくとマズそうな自分のツイートをまとめて削除する(YouTubeリンク編) - StatsBeginner: 初学者の統計学習ノート

    著作権侵害にあたるYouTube動画へのリンクを削除する たまにツイッターで、YouTubeのリンクを貼り付けたツイートをしていますが、よく考えたら違法アップロードに該当するものを拡散してしまっている可能性があります。可能性とかいう曖昧なレベルで考えるのが面倒なので、いっそのことYouTubeのリンクを共有した過去のツイートをいっぺんに削除してしまおうと思いました。 ついでに、人の悪口を言ってるようなツイートも削除して、自分のアカウントを「とてもいい人のアカウント」に変貌させていこうかとも思い出しましたが、まだ手法が検討できていません。(私の場合は必要性が低いですが、最近の就活生などには必要かも?) ツイートの感情分析を行って、負の感情の高ぶりが感じられるツイートを自動削除していけばいいんでしょうかね。文を形態素解析で単語に分けて、人名を含むツイートを抽出した上で、さらに単語ごとに感情の

    Python作業メモ: 残しておくとマズそうな自分のツイートをまとめて削除する(YouTubeリンク編) - StatsBeginner: 初学者の統計学習ノート
  • Pythonメモ: Tweepyのややこしいレスポンスデータの読み方 〜Twitter API活用の最初の難関〜 - StatsBeginner: 初学者の統計学習ノート

    Twitterのbot作りは良い勉強になる 以前のエントリで紹介したように、Tweepyというライブラリを使うと、かなり簡単にPythonTwitterを自動操作出来るようになります。 www.statsbeginner.net つぶやいたり、フォロー/アンフォローしたり、RTしたりふぁぼったりといったアクションをTweepyを使って記述し、自動で実行できる環境に置けば、自前のbotが出来上がります。botといえば、ブログ記事の紹介ツイートを定期的に流したり、新しいフォロワーにフォロバするといった使い方がよくされていますが、自作のプログラムであれば例えば特定のキーワードを含むツイートをしているユーザを検索してそのプロフィールを取得してデータベース化するとか、ふぁぼやRTをよくしてくれる人を一定の基準を設けてリストに登録していくといった複合的な作業も、自動化できて手間が省けます。 私は自分

    Pythonメモ: Tweepyのややこしいレスポンスデータの読み方 〜Twitter API活用の最初の難関〜 - StatsBeginner: 初学者の統計学習ノート
  • Twilog + Pythonで他人の過去の全ツイート(3200件超)を一括取得する方法 - StatsBeginner: 初学者の統計学習ノート

    Twitter APIで「他人の全ツイート」は取得できない さて先日から書いてるように、PythonのTweepyというライブラリを使うと、簡単にTwitterのREST APIを操作することができますので、研究で何か分析するときも、これを使えば手軽に分析用のデータが取得できます。レスポンスのデータの中身を読むのが大変ですが、それなりに理解はできてきました。 statsbeginner.hatenablog.com statsbeginner.hatenablog.com ところで、特定のユーザのツイートの傾向を見たいと思った場合、APIで全ツイートを取得したいところですが、残念ながら最新のものから数えて3200件までしか取得することができません。 「自分のツイート」であれば、Twitterが公式に過去の全件を出力する機能を付けてくれていますが(付属情報がほとんど入って来ませんが)

    Twilog + Pythonで他人の過去の全ツイート(3200件超)を一括取得する方法 - StatsBeginner: 初学者の統計学習ノート
  • はてな村観光案内所

    先日宮ヶ瀬ライドでご一緒したgoldheadさん、kanoseさんのエントリが相次いで大炎上、そのブコメの中で無関係なものを繋げて批判する声にカッとなって乱暴なコメントをしたものの、よくよく考えてみると「いやぁ、邪魔にならないよう気をつけるんで、どうか許したってくださいな」というスタンスでありたいと常々心がけたいと思っているので、「うるせえな自転車ってのはこういうものなんだよ黙れ!」という言い方はすべきではありませんでした。 その点で、乱暴なブコメを撤回、お詫びした上で、バイクラックとスタンド、ロードバイク乗りの感覚などについて、一通り書きたい次第。 ■炎上記事について goldheadさんの記事に関しては、先日の宮ヶ瀬ライドで巡ったスポットがいずれもロードバイク乗りを歓迎してくれる快適な環境だったので、「そんな快適な環境が増えたらいいねえ」という素朴な願望を書かれただけでしょう。これに関

    はてな村観光案内所
    midnightseminar
    midnightseminar 2011/12/11
    「ジャストアイディアな色々を投げる事はできるようになった。それをみんなで寄ってたかってコメントするのも様々な手段が用意されてる。じゃあそうした進化によって僕らの頭は整理されたか、知識が集積したか」
  • 1