並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 48件

新着順 人気順

テキストマイニングの検索結果1 - 40 件 / 48件

  • 【書籍メモ】『Pythonによる金融テキストマイニング』(朝倉書店) - u++の備忘録

    『Pythonによる金融テキストマイニング』(朝倉書店)を読みました。180 ページ弱で金融関連文書を題材にした話題がまとまっていて、この領域に飛び込む初学者向けに紹介しやすい書籍だと感じました。 www.asakura.co.jp 章立てを以下に示します。第 1 章で全体像を示した後、第 2 、 3 章で開発環境構築と MeCab などのツール・ライブラリを紹介します。第 4 章から第 7 章は、応用事例です。最後に第 8 章で、書籍内で扱えなかった話題や将来展望を解説しています。 金融テイストマイニングの概要 金融データ解析・機械学習の環境構築 テキストマイニングツールの使い方 多変量解析を用いた日銀レポート解析と債券市場予測 深層学習を用いた価格予想 ブートストラップ法を用いた業績要因抽出法 決算短信テキストからの因果関係の抽出 金融テキストマイニング応用の課題を将来 まず、第 4

      【書籍メモ】『Pythonによる金融テキストマイニング』(朝倉書店) - u++の備忘録
    • 【テキストマイニング】Pythonで行う12月のブログ分析【その2】 - 43号線を西へ東へ

      自分のブログ記事をテキストマイニングで分析し、過去の興味やトピックを言葉の出現頻度から探ります。12月のブログ記事の総文字数約4万字を分析し、どのようなキーワードが頻出しているかを調査しました。 先日「叡智の三猿」ブログのスロトレ様が紹介されていた記事があまりにも興味深いものだったので、私もまねしてみました。テキストマイニングを用いたワードクラウドの作成です。スロトレ様のテキストデータは昨年1年分のブログ記事を読み込ませて作成されたとのこと。 紹介されているのワードクラウドは、ブログのテーマである「情報セキュリティー」が大きく表示されていますが、その下に「韓流ドラマ」があります。韓国ドラマには情報セキュリティを題材にされたものが多く、取り上げることがあったからとのことです。 私のブログではどんな結果が出るのでしょうか。ブログに打ち込んだ文章は、書きたいことについてそのときに頭に浮かんだ単語

        【テキストマイニング】Pythonで行う12月のブログ分析【その2】 - 43号線を西へ東へ
      • テキストマイニングで、2023年のブログをふりかえりました - 叡智の三猿

        2023年もあっという間に終わります。 1年は早いと毎年、思うのですが、その早さは歳を重ねる毎に加速しているような気がします。 今年1年、わたしが投稿したブログを「ユーザーローカル テキストマイニング(https://textmining.userlocal.jp/)」というツールを使って「スコア」による分析をしたら、以下の結果となりました。 情報セキュリティは、このブログの骨格ですので、目立つのは当然です。情報セキュリティに関係が深い、パスワードや個人情報もやはり目立ちますね。 概ね、想定通りの結果ですが、異質な感じを受けるのが「韓国ドラマ」というキーワードです。 現在、わたしは、ネットフリックス、Amazonプライム、ユーネクスト、ディズニー+と、主要な動画配信サービスと契約し、韓国ドラマと共に生活をしてます。ブログで韓国ドラマについて言及する機会も多かった年だと思います。 韓国ドラマ

          テキストマイニングで、2023年のブログをふりかえりました - 叡智の三猿
        • ChatGPTを使ったテキストマイニングの方法 | Marketing Junction

          【新サービスのお知らせ】リサーチ&コンテンツ[詳細はこちら]※料金付き BtoB WEBページのPR集客とコンバージョンを引き上げる総合サービスメニューです。ターゲット設定、全体企画、調査実施、分析コンテンツ、プレスリリース、ダウンロード用白書制作まで。特設ページで詳しくご案内しています。 ChatGPT (チャットGPT)テキストマイニング 準備と概要 【GPT_Textminingシリーズ一覧リンク】 第1回 入門編・グーグルスプレッド&API 第2回 グーグルスプレッド・サマライズ等 第3回 通常の対話型インターフェイスを使った単語抽出など 第4回 マイニングツールKH-Coderとの連携について 第5回 ワードクラウドを表示するHTMLを作る 第6回 エクセルをそのままコードインタープリターで加工する 【はじめに】 アンケート調査やカスタマーサポートの業務では、顧客の自由回答や問い

          • みやさかしんや@Python/DX/エンジニア on Twitter: "文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u"

            文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u

              みやさかしんや@Python/DX/エンジニア on Twitter: "文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u"
            • RとMeCabによる日本語テキストマイニングの前処理

              はじめに この資料について この資料でやりたいこと gibasaやその他のRパッケージを使って、RMeCabでできるようなテキストマイニングの前処理をより見通しよくおこなうやり方を紹介します。 想定する知識など R言語の基本的な使い方の説明はしません。tidyverseなどの使い方については、他の資料を参照してください。参考までに、tidyverseなどの使い方についての紹介は次の資料がおすすめです。 私たちのR また、以降の説明ではRでの日本語テキストの前処理のやり方のみにフォーカスしているため、具体的なテキストデータの分析のやり方には一切踏み込んでいません。Rでおこなうようなテキストデータの分析の方法については、いずれも英語の資料ですが、次が参考になると思います。 Text Mining with R Supervised Machine Learning for Text Analy

                RとMeCabによる日本語テキストマイニングの前処理
              • 近年の本格ミステリを可視化する【テキストマイニング】 - Qiita

                はじめに 本記事では、Pythonによるテキストマイニングの簡単なチュートリアルとして、ここ8年ほどの間に刊行された「本格ミステリ」に分類される小説のキーワードを解析し、可視化することを目指します。 使用するデータ 出版書誌情報データベース(Books)において、検索キーワードを「本格ミステリ」に設定し、ヒットした書誌の内容紹介からあらすじに相当する部分をExcelに手作業で(!)切り貼りすることで、本格推理小説505作のあらすじをまとめました。 実装 あらすじから内容を象徴するようなキーワードを抽出し、その出現の頻度や関係を可視化することで分析を行います。なお、添付したコードはGoogle Colaboratoryでの実行を想定しています。 必要なライブラリのインストール 形態素解析(文から単語を切り出し、品詞等の判別を行うこと)にはPythonの言語処理ツールであるGiNZAを、解析結

                  近年の本格ミステリを可視化する【テキストマイニング】 - Qiita
                • Pythonのライブラリで小説全文をテキストマイニングしよう

                  テキストマイニングとは? テキストマイニングとは、テキストをプログラムに分析してもらい、文章の特徴を図や色などで表現することを指します。 SNSで注目されている単語やGoogle検索トレンドなども瞬時で分析でき、データサイエンティストやマーケターなども活用できます。 今回行うテキストマイニングで特に重要な処理が「形態素解析」と呼ばれるもので、繋がっている文章の中から単語を抜き出して意味を割り出す分析方法です。 例えば、私たち人間が「このサイトは非プログラマーが日常業務で使えるシンプルなPythonを紹介するメディアです。」 をという文章を読む時には 「この/サイト/は/非/プログラマー/が/日常/業務/で/使える/シンプル/な/Python/を/紹介/す/る/メディア/です。/」 と区切ることができます。しかし(英語は単語ごとにスペースを開けるのでプログラムで処理をしなくても問題はありませ

                    Pythonのライブラリで小説全文をテキストマイニングしよう
                  • Microsoftのデータサイエンス初心者向けコースをやってみるDay1チャレンジ:テキストマイニング - Qiita

                    はじめに GAFAM(Google, Amazon, Facebook, Apple, Microsoft)のMは何と言ってもMicrosoft。 ビルゲイツ氏の時代はOSのイメージが強かったが、サティアナデラ氏がCEOの現在は、クラウドでイケイケの会社となっており、超ハイスキルの人財を多数抱え、世界最先端で人工知能・データサイエンス・機械学習を学べるコースを無償で提供している。そこで、Microsoftの寛大さに感謝しつつ、Pythonを使いながら、データサイエンスを勉強してみる。 対象読者 Pythonとデータサイエンスに興味があって、英語が苦手な人(英語が得意な人は、参考文献を直接解いてください。 ロードマップ Day1 この記事では、Day1のチャレンジを翻訳しながらやってみる。 Day1ゴール データサイエンスに関するWikipediaの記事からキーワード集計や可視化を行い、 気

                      Microsoftのデータサイエンス初心者向けコースをやってみるDay1チャレンジ:テキストマイニング - Qiita
                    • 【水瀬いのり】テキストマイニングによる歌詞分析(1)(声優アーティスト比較/頻出語・人称表現) - 水樹奈々・水瀬いのり研究部

                      本記事は水瀬いのりさんの歌詞に着目しその特徴について分析を試みたものです。 具体的には、テキストマイニングの手法により歌詞を数量化し独自の考察を加えました。 また、数量化したデータは、一部に統計的手法を適用し考察を補完しています。 データの解釈や考察について自分なりに頑張ってみましたが、あまりこういう考察はやったことがないので「ちょっとここはおかしいぞ?」という部分がちょいちょいあるかもしれません(最初から言い訳すいません笑)。 そこはどうか温かい目で見てやって下さいまし。 あくまで参考程度ということでよろしくお願い致します。 分析は、以下の二つに大きく分けて行っております。 ①水瀬いのりと同年代の声優アーティスト(小倉唯、上坂すみれ、内田真礼、大橋彩香、早見沙織)との比較分析 ②水瀬いのりのアルバム発売日までの楽曲を一区間とした期間比較及び頻出語の文脈分析 ※テキストマイニングは「KH

                        【水瀬いのり】テキストマイニングによる歌詞分析(1)(声優アーティスト比較/頻出語・人称表現) - 水樹奈々・水瀬いのり研究部
                      • yhkondo on Twitter: "元々好きなので、情報Ⅰの教員研修資料を見ていたら、なんと、青空文庫から「走れメロス」をダウンロードして、RMeCabで形態素解析して、KHCoderでテキストマイニングというのが載っていた。ここまで高校でやってもらえればすごく楽で… https://t.co/9QowDykGFn"

                        元々好きなので、情報Ⅰの教員研修資料を見ていたら、なんと、青空文庫から「走れメロス」をダウンロードして、RMeCabで形態素解析して、KHCoderでテキストマイニングというのが載っていた。ここまで高校でやってもらえればすごく楽で… https://t.co/9QowDykGFn

                          yhkondo on Twitter: "元々好きなので、情報Ⅰの教員研修資料を見ていたら、なんと、青空文庫から「走れメロス」をダウンロードして、RMeCabで形態素解析して、KHCoderでテキストマイニングというのが載っていた。ここまで高校でやってもらえればすごく楽で… https://t.co/9QowDykGFn"
                        • データをいろいろ見てみる on Twitter: "オープンレター個人ではなく女性差別てきな「文化」を問題にしたというが、文章をテキストマイニングしてみると呉座さんへの言及が中心を占めておりやはり個人を問題視しているのではないか。 オープンレター… https://t.co/dGQfu3QyPa"

                          オープンレター個人ではなく女性差別てきな「文化」を問題にしたというが、文章をテキストマイニングしてみると呉座さんへの言及が中心を占めておりやはり個人を問題視しているのではないか。 オープンレター… https://t.co/dGQfu3QyPa

                            データをいろいろ見てみる on Twitter: "オープンレター個人ではなく女性差別てきな「文化」を問題にしたというが、文章をテキストマイニングしてみると呉座さんへの言及が中心を占めておりやはり個人を問題視しているのではないか。 オープンレター… https://t.co/dGQfu3QyPa"
                          • テキストマイニングをやってみよう!「人間椅子」編 - Story of my life

                            あなたはテキストマイニングという言葉をご存知でしょうか? 申し訳ありません、実は私も専門的なことはよく知りません。 めちゃくちゃざっくり説明させていただきますと… 文章の中に含まれる動詞とか名詞とかを自動で検索して、どういう言葉が多いのかを解析する、というツールです。 先日、自分の書いた文章にはどんな言葉が多いのだろう、という疑問を持ちました。 しかし当然のことながら、手動でやるには効率が悪すぎる、じゃあ何かいいソフトはないかと調べてみたところ、このテキストマイニングとやらの存在にたどり着いたわけです。 誰でも無料で使えるので、暇つぶしに使ってみてください、結構面白いですよ。 textmining.userlocal.jp ではてっとり早く実践してみます。 ご存じの方も多いと思われますが、青空文庫という著作権の切れた小説などを整理しているサイトがあります。 ここから私の好きな「人間椅子」と

                              テキストマイニングをやってみよう!「人間椅子」編 - Story of my life
                            • Pythonでスクレイピングした結果をテキストマイニングしてLINEに送信する - Qiita

                              アプリ説明 占いたい時期を西暦で入力して、上半期か下半期を選択。占いたい星座を入力すると、占いサイトより該当の星座占いをスクレイピングして、結果をテキストマイニングして画像を生成させます。 生成した画像はLINE Notifyを使用して自分のアカウントに送信されるようにしました。 生成される画像のイメージ 使用したライブラリ WordCloud ワードクラウドの生成 https://pypi.org/project/wordcloud/ Janome 形態素解析エンジン https://pypi.org/project/Janome/ https://github.com/mocobeta/janome BeautifulSoup スクレイピングツール https://pypi.org/project/BeautifulSoup/ https://www.crummy.com/softwa

                                Pythonでスクレイピングした結果をテキストマイニングしてLINEに送信する - Qiita
                              • 全農広報部【公式】日本の食を味わう on Twitter: "一般の方の言う「お味噌汁が好き」というのは旬の野菜を具にしたり、お気に入りの味噌を使ったりして味わうのが好きなのであって、ツイートを分析して好きな具ランキングを作ったりテキストマイニングでにらと卵が一緒に呟かれる傾向を発見してニヤ… https://t.co/lXtS96fPnK"

                                一般の方の言う「お味噌汁が好き」というのは旬の野菜を具にしたり、お気に入りの味噌を使ったりして味わうのが好きなのであって、ツイートを分析して好きな具ランキングを作ったりテキストマイニングでにらと卵が一緒に呟かれる傾向を発見してニヤ… https://t.co/lXtS96fPnK

                                  全農広報部【公式】日本の食を味わう on Twitter: "一般の方の言う「お味噌汁が好き」というのは旬の野菜を具にしたり、お気に入りの味噌を使ったりして味わうのが好きなのであって、ツイートを分析して好きな具ランキングを作ったりテキストマイニングでにらと卵が一緒に呟かれる傾向を発見してニヤ… https://t.co/lXtS96fPnK"
                                • テキストマイニングツールおすすめ6選比較!【2021年最新】|選び方も解説

                                  テキストマイニングは、有益な情報を取り出す技術のことです。この記事では、おすすめのテキストマイニングツール6選を比較するとともに、無料で使えるツールや、テキストマイニングツールの基本機能、選定ポイントなどについても解説します。 テキストマイニングとは テキストマイニングとは、有益な情報を取り出す技術のことで、「顧客の声」の分析や暗黙知の形式知化、ビッグデータによる将来予測などに使用されています。マーケティングや経営戦略において、テキストマイニングツールは顧客のニーズ把握やリピーター獲得などの施策検討に使われます。 テキストマイニングツールが取り出した大量のテキスト情報を整理・分類するには、人による知的作業が必要です。そのため、テキストマイニングツールには「テキスト情報の整理・分類に関する作業をスムーズに進めるための支援」という役割も求められます。 テキストマイニングツールの導入メリット3つ

                                    テキストマイニングツールおすすめ6選比較!【2021年最新】|選び方も解説
                                  • おおき/SEO/デジタルマーケティング on Twitter: "SNSなどでターゲットの会話をまとめてコピペしてどこかに保存し一括で形態素解析ツールに入れてみよう。 例えばuserlocalの「aiテキストマイニング」は無料で高精度の分析が可能。 下記の例だと、財布の開けやすさとか素材にこ… https://t.co/CV9ZkAEC0J"

                                    SNSなどでターゲットの会話をまとめてコピペしてどこかに保存し一括で形態素解析ツールに入れてみよう。 例えばuserlocalの「aiテキストマイニング」は無料で高精度の分析が可能。 下記の例だと、財布の開けやすさとか素材にこ… https://t.co/CV9ZkAEC0J

                                      おおき/SEO/デジタルマーケティング on Twitter: "SNSなどでターゲットの会話をまとめてコピペしてどこかに保存し一括で形態素解析ツールに入れてみよう。 例えばuserlocalの「aiテキストマイニング」は無料で高精度の分析が可能。 下記の例だと、財布の開けやすさとか素材にこ… https://t.co/CV9ZkAEC0J"
                                    • 【自然言語処理】google playストアのモンストのレビューコメントでテキストマイニングを実施してみる。 - Qiita

                                      【自然言語処理】google playストアのモンストのレビューコメントでテキストマイニングを実施してみる。Python初心者自然言語処理データ分析テキストマイニング 目次 本記事の最終目標データ 実施手続一覧 実施手順 結論 感想 1. 本記事の最終目標 大量の文章データから有益な情報を抽出することをテキストマイニングと呼びますが、本記事の最終目標はPythonによる自然言語処理を活用し、とあるアプリゲームのレビューコメントをテキストマイニングすることで有益な情報、具体的には潜在的なユーザーのニーズやアプリの改善点等を抽出し、アプリゲーム提供会社の意思決定に役立つ情報を取得することとします。 2. 実施手続一覧 ①スクレイピングを実施し、元データを作成する ②データの前処理 ③レビューコメントの頻出単語に関するグラフの作成する ④コサイン類似度を用いて賛成数(グッド数)が一番多いコメント

                                        【自然言語処理】google playストアのモンストのレビューコメントでテキストマイニングを実施してみる。 - Qiita
                                      • 山内長承「Pythonによるテキストマイニング入門」のMeCabの扱いと、クラスAozoraについてのメモ - Qiita

                                        山内長承「Pythonによるテキストマイニング入門」のMeCabの扱いと、クラスAozoraについてのメモPythonmecab はじめに 山内長承「Pythonによるテキストマイニング入門」第4章でMeCabを使うが、詳しいインストール方法が書かれていない。別のサイトを参考にMeCabをインストールした上で、山内の著書内にある引数を変更したのでメモをしておく。 また、本書で使われる、青空文庫にあるファイルをタグ抜きに変換するAozoraクラスについても、メモをしておく。 開発環境 windows10 セットアップ [文章生成]MeCabをインストールして分かち書きを試してみよう https://www.atmarkit.co.jp/ait/articles/2102/05/news027.html を参考にして、インストールをした。 上記の方法でインストールした場合は、p124「リスト4

                                          山内長承「Pythonによるテキストマイニング入門」のMeCabの扱いと、クラスAozoraについてのメモ - Qiita
                                        • テキストマイニングの基礎知識|3つの手法から活用例までわかりやすく解説 - Retrieva OFFICIAL BLOG

                                          テキストマイニングとは、テキストデータを活用し、情報を抽出することを指します。社内のデータを活用して、テキストマイニングを行いたいと考えている担当者も多いでしょう。この記事では、テキストマイニングとは何なのか、目的や種類、代表的な手法などについて詳しく解説します。導入を検討している場合は、ぜひ参考にしてください。 テキストマイニングとは? テキストマイニングの目的 テキストマイニングの種類 探索的データ解析 文書分類 教師あり文書分類 教師なし文書分類 テキストマイニングの代表的な手法 センチメント分析 対応(コレスポンデンス)分析 主成分分析 テキストマイニングでできること|活用例で紹介 顧客からのフィードバックを分析 社内業務の改善策へ活用 市場動向や需要の予測を立てる テキストマイニングを活用する際の注意ポイント テキストマイニングをExcelで行う方法 手順 テキストを単語に分解す

                                            テキストマイニングの基礎知識|3つの手法から活用例までわかりやすく解説 - Retrieva OFFICIAL BLOG
                                          • ツイートデータのテキストマイニング - Qiita

                                            前回の続きです。 ツイッターで検索するワードは、自動車メーカー3社(トヨタ・日産・ホンダ)の社名と合わせ、昨今話題の「自動運転」が同時にツイートされているものを対象としました。 やりたいこと・処理の流れ 概要 収集したツイートデータを適宜整形・加工し、形態素解析を行う 品詞ごとの頻度集計を行い、ワードクラウドとしてプロットしてみる 単語間の係り方を図示すべく、n-gram集計(今回はn=2)し、共起ネットワークを描いてみる 前提 MeCabやimportする各種ライブラリのインストールが済んでいること PythonとMeCabの連携、Pythonバインディングのインストールが済んでいること お好みでシステム辞書の拡張(mecab-ipadic-neologd)、ユーザー辞書の作成・コンパイルが済んでいること 完成イメージ 日別推移 ワードクラウド 共起ネットワーク 参考サイト ワードクラウ

                                              ツイートデータのテキストマイニング - Qiita
                                            • 無料のテキストマイニングツールおすすめ5選を紹介!無料版と有料版の違いも解説

                                              AIにおける自然言語処理の分野で注目されているテキストマイニングツールには、無料で利用できるものから有料版のものまでさまざまなツールがあります。 DXに取り組む企業が増える中、マーケティングやコールセンター業務などにテキストマイニングツールを活用する動きもあります。 今回の記事では、そもそもテキストマイニングとは何なのか、無料で利用できるテキストマイニングツールもあわせて詳しく解説します。 テキストマイニングツールの 製品比較記事を見る テキストマイニングとは そもそも、マイニングとは日本語に直訳すると「採掘する」という意味をもつ言葉です。したがって、テキストマイニングとはテキスト(=文章)からさまざまなデータや情報を抽出する技術のことを指します。 たとえば、「私の名前は山田一郎です。血液型はO型で、今年で35歳になります。出身地は東京都で、現在は千葉県に住んでいます。」というテキストがあ

                                                無料のテキストマイニングツールおすすめ5選を紹介!無料版と有料版の違いも解説
                                              • 電波ログテキストマイニング | テレビ番組の字幕情報を対象に、テキストマイニングの研究をしておりますので、解析結果の公開をメインに記事を構成しております。また、解析結果の信憑性が確認できるよう、解析用ソースも部分引用し掲載してあります。

                                                テレビ番組の字幕情報を対象に、テキストマイニングの研究をしておりますので、解析結果の公開をメインに記事を構成しております。また、解析結果の信憑性が確認できるよう、解析用ソースも部分引用し掲載してあります。

                                                • 【雑記】野党批判のときだけ饒舌になってもさぁ(2020.10.20)|後藤和智@テキストマイニングとか

                                                  政治が物差し作ってパフォーマンス図るのが政治介入でなくって何なんですかね。政治介入を防ぐために政治介入するんですか。冗談にもなりませんよ。 https://t.co/G22wAQvsHS — Kan Kimura (@kankimura) October 20, 2020 世論の喝さいを浴びる為に研究者を叩き潰して、結果として、データにも何も基づかない「長年の勘」や評論家的なジェネラリストに頼る素人政治やって、また失敗するんでしょ。一体、民主党時代に何を学んだんだか。そういうのを「反知性主義」って言うんだよ。 — Kan Kimura (@kankimura) October 20, 2020 まごうことなき正論なんだけど、ただ当初の政治介入問題が起こったときに傍観者を決め込んでひたすら愚痴を開陳していたのは誰だったのか。政権による政治介入には鈍感、というか「どうでもいい」で通すのに、野党

                                                    【雑記】野党批判のときだけ饒舌になってもさぁ(2020.10.20)|後藤和智@テキストマイニングとか
                                                  • 「日本学術会議」関連ツイートをテキストマイニングしてみた

                                                    ゼミの研究内容の紹介の意味合いもありますが、ツイッターで「日本学術会議」がどのようにツイートされているのかを総合的・俯瞰的にみてみることにしました。

                                                      「日本学術会議」関連ツイートをテキストマイニングしてみた
                                                    • 有価証券報告テキストマイニング入門 - 株式会社ホクソエムのブログ

                                                      はじめに こんにちは, ホクソエムサポーターのKAZYです。 先日猫カフェデビューをして, 猫アレルギーであることがわかりました🐈。 次はフクロウカフェに挑戦してみようかなと思っています🦉。 ところで皆様, 有価証券報告書は読んでますか? 私は読んでいません。 読めません。 眺めていると眠くなります💤。 私は眠くなるんですが, 有価証券報告書ってテキストマイニングするのに向いているんです。企業の事業や財務情報が詳細に書かれています。 XBRL形式で構造化されています。 数千社分のテキストが手に入ります。 おまけに無料です。 どうです?興味湧いてきませんか? 本記事ではPythonを使って有価証券報告書をテキストマイニングする方法を紹介します。 有価証券報告書をダウンロードするところからご紹介するのでご安心を。 こんな方が見たら役に立つかも 企業分析をプログラミングでやりたいが何してい

                                                        有価証券報告テキストマイニング入門 - 株式会社ホクソエムのブログ
                                                      • 【雑記】政権批判批判の”正しい”使い方(2020.10.06)|後藤和智@テキストマイニングとか

                                                        なんで、いま、みんな日本学術会議に関心を持っているの?新政権のツッコミどころだからというだけでしょう。もともとほとんど関係ないうえに興味もなかったじゃない。ぼくだってそうで、たぶん1、2回ほど部会のシンポジウムかなにかで話したことあるけれど、はっきり言えば関係ない。 — 西田亮介/Ryosuke Nishida (@Ryosuke_Nishida) October 5, 2020 知らないようであれば説明するが、この問題の論点は、第一に、総理の独断専行で過去の法律解釈や運用(総理には任命権はあっても拒否権はないというもの)をねじ曲げているというところにある。そのため、この問題については学術界のみならず法曹界などからも疑問と恐怖の声が上がっているのである。このような行為を安直に許してしまうと、行政府の長の”お気持ち”による介入に歯止めが利かなくなる。行政の手続きの正当性に関わる極めて重大な問

                                                          【雑記】政権批判批判の”正しい”使い方(2020.10.06)|後藤和智@テキストマイニングとか
                                                        • 月刊テキストマイニングレポートVol.27 フェミニズムへの憎悪を生み出す構造――リツイート分析による「表現規制反対派」の布置|後藤和智@テキストマイニングとか

                                                          月刊テキストマイニングレポートVol.27 フェミニズムへの憎悪を生み出す構造――リツイート分析による「表現規制反対派」の布置 本稿は、「コミックマーケット97」第2新刊『月刊テキストマイニングレポート総集編2 続・ツイッターにおける女性差別に関する考察』の第1章として書かれたものです。 (2020.09.18 一部肩書きの訂正を行いました) 1.1 はじめに――分析の概要本章では、リツイート分析を用いて、「表現規制反対派」と呼ばれる論客の立ち位置について考察することとする。 まず、リツイート分析について説明したい。本書で言うリツイート分析とは、筆者が『Twitter Analysis Maniax――twitteR, Excel VBA, KH Coderによる最強(?)のツイッター分析』(コミックマーケット86)で提唱している手法であり、詳細については同書に譲るが、特定のアカウントにお

                                                            月刊テキストマイニングレポートVol.27 フェミニズムへの憎悪を生み出す構造――リツイート分析による「表現規制反対派」の布置|後藤和智@テキストマイニングとか
                                                          • 【雑記】「社会学」憎悪について|後藤和智@テキストマイニングとか

                                                            「社会学」に対する憎悪(本当に無知に基づいているとしか言い様がない、かつ一方的で中傷としか言い様がない)が渦巻いている。まあその流れの源流に私の『おまえが若者を語るな!』(角川Oneテーマ21、2008年)もあるのかと考えるとかなり複雑で頭を抱えたくなる気持ちである。 私が同書で批判したのは宮台真司をはじめとするポピュラー社会学で、それらを非科学的なものとして斬り捨てたのだが、そういう語りに感化された人たちが、いつしか「自分たちにとって都合の悪いことを言う連中」全般を「社会学者」呼ばわりするようになっている。どうも、他称社会学者の工学修士です。 ところでそういった「社会学」バッシングの流れは、むしろポピュラー社会学の影響を強く受けているということは指摘しておきたい。例えば表現規制反対派ムラの連中の振る舞い(例えば「強力効果論」「限定効果論」へのこだわりとか、あるいは「近代社会というのは法律

                                                              【雑記】「社会学」憎悪について|後藤和智@テキストマイニングとか
                                                            • 「映画 刀剣乱舞」の全セリフをテキストマイニングを使って分析してみた。|soubi

                                                              「映画 刀剣乱舞」の本予告の中で最も多く登場した言葉は何だと思いますか? それは「歴史」です。 字幕で6回、音声で7回、合わせて13回登場しています。 本予告を初めて見た際に、「歴史」という言葉が妙に頭に残った私は、 映画本編では何回使われているのか気になってしまい、 映画を見ながら数えました。えぇ、数えたんです。 すると「歴史」という言葉は本編で約40回使われていることが分かりました。上記の予告編には、約100分の映画に出てくるうちの約17%が入れ込まれていたのです。 「映画 刀剣乱舞」の原案である、ゲーム「刀剣乱舞-ONLINE-」では、 歴史を守る使命を与えられたプレイヤーが、刀剣男士を率いて歴史改変を目論む敵と戦う…という筋書きがあるのですが、 「映画 刀剣乱舞」においても、「歴史」という言葉は最重要キーワードと言えるではないだろうか? …と思いました。それに加えて、 ・「歴史」よ

                                                                「映画 刀剣乱舞」の全セリフをテキストマイニングを使って分析してみた。|soubi
                                                              • 1年間に発売されたライトノベルのタイトルを、AIテキストマイニングで分析してみた|岡田勘一[編集者・ライター]

                                                                どうも、マイストリート岡田です。 現在『このラノ』のアンケートが始まってちょっと一息、というところなのですが、ライトノベルのタイトルに関することでこんなツイートをしました。 延々とライトノベルのタイトルをチェックしていると見えてくるのですが、AV的なワードを入れて見所凝縮したタイトルと、設定・要素のワードを組み合わせたタイトルと、かなり傾向がバラバラです。 レーベルによっても偏りがあるので面白いです。https://t.co/JN1ye4YWRV https://t.co/cY4LugMelN — 岡田勘一[編集者・ライター ] (@kanichi0203) September 7, 2020 この段階では感覚的なものなので、ちゃんとライトノベルのタイトルがリストになっているものを使ったほうがいいだろう、ということで『このライトノベルがすごい!2021』のために作った、昨年9月から今年8月

                                                                  1年間に発売されたライトノベルのタイトルを、AIテキストマイニングで分析してみた|岡田勘一[編集者・ライター]
                                                                • R のテキストマイニングのやり方 - 統計ER

                                                                  Rでテキストマイニングするやり方。 ワードクラウドを描く方法。 >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中 テキストマイニングとは? テキストマイニングツールMeCab(和布蕪、めかぶ) RでMeCabを使うにはRMeCabをインストール! Rでテキストの分割をしてみる ワードクラウドとは? Rでテキストマイニングするその他の方法 まとめ Rでテキストマイニングをやろう!ワードクラウドを描こう!【解説動画】 MacでMeCabをインストールしたが文字化けるときの対処法【解説動画】 テキストマイニングとは? テキストデータを名詞、動詞、形容詞など、濃い意味合いを持つ言葉と、助詞、助動詞、感嘆詞、疑問詞など意味合いが強くない言葉に分けて、発生頻度を分析する方法。 たくさんの顧客・症例から発せられる言葉は何か、同時に発せられる言葉は何か、たくさん発せられた言葉は

                                                                    R のテキストマイニングのやり方 - 統計ER
                                                                  • テキストマイニングのサンプルデータを自力で準備する - Qiita

                                                                    ※実際に試した方から「Yahoo!ショッピングの商品レビューが全て取得できているわけではないらしい」「期待したよりも取得できるデータが少ない」といった感想をもらっています。きちんと確認できていませんが、APIの仕様なのかもしれません。(2020/10/24追記) 概要 最近テキストマイニングの勉強を始めたのだが、いい感じのサンプルデータが手に入らず苦労した。自分と同じ悩みを抱えている人もいるかもしれないので、自力でサンプルデータを準備するまでの試行錯誤を記事にする。 なお、私は職場でアンケートの自由記述(感想とか要望とか)を分析することが多いので、なるべく似た形式のデータを手に入れるのが目標。 手段の検討 青空文庫 テキストマイニングの本でもよく見かける青空文庫は、著作権の消滅した文学作品などを掲載したWebサイト。ただ、アンケートデータには似ていないので今回は見送り。 メリット 簡単にか

                                                                      テキストマイニングのサンプルデータを自力で準備する - Qiita
                                                                    • 【2024年版】無料のおすすめテキストマイニングツール比較!具体的な活用方法も紹介|ITトレンド

                                                                      無料でテキストマイニングを行うやり方 テキストマイニングとは、大量のテキストデータから意味やパターンを抽出し、情報を解析・理解するプロセスです。抽出したデータは、効果的な経営戦略や商品・サービスの改善などさまざまな場面で役立てられますが、コストを抑えて実施したい場合もあるでしょう。ここでは、テキストマイニングを無料で行うやり方を解説します。 エクセルを使用したテキストマイニング エクセルを活用してテキストマイニングを行う場合、形態要素分解・単語の主計・ワードクラウドの作成が必要です。具体的には、以下のやり方でテキストマイニングを行います。 1.文章を単語化 MeCabやJanomeなどの形態素解析エンジンを用いて、文章を単語レベルで分解(形態要素分析)する。 2.単語の集計 単語の登場数を「COUNTIF関数」を用いて集計する。 3.ワードクラウドを作成 フリーのソフトかアドインを利用し、

                                                                        【2024年版】無料のおすすめテキストマイニングツール比較!具体的な活用方法も紹介|ITトレンド
                                                                      • 月刊テキストマイニングレポートVol.29:「ツイフェミ」とは誰か|後藤和智@テキストマイニングとか

                                                                        本稿は、「コミックマーケット97」第2新刊『月刊テキストマイニングレポート総集編2 続・ツイッターにおける女性差別に関する考察』の第3章として書かれたものです。 3.1 はじめに本書のまえがきでも採り上げた荻野稔などが使っている概念として「ツイフェミ」なる言葉がある。この言葉は、私が見た限りにおいては、「ツイッター」と「フェミニズム」を合わせた造語であり、主に「(男性)オタクや(男性)オタク向け表現をバッシングする”正しくない”フェミニズム、ないし男性嫌悪」という意味があるように思えるが、ただ概念としてはふわっとしたものであり、この言葉を振りかざす側も正直わかっていないのではないかという印象である。そこで、前章の手法を用いて、この概念についても見ていきたい。 3.2 ツイートの取得ツイートは、前章と同じように、フリーソフト「R」のパッケージ「twitteR」を使い、2019年12月12日に

                                                                          月刊テキストマイニングレポートVol.29:「ツイフェミ」とは誰か|後藤和智@テキストマイニングとか
                                                                        • 月刊テキストマイニングレポートVol.32:フェミニズムへの憎悪を扇動する「オタク政治家」――荻野稔研究|後藤和智@テキストマイニングとか

                                                                          本稿は、「コミックマーケット97」第2新刊『月刊テキストマイニングレポート総集編2 続・ツイッターにおける女性差別に関する考察』の第4章として書かれたものです。 4.1 はじめに本書の締めとして、まえがきで採り上げた荻野稔・太田区議について採り上げたい。筆者はtwitteRを使って、荻野のアカウントである「@ogino_otaku」を検索ワードに、リツイートされている荻野のツイートを集計した。集計を行ったのは2019年12月12日の深夜で、API検索を用いている関係から、国際標準時で2019年12月11日15時17分から2日15時51分までの34,089件のツイートが取得できた。その中からリツイート27,169件を抽出して集計すると、一番多かったのは漫画家による自分の活動の紹介だが、その他にも反差別やフェミニズムを揶揄するようなツイートが多くの支持を集めている(改行を「/」に置換している)

                                                                            月刊テキストマイニングレポートVol.32:フェミニズムへの憎悪を扇動する「オタク政治家」――荻野稔研究|後藤和智@テキストマイニングとか
                                                                          • Amazon.co.jp: 実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー: 石田基広: 本

                                                                              Amazon.co.jp: 実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー: 石田基広: 本
                                                                            • 現代短歌のテキストマイニング―𠮷田恭大『光と私語』を題材に|いぬのせなか座|note

                                                                              英語圏では、自然言語処理の技術を実作の助けになるかたちで応用する学術研究が盛んです。日本語圏にも、半世紀以上に渡る、計量文体学や日本語コーパス構築の積み重ねがあります。それらの手… もっと読む

                                                                                現代短歌のテキストマイニング―𠮷田恭大『光と私語』を題材に|いぬのせなか座|note
                                                                              • テキストマイニングとは | 自然言語処理・種類と活用法・おすすめツール4選 | Ledge.ai

                                                                                テキストマイニングとは自由形式で記述された文章を分析するための手法です。SNSへの投稿をはじめとした大量の文字情報を活用するうえで大変役立ちます。本稿では、テキストマイニングの概要や活用シーン、自然言語処理という技術、オススメのツールやExcelでのテキストマイニングなどを解説します。 テキストマイニングとは?テキストマイニングとは、構造化されてないテキストデータから、新しい情報を抽出する分析手法です。 大量のデータから情報を抽出することで、文章中の単語の使用頻度や傾向、相関関係など、さまざまな特徴を分析する際に用いられます。 情報抽出の性能を向上させるために、自然言語処理が主に用いられています。 また、テキストマイニングは、データマイニングから派生した研究分野であり、データ分析で用いられたさまざまなアプローチや要素技術を応用し、発展した分析手法です。 –データマイニングとは データマイニ

                                                                                  テキストマイニングとは | 自然言語処理・種類と活用法・おすすめツール4選 | Ledge.ai
                                                                                • はじめての自然言語処理 OSS によるテキストマイニング | オブジェクトの広場

                                                                                  前回はグラフベースのキーフレーズ抽出手法と pke での実験結果を紹介しました。今回は、spaCy, scattertext, ... 等々の OSS を用い各種のテキストマイニング手法についてコード例とサンプルプロットを交えながら説明したいと思います。 1. はじめに 本記事ではテキストマイニングの概要と代表的な手法について、コード例とサンプルプロットを交えて説明します。分析対象には、この連載で何度か用いている livedoor ニュースコーパスを用い、Google Colaboratory で動かすことを想定したコードスニペットを入れていきますので、実際に動かしたり対象を変えてみたりして試して頂けると良いかと思います。 2. テキストマイニングとは テキストマイニングとは、ざっくり言うと「自然言語の文書データを対象に使用される単語の出現傾向等を分析して何らかの有益な情報を取り出すこと」

                                                                                    はじめての自然言語処理 OSS によるテキストマイニング | オブジェクトの広場