並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 4770件

新着順 人気順

マイニングの検索結果321 - 360 件 / 4770件

  • Fluentdで始めるリアルタイムでのログ有効活用

    はじめに Fluentdは、ログを収集し格納するためのログ収集基盤ソフトウェアです。Fluentdにインプットされた、すべてのログをJSONに変換し、アウトプットします。インプットとアウトプットはモジュール化されており、モジュールを追加することでインプット元とアウトプット先を追加できるようになっています。 Fluentdは急速に知名度を高め、多くのWebサービス会社で実際に使用されるようになりました。従来のログが抱えていた問題も、Fluentdが適切な解決策となっていると認知され、かつ簡単に導入・スモールスタートできるミドルウェアであったことが大きかったと思います。 本稿では、Fluentdの簡単な仕組みと導入方法、シンプルな動作事例について紹介します。 対象読者 システム管理者 データサイエンティスト 必要な環境 UNIX系OS Ruby 1.9 ログを出力する理由 システム運用を始める

      Fluentdで始めるリアルタイムでのログ有効活用
    • Facebook、分散SQLエンジン「Presto」公開。大規模データをMapReduce/Hiveの10倍効率よく処理すると

      Facebookは、数ペタバイト級の大規模データに対しても、対話的にアドホックな問い合わせを可能にする分散SQLエンジン「Presto」を、オープンソースで公開しました。 PrestoはFacebook社内で大規模データの分析のために開発され、すでに同社社内使われているもの。 FacebookはPrestoを開発した背景として、大量のデータをHadoop/HDFSベースで保存したものの、バッチ指向のMapReduceではなく、リアルタイム性に優れた処理が必要になったためだと、次のように説明しています。 Facebook’s warehouse data is stored in a few large Hadoop/HDFS-based clusters. Hadoop MapReduce [2] and Hive are designed for large-scale, reliabl

        Facebook、分散SQLエンジン「Presto」公開。大規模データをMapReduce/Hiveの10倍効率よく処理すると
      • これからTwitter分析をはじめる経営者が覚えておくべき無料分析ツール15個まとめ|経営者の集客術

        あなたは自分や競合相手のTwitterアカウントについて解析したことはありますか? フォロワー数に影響を与えることのできるキーポイントを見つけることができれば、Twitterをもっとうまく運用することができます。 競合相手がしていることで、あなたも真似すべきことは何でしょうか。 ぜひここで紹介している無料解析ツールを使って、Twitterを深く研究するきっかけにしてください。 1.Twitonomy で概要をつかむ TwitonomyはとてもわかりやすいTwitter解析ツールで、あなたと競合相手のアカウントを解析することができます。 ツールを使用するためには、あなたのアカウントと連動させ、その後競合相手のアドレスを入力するだけです。 Twitonomyを使ってできること6つTwitonomyを使ってできることは、以下の6つです。 リストについての詳細あなたの競合相手が参加している「リスト

          これからTwitter分析をはじめる経営者が覚えておくべき無料分析ツール15個まとめ|経営者の集客術
        • 「じゃらん」が明らかにした旅行者の意外な足跡、カンと経験の地域活性化に登場した新手法とは? | JBpress (ジェイビープレス)

          「北海道民が夏に旅行で目指す定番は、旭山動物園ではなく、積丹半島のウニだった!」 驚きの声とともに次々と明らかになっていくのは、今まで見えてこなかった「リアル」な旅行者の動向だ。 このように旅行者の足跡を詳細に追い、動向を分析することで、旅行パックや地方イベントの企画に生かす。そんな地域活性化の新たな試みが登場している。 なぜ旅行者の足跡を詳細に追うことができるのか。そこで活用されているのが、いま注目を集める「ビッグデータ」だ。ビッグデータは地域活性化への有力なツールとなり得るのか、その詳細に迫った。 「隠れた名所」が隠れてしまう理由 全国に秘湯と呼ばれる温泉は多いが、金属の腐食により備え付けのテレビが壊れるほどの強酸性を誇るのが、北海道は弟子屈町にある「川湯温泉」。温泉街全体で「源泉掛け流し宣言」をうたい、北海道民に親しまれる名湯だ。しかし、なぜか道外にはあまり知られていない。文字通りの

            「じゃらん」が明らかにした旅行者の意外な足跡、カンと経験の地域活性化に登場した新手法とは? | JBpress (ジェイビープレス)
          • 各業界でのデータサイエンスの活用について調べてみた(随時追加) – かものはしの分析ブログ

            都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト 仕事で、いろんな会社でデータサイエンスってどう使われているのですか?と聞かれることがあり、自分としてはなんとなくしか掴めていないな、知ったかぶりしたくないなと思うところがあったので、やや手厚くリサーチをしてみようと思いました。 2022/3/6の段階では11つの市場しかないですが、最終的には30市場を目指します。 【2021/11/27追記】 公開したところ、それなりにこの記事に関心を持ってくださった方が多かったようなので、少しずつ事例を埋めていこうと思います。 業界

              各業界でのデータサイエンスの活用について調べてみた(随時追加) – かものはしの分析ブログ
            • とある仮想通貨マイナーの確定申告まとめ

              更新履歴・ふるさと納税の住民税の前納という表現について一部修正。ふるさと納税で控除できる住民税の金額には限度がある旨追記。 ・雑所得控除は存在せず雑所得20万円までは申告不要なだけという指摘があったので修正 ・経費について追記 仮想通貨マイニングの確定申告をどのようにすべきか一目で見れるページがあまりなかったため、 自分以外の人も参考にできる形で確定申告のやり方をネットに残しておく。 ■TLDR;・仮想通貨で得た利益にかかる税金は住民税と所得税のみ(細かいこというと復興特別所得税もかかるけど省略) ・住民税は10%固定 ・所得税は給与所得や他の雑所得を合算した総所得で累進的に決まる。5, 10, 20, 23, 30, ...45%まで。(高々年収1000万円程度の普通のサラリーマンなら20%以下) ・例えば仮想通貨の売却益が300万円、給与収入が700万円で合計年収1000万円程度なら、

                とある仮想通貨マイナーの確定申告まとめ
              • よく乗る電車の乗客をデータベース化して降車駅を予測するアプリ『電車で座る』

                通勤や通学に電車を利用していると、よく乗る時間や車両がだいたい決まってくるものです。 この無料アプリ『電車で座る 』は、この傾向を利用し、いつも乗る列車の乗客のデータベースを構築。 そこから降車する乗客を予測し、「座る確率を上げる」ことを目的としたアプリです。 このアプリは無料にも関わらず、非常によく設計されており、かつ高機能です。 理解してしまえばけっして難しくはありませんが、使いはじめる前に「アプリの使い方」に目を通しておくことをおすすめします。 まずはじめに、自分がよく利用する列車を登録します。 画面右上の「+」をタップし、出発時間・乗車駅・車両・グループの4つを入力します。 次に、登録した列車に、それを利用している乗客を追加していきます。 性別・年代・降車駅といった情報の他に、顔を覚えやすいようアバターを作成できます。 また、携帯電話・スマートフォンやバッグの色を登録することもでき

                  よく乗る電車の乗客をデータベース化して降車駅を予測するアプリ『電車で座る』
                • Google、大規模データをリアルタイムに分析できるクラウドサービス「Google Cloud Dataflow」を発表。「1年前からMapReduceは使っていない」。Google I/O 2014

                  Google、大規模データをリアルタイムに分析できるクラウドサービス「Google Cloud Dataflow」を発表。「1年前からMapReduceは使っていない」。Google I/O 2014 大規模分散処理のフレームワークとしてGoogleが開発し、Hadoopに採用されて広く使われているMapReduce。しかしGoogleはもうMapReduceを使わず、より優れた処理系の「Google Cloud Dataflow」を使っていることが、Google I/O 2014の基調講演で明らかにされました。 GoogleのシニアバイスプレジデントUrs Hölzle氏は、「エクサバイトのスケールまで扱え、パイプライン処理を記述しやすく最適化もしてくれる。それにバッチもリアルタイム分析も同じコードで記述できる」と、Cloud Dataflowの特長を説明します。 Google I/Oの

                    Google、大規模データをリアルタイムに分析できるクラウドサービス「Google Cloud Dataflow」を発表。「1年前からMapReduceは使っていない」。Google I/O 2014
                  • GMO、仮想通貨マイニング開発中止 特損355億円 「世界トップ性能」うたうも冷え込みに耐えきれず

                    GMOインターネットは、2018年第4四半期決算で仮想通貨マイニング事業について約355億円の特別損失を計上する。マイニング事業のうち、マイニングマシンの開発・製造・販売事業は継続しない。 GMOインターネットは12月25日、2018年第4四半期決算で仮想通貨マイニング事業について約355億円の特別損失を計上すると発表した。仮想通貨価格の下落を受けた需要の減少などにより、収益性が悪化したという。マイニング事業のうち、マイニングマシンの開発・製造・販売事業は継続しない。 特別損失355億円の内訳は、自社設備によるマイニング事業の減損損失115億円と、マイニングマシン事業の債権譲渡損240億円。 GMOインターネットは17年12月から、100%子会社のスイス法人GMO-Z.com Switzerland AGで自社設備による北欧地域での仮想通貨マイニングや、マイニング専用マシンの開発を進めてき

                      GMO、仮想通貨マイニング開発中止 特損355億円 「世界トップ性能」うたうも冷え込みに耐えきれず
                    • レンタル救世主動画5話無料で見逃し配信(再放送)はHuluが便利 | 見逃し配信再放送ドラマ情報局(ウエブログ)

                      Download Coding PNG images for any device and screen size. High quality Coding PNG and images! Customize your desktop, mobile phone and tablet with our wide variety of cool and interesting Coding PNG in just a few clicks.

                      • 講義資料 配列解析アルゴリズム特論I 情報生命科学基礎/演習 他 -渋谷哲朗

                        平成20年度 東京大学大学院 情報理工学系研究科・コンピュータ科学専攻 配列解析アルゴリズム特論I 4/10 4/17 4/24 5/1 5/8 5/15 5/22 5/29 (The problem to be reported - in English) 6/5 6/12 6/19 7/3 7/10 7/17 東京大学 理学部・情報科学科 情報科学特別講義3 (情報科学とバイオインフォマティクス) 6/10 7/15 7/22 東京大学大学院 新領域創成科学研究科・情報生命科学専攻 情報生命科学基礎/演習 5/27 6/17 京都大学大学院 薬学研究科・医薬創成情報科学専攻 情報科学概論 6/3 中央大学大学院 理工学系研究科・物理学専攻 物理学特別講義第二 TBA 創価大学工学部 生命情報工学科 TBA TBA 戻る Copyright (c) 2004- Tetsuo

                        • ウェブ3.0と黒川紀章:佐々木俊尚 ジャーナリストの視点

                          ウェブ3.0とは何か この春ごろから、ウェブ3.0という言葉が急に大まじめに語られるようになってきている。少し前までは「3.0」というのは冗談のタネでしかなかったが、そうではなくなってきたようだ。 たとえばイギリスの新聞ガーディアンは2月に、「ウェブ3.0はパーソナライゼーションとレコメンデーションだ」と評するJemima Kissのコラムを掲載している。またアメリカのブロググループはReadWriteWebは昨年初めに「ウェブ3.0って何だろう定義コンテスト」を開き、その話を題材にして「Web3.0はパーソナライゼーションなのか?」という記事を書いている。日本語訳はこちら。 また日本でも、技術評論社のWeb Site Expert誌が5月24日発売の最新号で、「Web2.0の次の波」という大がかりな特集を組んでいる。 ではウェブ3.0とはひとことで言えば何なのか。 先ほどのReadWri

                            ウェブ3.0と黒川紀章:佐々木俊尚 ジャーナリストの視点
                          • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

                            MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

                              MeCabの辞書にはてなキーワードを追加しよう - 不可視点
                            • データサイエンティストになりたい学生の為の就職先の選び方 - shakezoの日記

                              ここ半年でIT業界ではビッグデータというバズワードが一気に広がり、データ分析者の需要が急増しています。データサイエンティストは今後10年で最も魅力的な職業になるとも言われており、データ分析に携わる仕事に就きたいと考えている学生も以前よりは増えてきているのではないかと思います。 ビッグデータ、データサイエンティスト、データマイニング、機械学習などのキーワードが散りばめられた記事も連日のように投稿されていますが、新卒の学生がデータ分析の仕事に就くための方法について触れられているものはあまりないようです。IT業界で働いている人たちの間でも、正しい認知が進んでいない状況ですので、データ分析業界の構造を学生さんが理解することは難しいのではないかと思います。 私自身はデータ分析に携わって5年程度で、まだまだ初心者の域を脱していないぺーぺーですが、データマイナーになるためにどんなキャリアを積めばよいかに

                                データサイエンティストになりたい学生の為の就職先の選び方 - shakezoの日記
                              • Twitterで株式市場を予測:「86.7%の精度」 | WIRED VISION

                                前の記事 台所で生じる「ホワイトホール」:物理学者が検証 Twitterで株式市場を予測:「86.7%の精度」 2010年10月22日 サイエンス・テクノロジー コメント: トラックバック (0) フィードサイエンス・テクノロジー Lisa Grossman Image: flickr/Perpetualtourist2000 ある1日に『Twitter』の世界(Twitterverse)がどのくらい平穏だったかを測定することで、3日後の『ダウ・ジョーンズ工業株価平均』の変化の方向性を86.7%の精度で予測できるという研究成果が発表された。 この発見は、(別の研究から派生した)ほとんど偶然によるもので、研究者たち自身が驚いている。インディアナ大学のJohan Bollen准教授(社会科学)らによる研究論文は、プレプリント・サーバー『arXiv.org』に掲載された。 これまでの研究によって

                                • パソコン工房のPCで遊ぼう第2弾! あんちべさんと一緒に Rakuten MA で形態素解析 - はてなニュース

                                  (これまでのあらすじ)前回、パソコン工房から「統計処理用のPCのPR企画をやりたい」と依頼を受けて、はてなエンジニアと一緒にword2vecで遊んでみた編集部。読者の皆さまにも好評だったので、調子に乗って第2弾を実施することにしました。今回は「"word2vec"で艦これ加賀さんから乳を引いてみる」で一世を風靡した、あの統計屋さんが全面協力です! 記事の最後にはプレゼントのお知らせも。 (※この記事は株式会社ユニットコムによるPR記事です) 皆さまは前回の記事を、覚えておりますでしょうか? ▽ Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース パソコン工房の統計処理用PC × はてなブログのデータ × word2vec という記事でした。ブックマークコメントから感想をいくつかピックアップし

                                    パソコン工房のPCで遊ぼう第2弾! あんちべさんと一緒に Rakuten MA で形態素解析 - はてなニュース
                                  • プリキュア600話分のサブタイトルを分析したら見えてきた事。テキストマイニング分析より - プリキュアの数字ブログ

                                    2016年5月15日放送分の 魔法つかいプリキュア15話「ハチャメチャ大混乱!はーちゃん七変化!」で プリキュア放送回数が通算600回を迎えました。 せっかくなので、何か記念をと思いプリキュア600話分の「サブタイトル」を テキストマイニングで分析してみました。 最も使用されていた語句は 共起ネットワーク図 クロス集計 クロス集計の結果 キャラクタ別のクロス集計 対応分析 まとめ サブタイトルってのは 「私たちが変身!?ありえない!」(無印1話) みたいなヤツですね。 全600話のタイトルは、下記祥太様のつぶやきにすごいまとめがあります。 歴代『プリキュア』シリーズ通算600話までの全サブタイトル #precure pic.twitter.com/eqCdAV5sad— 祥太(レイフレE13,14「SHOWTIME」) (@shota_) 2016年5月14日 関係ないですけど、今回は60

                                      プリキュア600話分のサブタイトルを分析したら見えてきた事。テキストマイニング分析より - プリキュアの数字ブログ
                                    • 気象観測データを統計処理・取得できるウェブページを公開します - 気象庁 | 平成25年報道発表資料

                                      近年、社会におけるインターネットの普及など情報通信技術の進展により、企業・国民等において、大量・多様なデータを処理・利用できるようになってきており、政府等が保有する多様で膨大な公共データについて、様々な場面での活用が期待されるようになってきています。 このような中、気象庁では、本日よりホームページ上で、機械判読可能な形式(CSV形式)による、過去の気象観測データの公開を開始します。 過去の気象データ・ダウンロードのページ

                                      • Google Analyticsで自分のブログを評価→改善するための4+1つの指標 | nanapi [ナナピ]

                                        はじめに 皆さんはブログあるいはnanapiのようにコンテンツを増やしていくサイトをお持ちですか?そして、その評価はページビュー数や訪問者数だけでは行っていないでしょうか? 本記事では、筆者のブログサイト「リアルアクセス解析」のデータを確認しながら、4+1つの指標を紹介していきます。全てのデータはGoogleアナリティクスで確認できますので、既にGoogleアナリティクスを導入している方は、今日チェックしてみましょう! 「リアルアクセス解析」は2008年10月に筆者がはじめた、「アクセス解析」に特化したブログとなっています。月間数千人程度のアクセスがあります。購読者やはてなブックマークの数は割と多いサイトになっています。 指標1:リピート人数 リピート人数とは? ブログを定期的に読んでいる人をはかるための指標です。リピーターの人数を月単位で確認していきます。 この指標では、ブログの底力がど

                                        • [インタビュー]情報の新しい流れをつくりたい–東大のエンジニア集団が立ち上げた次世代マガジンサービスGunosy | Startup Dating [スタートアップ・デイティング]

                                          情報を集約し最適化したものを届けるキュレーションサービスが注目を浴びている。そうした中、東大の学生エンジニア集団が立ち上げた「Gunosy」がある。2011年10月にサービスをリリースし、先日の5月上旬にリニューアルをおこない、現在ユーザ数が順調に伸びているサービスだ。そのGunosyの開発者である福島くん関くん吉田くんの3人にインタビューをおこない、Gunosy立ち上げの理由やサービスにかける思いなどの話を聞いてきた。 3人の出会いとGunosyのきっかけ Gunosyを立ち上げたのは、福島良典くん(東京大学工学研究科システム創成学科専攻修士2年)、関喜史くん(同大、工学系研究科技術経営戦略学専攻修士2年)、吉田宏司くん(同大、工学研究科技術経営戦略学専攻修士2年)の3人で立ち上げたサービスだ。 3人は東京大学のシステム創成学科知能社会システムコース出身というつながりだ。高専出身の関くん

                                          • 【仮想通貨マイニング逮捕問題】逮捕の基準を神奈川県警に開示請求→回答引き伸ばしの末、2ヶ月経ってやっと開示「警察が来るまで何が違法か判断できないのが問題」

                                            警察庁 @NPA_KOHO マイニングツールの設置を閲覧者に明示せずに設置した場合、犯罪になる可能性があります。また、マイニングツールが設置されたウェブサイトにアクセスすると、パソコンの動作が遅くなることがあります。ご注意ください。npa.go.jp/cyber/policy/1… 2018-06-14 14:57:15 警察庁 @NPA_KOHO 警察庁公式アカウントです。 発信する情報は「報道発表資料」「新着情報」を基本としています。 当アカウントは発信専用のため警察庁からの返信等は行っておりません。 ご利用にあたっては 「警察庁Twitter運用ポリシー」npa.go.jp/twitter/policy…をご覧ください。 npa.go.jp 梅酒みりん@18,19a! @PokersonT 今までの簡単な経緯 神奈川県警等がcoin hiveによる仮想通貨マイニングをコンピュータウイ

                                              【仮想通貨マイニング逮捕問題】逮捕の基準を神奈川県警に開示請求→回答引き伸ばしの末、2ヶ月経ってやっと開示「警察が来るまで何が違法か判断できないのが問題」
                                            • 僕がGunosyを続ける理由 | ライフハッカー・ジャパン

                                              はじめまして株式会社Gunosyの福島と申します。 ライフハッカーで連載の機会をいただき、今後何回かにわたり『Gunosy(グノシー)』の内側を紹介させていただくことになりました。今回は第1回ということで、「僕がGunosyを続けることに決めた理由」と、その先にある「Gunosyでどういう世界を作っていきたいか」をお伝えしたいと思います。 実はサービスリリース日にブログ記事(僕がGunosyを作った理由)を書いたのですが、その記事の続編ともなっています。 Gunosyとは、何か まずは簡単にGunosyの紹介をしたいと思います。Gunosyはひと言で言うと「あなただけのために発行される新聞」です。twitterアカウントやFacebookアカウントを解析することで、そのユーザーが興味をもちそうなもの、好みそうなものを推測し、毎日25件(数は設定可能)の記事を届けます。つまりGunosyは、

                                                僕がGunosyを続ける理由 | ライフハッカー・ジャパン
                                              • Python で機械学習しよう!(環境構築 on Mac編) - もろず blog

                                                そろそろちゃんと機械学習を勉強しようと思い、ついでに Python をやり始めています そういえば、大学生のときに Python を勉強しようと思って本を買ったことがあったんですが、当時はあんまりやる気もなくちょっとしか手をつけていませんでした あの時ちゃんと勉強しとけばよかったなぁとか思ったり・・・ とりあえず、手持ちの Mac 上に数値計算や機械学習を実行できる環境を構築したのでその際の手順をまとめました ※以下の環境で動作することを確認しています OS X Mavericks (10.9) OS X Yosemite (10.10) この記事では 1. 概要 2. Python とライブラリのインストール 3. PyDev のインストールとセットアップ 4. Hello Python !!! 5. まとめ について説明します 1. 概要 今回は Python を使って数値計算、機械学

                                                  Python で機械学習しよう!(環境構築 on Mac編) - もろず blog
                                                • 文書比較(diff)アルゴリズム

                                                  文書比較(diff)アルゴリズム 前のドキュメント 次のドキュメント ViViの文書比較(diff)機能で使用しているアルゴリズムについて解説する。 これらのアルゴリズムは Myers 氏らの論文によるもので、氏は筆者のためにわざわざ論文をWebサイトで入手可能な形式にしてくださった。この場を借りてお礼申し上げる。 オリジナル論文は以下のWebサイトから入手可能である。 http://www.cs.arizona.edu/people/gene [1] E.W.Myers, "An O(ND) Difference Algorithm and Its Variations", Algorithmica, 1 (1986), pp.251-266 [2] S. Wu, U. Manber, G. Myers and W. Miller, "An O(NP) Sequence Comparis

                                                  • 長文日記

                                                      長文日記
                                                    • livedoor Developers Blog:String::Trigram でテキストの類似度を測る - livedoor Blog(ブログ)

                                                      こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日本語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日本語版の解説

                                                      • Private Presentation

                                                        Private content!This content has been marked as private by the uploader.

                                                          Private Presentation
                                                        • プリキュアは10年間、何を唄ってきたのか。-テキストマイニングより- - プリキュアの数字ブログ

                                                          (追記) 作詞者である只野菜摘先生からツイッターでコメントいただきました。 あと、イェイの回数について、コメントしました。 只野菜摘先生からコメント頂いちゃいました。 (本文) プリキュアは10年間の年月をかけて、何を唄ってきたのでしょうか。 調べました。 久しぶりのテキストマイニングです。今回は、プリキュアの唄の歌詞です。 <条件> ・「うたまっぷ」に登録されているプリキュアソング281曲(2015年8月15日現在)からTVサイズなど重複分などを除いた全257曲 ・Lyrics Master2を使いテキスト化のち、解析ソフト「KHCoder」にて分析 で、結果です。 プリキュアソング頻出150ワード まずは頻出150ワードです。 全257曲中における頻出語150です*1 こんな感じになりました。 トップ5はこれです。 1位:プリキュア 2位:Go 3位:みんな 4位:夢 5位:笑顔 最頻

                                                            プリキュアは10年間、何を唄ってきたのか。-テキストマイニングより- - プリキュアの数字ブログ
                                                          • 計量学習を用いた画像検索エンジンとアニメ顔類似検索v3について - デー

                                                            まだgithubにはpushしていないのですが、さいきょうの組み込み型画像検索エンジンotamaに計量学習を用いて与えられたデータにあった画像間の距離関数を学習してそれを使って検索するというドライバを入れたので、先行的なデモとしてアニメ顔類似検索v3を作ってみました。 計量学習は、ベクトル間の距離の計り方を機械学習で決めるみたいな分野です。 アニメ顔類似検索v3 AnimeFace Search v3 - Otama LMCA_VLAD_HSV Driver randomボタンを押すと顔画像がランダムに出るのでどれかクリックするとそれをクエリに検索します。color weightは色の重みを調節するパラメーターで、1にすると色だけで検索します。0にすると形状やテクスチャだけで検索します。結果画像の上の数字は類似度的なもので、その横のgglは元画像をGoogle Search by Imag

                                                            • アプリケーションにおけるデータ不整合との戦い - blog.syfm

                                                              これは Aizu Advent Calendar 2019 の 15 日目の記事です。14 日目は uzimaru0000 さん、16 日目は kacky__917 さんです。 はじめに 世の中には日々たくさんの価値ある Web サービスが生まれていますが、その価値を正しく提供するにはアプリケーションが正しく動かなければなりません。 たとえばアプリケーションは適切なユーザに適切なリソースを提供しなければならず、エラーを返す際は十分に定義された仕様に沿って返し、UI 側ではユーザに適切なメッセージを表示しなければなりません。 実際のところ、これらを厳密に実現するのは非常に困難ですが、アプリケーションにはこれら以上に複雑な問題が常につきまといます。 現在の Web アプリケーションはほとんどが分散システムの一形態です。例えばクライアントとサーバや、サーバとデータベースがネットワークを介して接続

                                                                アプリケーションにおけるデータ不整合との戦い - blog.syfm
                                                              • 小さくで可愛いグラフが描けるjQueryプラグイン「Piety」:phpspot開発日誌

                                                                Peity ? progressive pie charts 小さくで可愛いグラフが描けるjQueryプラグイン「Piety」 アイコン感覚で気軽に設置できて使い方次第では情報をわかり易く示すことができそうです クライアントサイドで描画するのでサーバに負担がない点もいいですね データの定義はspanで定義して、 1行で描画。 出力結果。 むちゃくちゃ使いやすいじゃないですか。 関連エントリ ミニグラフ作成ライブラリSparkline

                                                                • データマイニングを仕事にする人の生態系 - dataminer.me

                                                                  「データマイニングを仕事とする人=データマイナー」はどういう人たちがいるかということについて ビックデータとかで世の中がバズってるけど「僕はデータマイニングをやってます!」といったときに適切にその人がやっている業務領域を把握している人ってかなり少ないと思う。 グリーで働いていたときもデータマイナーはどういった仕事をしていて、何をやっていて何ができるのかっていうことを理解していなくてミスコミュニケーションが生まれていたと思うのでちょっとその生態系についてまとめてみた。おそらく、データマイナーといわれる人は以下のタイプがいる: 研究開発をする人 統計学的に新しいイノベーションを起こせる人。Google のPageRankアルゴリズムを作りましたとか、NetfrixやAmazonのレコメンデーションエンジン作りましたとかいう人がこれにあたる。スキル的には統計学にかなり長けている必要があり、その他

                                                                    データマイニングを仕事にする人の生態系 - dataminer.me
                                                                  • 紙と鉛筆でビットコインをマイニング:1日に0.67ハッシュ | POSTD

                                                                    紙と鉛筆でビットコインをマイニングするのは現実的なのか? それを試してみることにしました。マイニングに使用されるSHA-256アルゴリズムはかなりシンプルなので、実は手計算でもできることが分かりました。当然ながら、この処理はハードウェアマイニングに比べれば極端に遅くて、全く実用的ではありません。しかし、手作業でアルゴリズムを実行してみると、そのアルゴリズムがどのように働くのか正確に理解するための良い方法になります。 紙と鉛筆によるSHA-256の1ラウンド マイニングのプロセス ビットコインのマイニングは、ビットコインシステムのセキュリティの鍵となる部分です。その概念は、ビットコインのマイナーたちが、たくさんのビットコイントランザクションを1つのブロックにグループ化してから、ハッシングと呼ばれる暗号操作を、非常に稀少な特別なハッシュ値を誰かが見つけるまで、膨大な回数だけ繰り返すということで

                                                                      紙と鉛筆でビットコインをマイニング:1日に0.67ハッシュ | POSTD
                                                                    • ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan

                                                                      ヤフーは6月18日、開発者向けサイト「Yahoo!デベロッパーネットワーク」において、日本語の文章を解析できるAPI「日本語形態素解析Webサービス」を公開した。 日本語形態素解析Webサービスは、ヤフーの日本語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてきた形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開するもの。このエンジンは、ヤフーのブログ検索や商品検索などのテキスト処理、ブログ検索の「評判検索機能」、「まとめ検索機能」などのテキストマイニング処理にも利用されている。 このAPIを利用することで、開発者は解析対象となる日本語の文章を形態素に分割し、品詞や読み、基本形を取得できるほか、対象となる文章に多く含まれている単語、その文章を構成する特徴的な単語などを把握することが可能だ。 また、すでに公開済みのAPIから取得したデータを解析することもでき

                                                                        ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan
                                                                      • Hyper Estraier: a full-text search system for communities

                                                                        Our team of highly trained cybersecurity professionals provides expertise in compliance, tool assessments, threat hunting, incident response and more. Critical Start is leading the way in Managed Detection and Response (MDR) services. With a unique approach that treats every security alert as equal, Critical Start's proprietary Trusted Behavior Registry allows security analysts to resolve every al

                                                                        • 一審無罪の「コインハイブ事件」、8日から控訴審 「検察側の主張は的外れ」と弁護側 - 弁護士ドットコムニュース

                                                                            一審無罪の「コインハイブ事件」、8日から控訴審 「検察側の主張は的外れ」と弁護側 - 弁護士ドットコムニュース
                                                                          • 高騰し続ける仮想通貨Bitcoinを掘る世界最大のマイニング工場に潜入、2万5000台のマシンを酷使する採掘現場の恐るべき実態に迫る

                                                                            仮想通貨「Bitcoin(ビットコイン)」は、世界中に分散して保存された取引台帳に取引の記録を整合的に記録する計算処理に対して新しいビットコインを割り当てる「マイニング」という行為によってシステムが維持されています。ビットコインマイニングの最前線とはどのようなものかをさぐるべく、すさまじい数の専用マシンを使ってビットコインを掘り続ける世界最大のマイニング工場の仮想通貨採掘現場をQuartzが取材しています。 Photos: China has one of world’s largest bitcoin mines — Quartz https://qz.com/1055126/photos-china-has-one-of-worlds-largest-bitcoin-mines/ 中国の内モンゴル自治区オルドス市にあるBitmainのマイニング工場。8つある工場のうちの7棟でビットコイ

                                                                              高騰し続ける仮想通貨Bitcoinを掘る世界最大のマイニング工場に潜入、2万5000台のマシンを酷使する採掘現場の恐るべき実態に迫る
                                                                            • 統計処理ソフト R 入門 講習会資料

                                                                              講習会の目的 本講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

                                                                              • 【デリケートゾーンの黒ずみ対策No.1】イビサクリームの最安値はコチラ!効果を検証!悪い口コミは?

                                                                                キャンペーンがもうすぐ終了! 初回限定4,470円(36%OFF!) ※キャンペーンが終わる前にチェックをっ! イビサクリーム キャンペーン購入ページ イビサクリーム 定価7,000円がなんと! 限定価格:4,470円 ※今すぐチェック!! キャンペーンが終了している場合はご了承ください。 イビサクリーム キャンペーン購入ページ キャンペーンがもうすぐ終了! 初回限定4,470円(36%OFF!) ※キャンペーンが終わる前にチェックをっ! イビサクリーム キャンペーン購入ページ イビサクリーム 定価7,000円がなんと! 限定価格:4,470円 ※今すぐチェック!! キャンペーンが終了している場合はご了承ください。 イビサクリーム キャンペーン購入ページ キャンペーンがもうすぐ終了! 初回限定4,470円(36%OFF!) ※キャンペーンが終わる前にチェックをっ! イビサクリーム キャンペ

                                                                                  【デリケートゾーンの黒ずみ対策No.1】イビサクリームの最安値はコチラ!効果を検証!悪い口コミは?
                                                                                • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

                                                                                  ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか本当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

                                                                                    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.