並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 4770件

新着順 人気順

マイニングの検索結果201 - 240 件 / 4770件

  • 機械学習の精度と売上の関係

    【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)

      機械学習の精度と売上の関係
    • 【2019年】データ分析・可視化に本気でおすすめのツール30選(ノーコード型ツール含め) - Qiita

      一般的なチャート(8) インフォグラフィック(3) 地図・マップ(1) ネットワークグラフ(1) 関数のグラフ(1) エンジニア向け 一般的なチャート(10) 地図・マップ(4) ネットワークグラフ(1) 株価チャート(1) 1.一般的なチャート (1)RAWGraphs RAWGraphs はクラウド型、オープンソースのデータ視覚化ツールであり、 Excelのデータを処理するためによく使われます。RAWGraphsにデータをアップロードし、ほしいグラフを設計して、 SVGかPNGの画像に出力すれば済みます。RAWGraphsにアップロードされたデータは Web側でのみ処理されるので、 データの安全を保証できます。 (2)ChartBlocks ChartBlocks はグラフ作成のオンラインツールであり、スマートデータインポートガイドに従えば、データのインポートとグラフの設計を簡単に完了

        【2019年】データ分析・可視化に本気でおすすめのツール30選(ノーコード型ツール含め) - Qiita
      • 何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ

        先日、Quora日本語版でこんなやり取りがありました。 基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。 問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。 一般的なソフトウェア開発と、統計分析や機械学習との違い 統計分析や機械学習を仕事にするなら、その「振る舞い」を体系立てて学ぶ必要がある きちんと体系立てて学ばなかった結果として陥りがちな罠 余談

          何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
        • 次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる

          The Top Three hottest new majors for a career in technology : Microsoft JobsBlog マイクロソフトの採用活動などを記しているブログ「Microsoft JobsBlog」に8月23日付けでポストされたエントリ「The Top Three hottest new majors for a career in technology」(テクノロジー分野でもっとも熱い、3つの専門性とは)では、長期的に見て次の3つがホットな分野だと挙げられています。 Data Mining/Machine Learning/AI/Natural Language Processing (データマイニング/機械学習/人工知能/自然言語処理) Business Intelligence/Competitive Intelligence (ビジ

            次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる
          • 病みつきになる「動的計画法」、その深淵に迫る

            数回にわたって動的計画法・メモ化再帰について解説してきましたが、今回は実践編として、ナップサック問題への挑戦を足がかりに、その長所と短所の紹介、理解度チェックシートなどを用意しました。特に、動的計画法について深く掘り下げ、皆さんを動的計画法マスターの道にご案内します。 もしあなたが知ってしまったなら――病みつきになる動的計画法の集中講義 前回の『アルゴリズマーの登竜門、「動的計画法・メモ化再帰」はこんなに簡単だった』で動的計画法とメモ化再帰を説明しましたが、前回の説明ではまだ勘所をつかめていない方がほとんどでしょう。そこで、これらを完全にマスターするため、今回はもう1つ具体例を挙げながら練習したいと思います。 どういった問題を採用するかは悩みましたが、非常に有名な「ナップサック問題」を取り上げて説明します。 ナップサック問題とは以下のような問題です。 幾つかの品物があり、この品物にはそれぞ

              病みつきになる「動的計画法」、その深淵に迫る
            • 機械学習のスタックしていた案件をFacebook Prophetで3日で返済した話 - にほんごのれんしゅう

              機械学習のスタックしていた案件をFacebook Prophetで3日で返済した話 背景 広告代理店業を行なっており、クライアント企業から予算を預かって、インターネット広告やマーケティング業をしているのだが、クライアントの予算消化の異常値を監視したい 2016年半ばに外部のデータ分析専門の会社に、その日の予算消化が異常の場合、アラートを鳴らすシステムを外注開始、2016年10月に納品 2017年9月半ばに進捗率が芳しくないことが判明した。終わる見込みが立たなかったので、私が解決に当たる (ついでに"Machine Learning: The High-Interest Credit Card of Technical Debt[2]"と呼ばれる負債化してしまう機械学習のシステムとはという評価軸があったので、これらから今回使えそうなプラクティスを取り出して適応してみたいというモチベーションが

                機械学習のスタックしていた案件をFacebook Prophetで3日で返済した話 - にほんごのれんしゅう
              • KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

                概要と特長 KH Coderとは、計量テキスト分析またはテキストマイニングのためのフリーソフトウェア(自由ソフトウェア)です。 アンケートの自由記述・インタビュー記録・新聞記事など、さまざまなテキストの分析にお使いいただけます。 プログラミング不要、マウス操作で本格的な分析 安心の分析プロセス完全公開、研究利用も多数 New! 機能紹介(スクリーンショット) スクリーンショット集 [旧ページ:言葉・文書・可視化・他] KH Coder 3 正式版の新機能 New! 機能追加プラグイン「文錦®」シリーズ New! ダウンロードと使い方 KH Coder 3 正式版ダウンロード (Version 3.01) 使い方を知るためのチュートリアル ヘルプ 質問&エラー報告用の掲示板 ※投稿にはGitHubへの登録が必要(無料)[旧掲示板] よくある質問(FAQ) 開発者が語る公式セミナー & サポー

                • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

                  今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

                    統計的消去で擬似相関を見抜こう! - ほくそ笑む
                  • 死にゆくアンチウイルスへの祈り

                    Security meets Machine Learning 第1回キックオフミーティング https://connpass.com/event/62844/ 発表資料

                      死にゆくアンチウイルスへの祈り
                    • Machine Learning | Coursera

                      We asked all learners to give feedback on our instructors based on the quality of their teaching style.

                        Machine Learning | Coursera
                      • Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース

                        統計処理用のマシンを使って、自然言語処理で遊ぼう! BTOパソコンで有名な「パソコン工房」から「統計処理用のPCを企画しているので、何かできないか」と相談された編集部は、はてなエンジニアと相談して「word2vec」を使って遊んでみることに。はてなブログのデータとかっこいいパソコンを使って、最新の自然言語処理で楽しむ様子をお楽しみください! 記事の終わりには2TBの外付けHDDが当たるプレゼントのお知らせも。 (※この記事は株式会社ユニットコムによるPR記事です) ―― BTOパソコンのショップ/サイトで有名な「パソコン工房」さんから、以下のような依頼が来ました。 データサイエンティスト向けに、統計処理用に使えるパソコンをいろいろと考えています。なので、何か面白い処理に使って、PR記事にしてほしいんです! ▽ 【パソコン工房公式サイト】BTOパソコン(PC)の通販 ―― ということで、はて

                          Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース
                        • 面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!

                          転職して丁度2年がたちました。 現在はWebベンチャーで統計屋しています。大変楽しい毎日です。 なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。 このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。 あと現職の解決しがたい不満についても書いています。 糞長くなってしまったので要約すると 「今糞面白いけど超えられない壁あるので誰か助けて」 です。 現職面白い理由5個。 1.データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした 行動経済学やテキストマイニングをやっていました。 そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、 それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。 ですが今はSNSやソーシャルゲームや広告の

                            面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!
                          • データマイニングで理想の彼女をGetだぜ! - 発声練習

                            ある国際会議のkeynote Speechの中で紹介されていた話。非常に面白かった。 Wired: How a Math Genius Hacked OkCupid to Find True Love 「いまどきの若い男は、なんでもコンピュータか!」とか思われるかもしれないけど、何をしたのかを読んでみると「これって、単なるナンパの方が楽だったんじゃないか?」と思わされる。 登場人物のスペック この人の経歴がアメリカ的。 名前:Chris McKinlay (35歳) 経歴 2001年:Middlebury College を卒業。専攻は中国語 同年:世界貿易センターで中国語から英語への翻訳のアルバイト。アルバイトを辞めた5週間後に9・11。 〜2002年:その後、友達に誘われて、an offshoot of MIT’s famed professional blackjack team に

                              データマイニングで理想の彼女をGetだぜ! - 発声練習
                            • 機械学習はじめの一歩に役立つ記事のまとめ - その後のその後

                              「機械学習」というワードになんとなく惹かれつつも、具体的にやりたいことがあるわけでもないので、手を動かすことなくただひたすら「いつかやる」ために解説記事やチュートリアル記事を集める日々を過ごしていたのですが、このままじゃイカン!と Machine Learning Advent Calendar 2014 - Qiita に参加登録してみました。 が、やはり何もしないまま当日を迎えてしまったので、お茶濁しではありますが、せめて「機械学習ってどんな手法やライブラリがあって、どんな応用先があるのか?」というあたりをざっくり把握して最初に何をやるのか方向付けをするためにも、たまりにたまった機械学習系の記事をいったん整理してみようと思います。 機械学習の概要 特定のライブラリや手法の話ではなく、機械学習全般に関する解説。 機械学習チュートリアル@Jubatus Casual Talks 機械学習チ

                                機械学習はじめの一歩に役立つ記事のまとめ - その後のその後
                              • TechCrunch | Startup and Technology News

                                Parallel Domain is putting the ability to generate synthetic datasets into the hands of its customers. The San Francisco-based startup has launched a new API called Data Lab that stands on the shoulde Multiple subreddits are adopting alternative methods of protesting like publishing only one kind of post, changing the topic in focus, and days when the community turns private. A lot of these commun

                                  TechCrunch | Startup and Technology News
                                • Engadget | Technology News & Reviews

                                  How to watch NASA's first Boeing Starliner crewed flight launch today (scrubbed)

                                    Engadget | Technology News & Reviews
                                  • 統計学・データサイエンスの勉強法

                                    ここ数年、私はデータサイエンスについて学んでいます。おすすめの学習資料を紹介したいと思います。 教師用の教科書と初心者用の教科書 私自身、データサイエンスを学ぼうとして色々なソースを試してみました。残念なことに、日本語の良い学習資料は見つけられませんでした。どこかのブログで読んだことがありますが、教科書は教師用と学生用の二週類があるそうです。一つめは内容が既に分かっている教師の為の教科書で、日本はこのタイプです。もう一つのタイプの教科書は自学自習を目的に作られているので、教師なしで学ぶできる教科書になっているということで、アメリカはこのタイプの教科書が多いです。私自身、他の文系・理系の教科書を探した時もアメリカの教科書の方が分かりやすく、その本だけを読めば分かるようになっていると同じ印象を持ちました。 オンライン教育(MOOC) アメリカは科学教育に熱心であり、最近はやりのMOOCでも豊富

                                      統計学・データサイエンスの勉強法
                                    • なぜ「主人がオオアリクイに殺されて1年が過ぎました」なのか? - あんちべ!

                                      件名: 主人がオオアリクイに殺されて1年が過ぎました。 差出人: 久光 いきなりのメール失礼します。 久光さやか、29歳の未亡人です。 お互いのニーズに合致しそうだと思い、連絡してみました。 自分のことを少し語ります。 昨年の夏、わけあって主人を亡くしました。 自分は…主人のことを…死ぬまで何も理解していなかったのが とても悔やまれます。 主人はシンガポールに頻繁に旅行に向っていたのですが、 それは遊びの為の旅行ではなかったのです。 収入を得るために、私に内緒であんな危険な出稼ぎをしていたなんて。 一年が経過して、ようやく主人の死から立ち直ってきました。 ですが、お恥ずかしい話ですが、毎日の孤独な夜に、 身体の火照りが止まらなくなる時間も増えてきました。 主人の残した財産は莫大な額です。 つまり、謝礼は幾らでも出きますので、 私の性欲を満たして欲しいのです。 お返事を頂けましたら、もっと詳

                                        なぜ「主人がオオアリクイに殺されて1年が過ぎました」なのか? - あんちべ!
                                      • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

                                        このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日本のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。

                                          dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
                                        • プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ

                                          集合知プログラミング 作者: Toby Segaran,當山仁健,鴨澤眞夫出版社/メーカー: オライリージャパン発売日: 2008/07/25メディア: 大型本購入: 91人 クリック: 2,220回この商品を含むブログ (277件) を見る当初はサンプルコードがPythonということで購入した本書ですが、読んでみると内容の素晴らしさに驚嘆しました。私が今までに読んだオライリーシリーズでも屈指の名作だと思います。 『集合知プログラミング』とは 『集合知プログラミング』は、Amazonの協調フィルタリングのように、ウェブ上のデータを収集してユーザーの嗜好にあったコンテンツを推薦したり、大量のデータを分かりやすく分類・可視化するプログラムを簡単に実装する技術を解説した書籍です。Webプログラミングをかじったことのある方でしたら、だれしもAmazonのような推薦サービスを作ってみたいと思ったこと

                                            プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ
                                          • 民間の個人情報売買解禁へ 政府、新事業創出を後押し - 日本経済新聞

                                            政府が経済対策に盛り込む規制改革案が明らかになった。企業や病院などが持つ個人情報を匿名化したうえで他の企業に売買できる新ルールをつくり、新商品の開発や新規ビジネスの創出を後押しする。証券市場を活性化するため、企業が株式市場に上場する際に必要な情報開示の義務も緩和する。政府が30日に閣議決定する経済対策は、今年度予算の予備費を使った対策と、財政支出を伴わない対応策を組み合わせるのが特徴。約70項

                                              民間の個人情報売買解禁へ 政府、新事業創出を後押し - 日本経済新聞
                                            • 高木浩光@自宅の日記 - 警察庁の汚い広報又は毎日新聞の大誤報を許すな

                                              ■ 警察庁の汚い広報又は毎日新聞の大誤報を許すな 今日、警察庁がサイバー犯罪年度統計か何かをマスコミ向けに発表したようで、今日の夕刊各紙は1面で「仮想通貨被害677億円」(読売)、「標的型メール最多6740件」(日経)、「不審アクセス45%増 マイニング21人摘発」(毎日)の見出しが躍っている。 このうち毎日新聞が、コインマイナー事案を報じているのだが、「2018年に全国で21人が不正指令電磁的記録供用容疑などで摘発(逮捕・書類送検)された。」とあり、昨年6月の時点で16人と発表されていたところから、5人増えていることがわかる。当時「16人で打ち止め」とも聞いていたが、確かにその後、私のところへ新たに家宅捜索があったとの情報提供が数人あった。 問題は記事のそれに続く部分である。「サイト閲覧者 加担気づかず」の「加担」というのも意味不明だが、なんと、「摘発された人は「ネットの広告と同じ仕組み

                                              • 機械学習アルゴリズムへの招待 | POSTD

                                                機械学習の問題 については以前に紹介したので、次はどんなデータを収集し、どんな機械学習アルゴリズムを使うことができるのかを見ていきましょう。本投稿では、現在よく使用されている代表的なアルゴリズムを紹介します。代表的なアルゴリズムを知ることで、どんな技法が使えるかという全体的なイメージもきっとつかめてくるはずですよ。 アルゴリズムには多くの種類があります。難しいのは、技法にも分類があり拡張性があるため、規範的なアルゴリズムを構成するものが何なのか判別するのが難しいということですね。ここでは、実際の現場でも目にする機会の多いアルゴリズムを例にとって、それらを検討して分類する2つの方法をご紹介したいと思います。 まず1つ目は、学習のスタイルによってアルゴリズムを分ける方法。そして2つ目は、形態や機能の類似性によって(例えば似た動物をまとめるように)分ける方法です。どちらのアプローチも非常に実用的

                                                  機械学習アルゴリズムへの招待 | POSTD
                                                • データサイエンティストを目指すに当たって、ぜひ揃えておきたいテキストたちを挙げてみる - 渋谷駅前で働くデータサイエンティストのブログ

                                                  追記2 2015年末の時点での最新リストはこちらです。 追記 この記事の5カ月後にもう少し更新した内容の「お薦め本リスト」記事を2つupしてますのでそちらもお読みください。 2013年秋版:データサイエンティストを目指すなら揃えておくべき10冊 - 六本木で働くデータサイエンティストのブログ 2013年秋版:データ分析初心者にお薦めする「基礎を本当にゼロから学ぶ」ためのテキスト5冊 - 六本木で働くデータサイエンティストのブログ 今回は、僕が実際に自然科学の研究者からデータサイエンティストへと転身するに当たって、いつも脇に置いていたテキストや同僚が参考にしていたテキストをまとめて紹介します。 ※以下僕も持っているものには「*」を打ってあります*1*2*3 統計学 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メ

                                                    データサイエンティストを目指すに当たって、ぜひ揃えておきたいテキストたちを挙げてみる - 渋谷駅前で働くデータサイエンティストのブログ
                                                  • 「数学的ゲームデザイン」というアプローチ - doryokujin's blog

                                                    前回の議論をより一般化した話です。数式も少なめ。実ビジネスにおいて数学がどこまで貢献できるのかというところを理解してもらい,少なからず関心を持って頂ければ幸いです。ただしあくまで読み物として捉え,実世界ビジネスにおける違法性など指摘をするのはやめて下さい。 目次 1. 『コンプガチャの数理 -コンプに必要な期待回数の計算方法について-』 2. 『「数学的ゲームデザイン」というアプローチ』 3. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その1-』 4. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その2-』 定義 「数学的ゲームデザイン」とは,とある数学モデルのレールに沿ったゲームをデザインすることである。それによって,その背景にある種々の数学的性質を活用して優位な戦略を立てることが可能になる。 コンプガチャは,「The Coupon Collecto

                                                      「数学的ゲームデザイン」というアプローチ - doryokujin's blog
                                                    • NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析

                                                      2012/01/28に行われる、第三回Twitter研究会向けの発表資料です。 他の発表者および参加申し込みは以下から。 http://partake.in/events/b7b25ded-4918-4e57-9984-15d11200e561

                                                        NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
                                                      • 第3回 機械学習のためのベイズ最適化入門|Tech Book Zone Manatee

                                                        応用範囲が広く幅広い視点からの説明になりがちなベイズ最適化について、本記事では機械学習のハイパーパラメータ探索に利用することに限定して解説します。 1. はじめに 最近、ベイズ最適化という手法が注目を集めています。 ベイズ最適化 (Bayesian Optimization) とは、形状がわからない関数 (ブラックボックス関数) の最大値 (または最小値) を求めるための手法です。 ベイズ最適化についての入門記事は Web 上にすでにいくつかありますが、ベイズ最適化は応用範囲が広く、入門記事は様々な応用に向けた幅広い視点からの説明になりがちです。 本記事では、機械学習ユーザに向けて、ベイズ最適化を機械学習のハイパーパラメータ探索に利用することに限定して説明します。 これにより、機械学習に対して、ベイズ最適化がどのように利用できるのかを分かりやすく解説したいと思います。 2. ハイパーパラメ

                                                          第3回 機械学習のためのベイズ最適化入門|Tech Book Zone Manatee
                                                        • ビッグデータ「同意なしで提供も可能に」 NHKニュース

                                                          プライバシーに配慮しながらビッグデータの活用を進めていくためのルールを盛り込んだ「個人情報保護法」の改正を目指している政府の検討会は、「個人が特定されないようにデータを加工した場合は本人の同意を得なくても第三者に提供できる」などとした大綱の原案をまとめました。 商品の購入履歴や位置情報などのビッグデータは、新たな産業の創出につながると期待される一方、ほかの情報と組み合わせることで個人が特定されるおそれもあり、企業が活用に慎重になっています。 このため政府の検討会は、プライバシーに配慮しながら活用を進めるためのルールを盛り込んだ個人情報保護法の改正に向け検討してきました。 まず、今の「個人情報保護法」では、企業などが集めたデータをさらに別の企業など第三者に提供する場合、本人の同意を得ることが義務づけられていますが、大綱の原案では、企業の負担などを考慮して「個人が特定されないようデータを加工し

                                                            ビッグデータ「同意なしで提供も可能に」 NHKニュース
                                                          • 「おむつを買った人はビールも買う」という例えを出したときのこと

                                                            私はデータ分析が好きで長年個人で学んでいる。講師を依頼されることがある。 いろいろな会社や学校でデータ分析の講義をする機会をいただく。 「おむつを買った人はビールも買う」という有名な例えを出したとき、 以前は次のように考える人が多かった。 「赤ちゃんがいる人は外で飲めないし、自宅でビールを飲むのかな」 「赤ちゃんがいるのにお酒を飲むということは育児ストレスの発散かな」 そうやって顧客イメージを膨らませて、マーケターならば 「二つの売り場を近づけようかな。」 「少し高いビールを置いてみようかな」 「おむつ購入者にストレス発散グッズのメールマガジンを出してみようかな」 と考えるのが普通だと思っていた。 最近なんだか傾向が変わってきた。 同じ質問をすると、 「最近ビール飲む人減ってますよね」=単語から連想したことを言う人 「ビール買った人は何でおむつを買うんですか?」=読解力がない人 「なんでな

                                                              「おむつを買った人はビールも買う」という例えを出したときのこと
                                                            • Webクローリング&スクレイピングの最前線 公開用

                                                              MySQLとPostgreSQLと日本語全文検索 - Azure DatabaseでMroonga・PGroongaを使いたいですよね!?Kouhei Sutou

                                                                Webクローリング&スクレイピングの最前線 公開用
                                                              • 統計データリンク集(マクロ統計)

                                                                お金がかからない&比較的収集が容易な統計サイトを挙げてみました。ご参考までです。世界経済(日本含む)の統計サイトです。

                                                                  統計データリンク集(マクロ統計)
                                                                • 統計データ・市場調査データを提供するサービス11選

                                                                  業界の市場動向を調べる際に、皆さんはどのように根拠データを入手していますか?自社のホームページに新規コンテンツを立ち上げたい時、どの方向に展開をしていけばそのマーケットを押さえることができるでしょうか。これらを解決するのが、Web上で閲覧できる統計や調査データの数々です。各企業が自社で調査した数値を公開しているものもあれば、国が統計データとして公開しているものもあります。 今回は調査や統計データを入手できるサイト、調査機関のサイトをまとめました。皆さんのビジネスにお役立てください。 ※データの引用や利用にあたり制限がある場合があります。詳しくは各サイトの利用規約などをご確認ください。 統計データや市場調査データが公開されているサービスまとめ 総務省統計局 http://www.stat.go.jp/ 今回紹介する中では最も利用され、また目にする機会も多い調査の一つかもしれません。総

                                                                    統計データ・市場調査データを提供するサービス11選
                                                                  • Tポイントの会員データ分析から企業は何を知るのか

                                                                    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 多様なシステムから生み出される多種、大量の「データ」を高速に分析し、そこから得た知見をビジネスの競争力強化や顧客満足度の向上に役立てようとする取り組み——「ビッグデータ」が、大きな注目を集めている。 4月中旬に開催された日本IBM主催の「Information On Demand Conference Japan 2012」の中で、実際にこのビックデータを活用して成果をあげているいくつかの企業の事例が紹介された。その中には、日本人口の約3割におよぶ個人消費者の購買行動に関するデータを活用し、パートナーに対してマーケティング視点での分析サービスを提供している企業があった。 「Tポイント」サービスを展開するカルチュア・コンビニエンス・クラブ

                                                                      Tポイントの会員データ分析から企業は何を知るのか
                                                                    • ワールドカップ日本代表の敗因は何か? データで浮かび上がる「コートジボワールの秘策」

                                                                      コートジボワール戦に逆転負けした日本。勝負の分かれ目はどこにあったのか――データからそのポイントを探ってみよう。 RECIFE, BRAZIL - JUNE 14: Yuto Nagatomo (L) and Hotaru Yamaguchi of Japan walk off the field with teammates after being defeated by the Ivory Coast 2-1 during the 2014 FIFA World Cup Brazil Group C match between the Ivory Coast and Japan at Arena Pernambuco on June 14, 2014 in Recife, Brazil. (Photo by Jamie Squire/Getty Images)

                                                                        ワールドカップ日本代表の敗因は何か? データで浮かび上がる「コートジボワールの秘策」
                                                                      • フーリエ変換の本質

                                                                        工学系の大学生なら、2回生ぐらいで習うフーリエ変換。フーリエ級数やらフーリエ展開やらの式だけ覚えさせられて、フーリエ変換の意味を理解してない人が多いようです。 そこで、フーリエ変換とは何か?をサクっと説明してみましょう。 全ての信号は、上図のようにsin波の足しあわせで表現することが出来ます。 具体的には、周波数が1のsinxと周波数が2のsin2xと周波数が3のsin3xと・・・周波数がnのsinnxを足し合わせることで、あらゆる信号を表現することが出来るのです。 しかし、ただ単にy=sinx+sin2x+sin3x+・・・としたのでは1種類の信号しか表現できません。そこで、各周波数の振幅を変化させることで、あらゆる信号を表現するのです。 上記の信号の場合、y=4*sinx+0.5*sin2x+2*sin3x+sin4xと表現できます。 さて、先程の図を用いて、周波数を横軸に、振幅の大き

                                                                        • pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm

                                                                          scikit-learn(sklearn)の日本語の入門記事があんまりないなーと思って書きました。 どちらかっていうとよく使う機能の紹介的な感じです。 英語が読める方は公式のチュートリアルがおすすめです。 scikit-learnとは? scikit-learnはオープンソースの機械学習ライブラリで、分類や回帰、クラスタリングなどの機能が実装されています。 また様々な評価尺度やクロスバリデーション、パラメータのグリッドサーチなどの痒いところに手が届く機能もあります。 インストール scikit-learnの他にもnumpyとかscipyとかが必要です。 Windows 64 bit版の人は以下のURLに色々なインストーラーがおいてあるのでおすすめ Python Extension Packages for Windows - Christoph Gohlke その他の人は以下のURLを見て

                                                                            pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm
                                                                          • なぜコインハイブ「だけ」が標的に 警察の強引な捜査、受験前に検挙された少年が語る法の未整備への不満

                                                                            サイト訪問者のPCを使ってWebブラウザ上で仮想通貨をマイニング(採掘)させる「Coinhive(コインハイブ)」を設置したことを巡り、複数の検挙者が出ている問題(通称:Coinhive事件)について、検挙当時未成年だった少年がねとらぼ編集部の取材に応じ、当時の状況や「Coinhive事件」の問題点について語りました。 コインハイブ事件の年表(coinhiveuser.github.ioより引用) 「Coinhive」とは Coinhiveとは、Web運営者がCoinhiveのコードをサイトに埋め込むことにより、アクセスした閲覧者に「Monero」という仮想通貨をマイニング(採掘)させて、報酬を受け取るサービス。運営者は採掘で得た利益の7割を受け取ることができるとあり、2017年10月ごろから日本でも話題を呼びました。 Coinhive側は、これまで多くのサイトが広告収入に頼ってサイト運営

                                                                              なぜコインハイブ「だけ」が標的に 警察の強引な捜査、受験前に検挙された少年が語る法の未整備への不満
                                                                            • fluentd を利用した大規模ウェブサービスのロギング

                                                                              YAPC::Asia 2008 Tokyo - Pathtraq - building a computation-centric web serviceKazuho Oku

                                                                                fluentd を利用した大規模ウェブサービスのロギング
                                                                              • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

                                                                                朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

                                                                                • 博物館所蔵の芸術作品の画像:オープンアクセスの経験(4) / クリスティン・ケリー - 翻訳記事 - みんなの翻訳

                                                                                  2018年05月30日 平素よりみんなの翻訳サイトをご利用いただき誠にありがとうございます。 この度、2018年05月30日 10:00より、サーバ移行に伴いサービスを一時停止させていただきます。 ※作業完了予定は未定となります。 完了時期が分かり次第、サイト上で連絡させていただきます。ご迷惑をお掛けし、申し訳ございませんが、しばらくお待ちください。