タグ

分析に関するwata88のブックマーク (17)

  • 41歳のゲーマー、部屋から一歩も出ずに権力者の不都合な真実を暴く(高木 徹) @gendai_biz

    謎のネット調査集団 いま、世界を席巻している「ベリングキャット」と呼ばれる謎の調査集団について聞いたことがあるだろうか? あるいは、彼らが採用している革命的な技法「オープンソース・インベスティゲーション」については? ラップトップ一台を武器に、世界中、いつどこからでも調査報道を行い、プーチン大統領や中国政府など、国際政治を動かす強大な権力と対峙して、世界の耳目を集める事件の真相を暴いていく。 ロシアの関与が疑われる、ウクライナ上空でのマレーシア航空機撃墜事件の真相や、アフリカでのカメルーン軍兵士らによる母子銃殺、あるいは新型コロナウイルスの震源となった武漢での惨状の実態など、いずれも政府当局が隠蔽しようとした「不都合な真実」の真相を次々と暴いていく。 NHKBS1で5月31日(日)午後11時から再放送するBS1スペシャル「デジタルハンター~謎のネット調査集団を追う~」では、アメリカ・イギリ

    41歳のゲーマー、部屋から一歩も出ずに権力者の不都合な真実を暴く(高木 徹) @gendai_biz
  • アタマが良くてマーケットがわかる人しか稼げない社会は「要らない」。 - シロクマの屑籠

    以下のリンク先記事は、現状分析としては間違っておらず、実際、仕事への要求水準は高くなっているのだろう。 人手不足なのに給料が上がらないのは、経営者の強欲のせいではなく、仕事に要求される能力が高くなったから。 ですから現在の状況を単純に言えば、 1.事務職の消滅とともに、「普通の人」が遂行できて、「それなりのお金がもらえる」職場は消滅してしまった。 2.今は「低賃金・肉体労働」の仕事に就くか、専門家として「知識労働」に従事するか、その2つしか選択肢がない ということになります。 日だけでなく、欧米諸国でも「普通の人」が働いて「それなりのお金がもらえる」職場は少なくなっている。低賃金の肉体労働や単純労働に従事するか、高度なスキルを必要とする知識労働にジャンプアップするか、そのどちらかを迫られがちな世相なのは、そのとおりなのだろう。 加えて、リンク先ではマーケティングセンスの重要性も指摘されて

    アタマが良くてマーケットがわかる人しか稼げない社会は「要らない」。 - シロクマの屑籠
  • プロダクトのリリース前から新ダッシュボード「Looker」の導入に踏み切ったわけ | メルカリエンジニアリング

    こんにちは。メルペイのデータアナリストチームです。 メルペイはプロダクトの開発フェーズにあり、リリースに向けて全社で頑張っています。 「プロダクトがないのに、データ分析?」と思う方もいらっしゃるはずなので、メルペイのデータアナリストの業務と、力を入れているダッシュボードツール「Looker」の活用について紹介させて頂きます。 Lookerの公式ページはこちら プロダクトがないフェーズでの仕事 Lookerの話をする前に、まずは私達の状況を簡単に説明します。 分析チームを抱える企業は沢山ありますが、「プロダクトができる前から活動しているケース」は少ないと思います。 そういった意味では、私達のチームは他の会社と比べてユニークなポジションになっています。 一言で言えば「事業を作るための分析」を行っています。 メルペイの事業が成り立つには「良いプロダクト」を作り、「ステークホルダーとの関係」を築き

    プロダクトのリリース前から新ダッシュボード「Looker」の導入に踏み切ったわけ | メルカリエンジニアリング
  • 巨大なバッチを分割して構成する 〜SQLバッチフレームワークBricolage〜 - クックパッド開発者ブログ

    トレンド調査ラボの青木峰郎(id:mineroaoki)です。 好きなRubyのメソッドは10年前からString#slice(re, nth)ですが、 最近はRubyよりCoffeeScriptとSQLのほうが書く量が多くて悩んでいます。 今日はわたしが開発している「たべみる」の背後で働いている 巨大バッチの構成について話したいと思います。 たべみるのバッチは約3000行のSQLで構成されており、 処理時間が1日で4時間程度かかる、そこそこの規模のプログラムです。 このバッチ処理プログラムをBricolage(ブリコラージュ)というフレームワークで構造化する手法について説明します。 「たべみる」とは まず最初に、「たべみる」がどういうものなのかごく簡単にお話ししておきましょう。 「たべみる」は企業のみに提供しているB2Bの分析サービスで、 クックパッドレシピ検索の分析をすることができま

    巨大なバッチを分割して構成する 〜SQLバッチフレームワークBricolage〜 - クックパッド開発者ブログ
  • kaggleで予測モデルを構築してみた (4) - データの背景を調べる - About connecting the dots.

    前回は,データの前処理に先立って,各データの概要をみました.その上で今回は,Web上で手に入るタイタニックの史実をまとめて,データ前処理のための手がかりをつかむことにしましょう. タイタニック号の客室区分 客室は主に1-3等の客室と,その上の特等と呼ばれるランクに分けられていたようです.ただ特等は数が少なかったのか,特等の乗客が何人いたのかはよくわからないみたいです.とりあえずWikipediaによると,乗客数は以下の通りだったそうですね. 船客数: 1等329人 2等285人 3等710人 乗組員数: 899人 また,等級ごとの生存率がこちらのページにまとまっており,これによると明確に高い等級の乗客ほど生き残っていることがみてとれます. 区分 女性・子供 男性 計 一等船客 94% 31% 60% 二等船客 81% 10% 44% 三等船客 47% 14% 25% 乗務員 87% 22%

    kaggleで予測モデルを構築してみた (4) - データの背景を調べる - About connecting the dots.
  • 大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校

    All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯(2014年3月8日(土)開催) U-18受賞作品

    大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校
    wata88
    wata88 2014/04/17
    素晴らしい
  • Supecellの1日の売上が5億円でDAUが2900万人ということがバレる : SociApp -Social Appの分析ブログ-

    ハーフパイプでメダル獲得おめでとうございます。 15歳で銀メダルとか半端ないですね。道を間違えなければ一生安泰ですな。 そんな半端ないネタで1つおもしろいのがありましたので回覧を。 Supercell Hacker: They Ignored Me, “So I Gave Them a Lesson” なんとハッカーがSupercellのアカウントをハッキングしてKPIを晒すという事態に。 この記事によればSupercellの1日の売上は$5.15Mでおよそ5億円。さらにDAUは2,900万人とのこと。 ※Clash of Clans単体ではなくて全体の模様。 ちなみに日付は2月7日。 Clash of Clansでいくら売れているということまでは晒されていないようですが、 Supercellで1日の売上が5億円とは当に凄いですね... ただ、ガンホーはこの数字よりさらに上であることを考

    Supecellの1日の売上が5億円でDAUが2900万人ということがバレる : SociApp -Social Appの分析ブログ-
  • Python/NetworkXで簡単ネットワーク分析 - あんちべ!

    slaさん主催のNumpy/Scipy勉強会でLTをします。 内容はNetworkXというPythonのネットワーク分析パッケージの紹介です。 Pythonで簡単ネットワーク分析 View more presentations from AntiBayesian ネットワーク分析と言えば、PajekやRのigraphが定評有りますが、 これらはどうしてもサブグラフの扱いに不満がありました。 ネットワークからサブグラフを抽出するところまでは出来ますが、 各サブグラフがどのような性質を持つか分析したい場合、 指定したサブグラフを形成しているノード、エッジ、重みの情報を簡単に取り出す方法がありません。 NetworkXであれば、指定したノードやエッジだけ隣接行列や辺行列の形で入出力することが可能です。 また、ネットワーク分析は非常に計算量が大きく、高速な演算が求められるため、データをNumpyへ

    Python/NetworkXで簡単ネットワーク分析 - あんちべ!
    wata88
    wata88 2014/01/21
    参考になりました
  • ベイズ推定を知っているフリをするための知識

    最近はベイジアンが増えてきて、実用分野での利用も進んでいるようだ。話題としては知っておきたいが、世間一般には理解に混乱を生んでいるようだ。 ベイズ推定は入門レベルの統計学の教科書ではオマケ的な扱いがされており、実際に伝統的な統計手法を拡張している面が強い。そういう意味では、誤解や混乱があっても仕方が無い。 利用する必要があるのか無いのか良く分からない点も多いのだが、知らないと告白するのも気恥ずかしいかも知れない。自分ではベイズ推定で分析を行わない人が、ベイズ信者と話をあわせるために最低限知っておくべき事をまとめてみた。 1. ベイズ推定とは何か? ベイズ推定とは、ベイズの定理を応用した推定手法だ。端的に理解するためには、最尤法に事前確率を導入している事だけ覚えれば良い。これで哲学的議論を全て回避してベイズ推定を把握することができる。 下の(1)式ではπ(θ)が事前確率、π(θ|x)が事後確

    ベイズ推定を知っているフリをするための知識
    wata88
    wata88 2013/12/26
  • データ産業に携わる人々の生態

    今の会社や前職で働いていたときもデータを分析するって言うのはどういうことでそこに関わっている人はどういった仕事をしていて、何をやっていて何ができるのかっていうことを理解していなくてミスコミュニケーションが生まれていたことが多かった気がします。この記事では特に「人」にフォーカスをしてデータ産業に関わっている人たちの種類についてご紹介させていただきます。

    データ産業に携わる人々の生態
  • 「位置ゲー」コロプラの知られざる本命事業:日経ビジネスオンライン

    「プロ野球PRIDE」「黒のウィズ」などのスマートフォン向けゲームでヒットを飛ばし、時流に乗るベンチャー企業のコロプラ。2013年7~9月期の決算は売上高が前年同期比3倍、営業利益が同3.7倍の好業績をたたき出した。 今やスマホ向けゲーム会社としてすっかり有名な同社だが、実は開設以来、もう3年目になる知られざるシンクタンクがある。その名も「コロプラおでかけ研究所」。「位置ゲー」と呼ばれる同社のゲームに日々蓄積されていく携帯電話やスマートフォンの位置情報を統計処理し、「人の移動」に関する様々な傾向を解析している。 推進役は、コロプラの最高戦略責任者(CSO)である長谷部潤氏。おでかけ経済研究所の主席研究員を務めている。上場準備や業のゲーム事業が多忙につき長らく研究発表を休止していたが、最近になって再び活発な活動を見せ始めた。その第一弾が地方都市の観光動態分析の実証実験。コロプラの「位置ゲ

    「位置ゲー」コロプラの知られざる本命事業:日経ビジネスオンライン
  • データサイエンティストに必要な3つのスキル | quipped

    久しぶりにタイトルで釣りにいっているが、ブラウザの「戻る」ボタンを押さないでくれw ... ... ... (よし、まだ「戻る」ボタンを押してない!) ぼく自身、データサイエンティストだったことはないが、一応大学では数学を勉強していたし、金融でクオンツトレーダーもやっていたし、人生3回分(と言ったら言い過ぎか)くらいのSQLクエリは書いている。なので、これから書くことは、屋に立ち並ぶ歯の浮く様なビッグデータ談義よりは、普遍的な価値があると自負できる。 もう一つ題に移る前に、「データサイエンティスト」という呼称について感じる両価的な感情について軽く説明したい。 ぼくは幸いにも優秀な同僚や友人に恵まれていて、彼らの中には、データ分析屋さんでありながら、データを集めてきて(広義の)データウェアハウスに突っ込むという非常に面倒くさい一連の作業もちゃっちゃか出来る奴が2、3人いる。そういうマルチ

  • TokyoR#30に参加してきた - でたぁっ 感動と失敗の備忘録

    以前から参加してみたかったTokyoRに参加してきたので個人的な感想をメモメモ。φ(..) ツートまとめはこちら 第30回R勉強会@東京 #TokyoR - Togetter @bob3bob3 さんがまとめてくれています。 1.はじめてのR(@aad34210さん) demo()関数でdemoが見れる。ex)demo(graphics) + enter R Cheet Sheet は、Rのカンニングペーパー CRAN Task View はパッケージを見つけるのに便利 2.分散分析(@aad34210さん) 2つ以上の平均値を比較するための統計的手法(2つの場合はt検定) 主効果と交互作用効果 rep関数は繰り返せ aov関数が分散分析 interactionm.plotで図示できる 3.MySQLではなくRでデータ操作しよう(@IT7Cさん) Rデータ自由自在 ※そういえばこのまだな

    TokyoR#30に参加してきた - でたぁっ 感動と失敗の備忘録
  • ヤフー、ビッグデータ分析による参院選の議席予測を発表-自公は過半数越えの予測 - MdN Design Interactive

    ヤフー、ビッグデータ分析による参院選の議席予測を発表-自公は過半数越えの予測 新規会員登録 ログイン管理 Twitter facebook はてなブックマーク RSS 2024.1.26 FRI

    ヤフー、ビッグデータ分析による参院選の議席予測を発表-自公は過半数越えの予測 - MdN Design Interactive
  • 「激おこぷんぷん丸」の形態的分析試案 - 誰がログ

    ついったーで「激おこぷんぷん丸」の国語教員による分析・品詞分解が話題になっていて、 www.yukawanet.com どうなのかなあ、みたいなことをつぶやいていたのですが、けちだけつけていてもあれなので即興で分析。 以下の内容は関連文献の調査とかしてませんので細部は結構適当なところもあります。色々叩いて遊んでみてください。 前提と方法 先頭の要素から分解しながら、その要素をどう考えるのか少し考察する。ちなみに 語:≒自由形態素。単独で句・節・文の構成要素になることができる 接辞:≒拘束形態素。単独で句・節・文の構成要素になることができず、自由形態素にくっついて現れる という粗い定義を採用している。 「激」 「激だ」「激を」などの用法は今のところ見つかっていないので接頭辞とする。 「強い」「はげしい」といった意味で漢語の構成要素となる(例:激痛、激減、激戦、…)のが一般的であると思われるが

    「激おこぷんぷん丸」の形態的分析試案 - 誰がログ
  • Gunosyはこんなもんだし、自称情報強者落ち着きなさいよという話。

    [衝撃]Gunosyはただの「はてブ拡張サービス」だった?衝撃の分析まとめ – NAVER まとめ [Gunosy検証] やっぱり全部はてブだった&流用の痕跡もあった – NAVERまとめ 検閲?Gunosyが自社批判記事を一切配信しなかったことが判明 – NAVER まとめ Gunosyのレコメンドエンジンの仕組み解説 近い将来、Gunosyが私達から奪うもの ここ最近のGunosy関連の批判についての所感 – Gunosy blog ゴールデンウィーク後半、Gunosyがかなり話題になっているようです。 が、こう様々な発言を見ていると、ちょっとなんだかなぁと思うところもあるので、これまで思っていたところについて書いておきたいと思います。 ■Gunosy配信記事とホッテントリがカブる件について 「Gunosyの情報はどれもこれもはてブがついているものばかり。はてブをまとめ直しているだけだ

    Gunosyはこんなもんだし、自称情報強者落ち着きなさいよという話。
    wata88
    wata88 2013/05/07
    こんなもんを超えられるか気になってるから使ってる
  • コールオブデューティ4とQTEの話 - 色々水平思考

    そろそろ世代交代しそうな今世代において最も高い評価を得たソフトの一つと言えば、コールオブデューティ4(以下CoD4)だが、何故このタイトルの、特に一人で遊ぶキャンペーンモードが高い評価を得たのかと言えば、ストーリーの最初から最後まで共通の操作系でクリア出来るようにゲームを設計し通したことに寄る部分が大きい。 最初から最後まで狙って撃つという動作によって目の前の問題を解決出来るようにゲームが設計され、それに沿ったストーリーが展開する。ストーリー部分の素晴らしさと同等以上に重要なのは、ゲームプレイ部分の設計の巧みさなのである。 んで、残念ながらCoDシリーズの最近のタイトルや、CoDシリーズのライバルタイトルと言えるだろうバトルフィールド3を、このようなゲームプレイとストーリーの密着度という観点から評価すると、劣化してると言わざるを得ない。 なんでかと言えば、これらのタイトルは最後の最後で狙い

    コールオブデューティ4とQTEの話 - 色々水平思考
  • 1