タグ

statisticに関するMakotsのブックマーク (19)

  • 食べログ3.8問題に終止符を打つ

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
    Makots
    Makots 2019/10/10
    食べログ星3.6付近の店がリーズナブルでうまい実感ある。星4以上の店の客単価が2~3万くらいするのでそんなに金かけてまずいと思いたくないというバイアスもある。
  • 「銀行で投信買った人の末路」 金融庁の集計結果がおもしろい! - Not-So-News

    金融庁は7日、『「顧客位の業務運営に関する原則」を採択し、取組方針・KPIを公表した金融事業者のリストの公表について』を公表した。 金融庁では「顧客位の業務運営に関する原則」を公表し、各金融機関における「顧客位の業務運営」の取組みを「見える化」する観点から、「自主的なKPI(成果指標)」の策定と公表を要請している。 今回の金融庁の情報発信では特に、公表された各金融事業者のKPI を、傾向分析として資料にまとめていて面白い。 【PDF】各金融事業者が公表した「顧客位の業務運営」に関する取組方針・KPIの傾向分析 というわけで以下では、その分析結果を簡単に引用して紹介していく。(画像は拡大できます) 上昇相場の中でも手数料負けする人が4割 投資信託を保有している顧客の運用損益(手数料控除後)を算出した運用損益別顧客比率を見ると、数値を公表した36社合算ベースで、4割の顧客の運用損益率が

    「銀行で投信買った人の末路」 金融庁の集計結果がおもしろい! - Not-So-News
  • 元マイクロソフトCEOが私財11億円を投入、アメリカの事実を明らかにする「USAFacts.org」とは

    元マイクロソフトCEOが私財11億円を投入、アメリカの事実を明らかにする「USAFacts.org」とは 今日の私たちは「ポスト事実」「ポスト真実」の世界 —— 自らの世界観が揺るがされそうになると、事実を無視したり、嘘を信じる —— を生きていると言われる。 マイクロソフトの元CEOでNBAのロサンゼルス・クリッパーズの現オーナーである億万長者スティーブ・バルマー氏は、この状態を良しとしない。 それこそが、バルマー氏が1000万ドル(約11億円)を投じてウェブサイト「USAFacts.org」を立ち上げた理由だ。同氏がBusiness Insider に語った。 USAFacts.orgは、70もの政府機関から公式データを取得し、「アメリカ政府の財政報告書」を作成している。これにより、アメリカ国民が実際に支払っている税額から、国内の犯罪率や離婚率まで、何でも簡単に調べられる。 バルマー氏

    元マイクロソフトCEOが私財11億円を投入、アメリカの事実を明らかにする「USAFacts.org」とは
  • 私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD

    文:Daniel Sim 分析:Lee Shangqian、Daniel Sim、Clarence Ng ここ数ヶ月、シンガポールのMRT環状線では列車が何度も止まるものの、その原因が分からないため、通勤客の大きな混乱や心配の種となっていました。 私も多くの同僚と同じように環状線を使ってワンノースのオフィスに通っています。そのため、11月5日に列車が止まる原因を調査する依頼がチームに来た時は、ためらうことなく業務に携わることを志願しました。 鉄道運営会社SMRTと陸上交通庁(LTA)による事前調査から、いくつかの電車の信号を消失させる信号の干渉があり、それがインシデントを引き起こすことが既に分かっていました。信号が消失すると列車の安全機能である緊急ブレーキが作動するため、不規則に電車が止まる原因となります。 しかし8月に初めて発生した今回のインシデントは、不規則に起こっているように見えるた

    私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD
  • インターネット白書ARCHIVES

    TIMEMAPとは TIMEMAPは、時間軸に着目した新方式の検索エンジンです。情報の新しい探し方や見方を提供します。 アーカイブ内の記事が時系列に整理された年表が作成でき、また連想検索による関連記事の閲覧も可能です。 詳しくはこちら→

    インターネット白書ARCHIVES
  • 日本経済のネタ帳

    全国 日全体の経済を表す統計データをご覧いただけます。人口やGDPなどの各項目において、30年におよぶ長期的な推移をグラフで確認できます。

  • 高層ビルのエレベーターホールには、なぜ階数表示がないのか - 本当は怖いHPC

    以前に高橋幸雄先生の授業で聞いて非常に面白いと思ったこと。 オフィスビルとかホテルとか、エレベーターが何基も設置されているビルの場合、エレベーターホールに階数表示が無いことが多い。エレベーターホールで画像検索してみればわかると思う。 これはなぜだろうか。 その理由は、「客がいても、その階を通過することができるようにするため」だ。 基的に、多数のエレベーターを効率よく動かすのは難しい。工夫された高度なアルゴリズムが使われていることが多い。目標は「客の平均待ち時間を短くする」ことだ。ある階でボタンが押された場合、どのエレベーターがその客を迎えに行くか、という判断が平均待ち時間に大きな影響を与える。難しいアルゴリズムの中で、この点がもっとも重要なところだ。 高層ビルの場合、エレベーターはかなりの速度で走っている。既に客を乗せて走っているエレベーターが他の客を乗せるために停止すると、減速→停止→

    高層ビルのエレベーターホールには、なぜ階数表示がないのか - 本当は怖いHPC
  • 市場規模マップ | visualizing.info

    様々な業界の市場規模をビジュアルなマップとして表示。業界の規模と成長率が一目で分かります。

  • “統計の基礎を無視している”Hadoop使いが考えるビッグデータ

    Hadoopをバッチ処理の高速化に活用しているノーチラス・テクノロジーズは、ビッグデータのブームに真っ向から異論を唱える。「ビッグデータは中身のないバズワード」と断言する代表取締役社長 神林飛志氏に、その真意を聞いた。 Hadoop=ビッグデータは大きな誤解 ノーチラス・テクノロジーズは、基幹系システム向けのミドルウェアを手がける国産ベンチャー。Webサービスのように決して派手ではないが、「そもそもダウンすると、飛行機が飛ばないとか、病院で人が死んでしまうとか、電車が動かないとか、生活に影響が出る分野」(神林氏)という、まさにミッションクリティカルな領域のITで、同社の製品は活用されている。 同社の「Asakusa Framework」は、Hadoopを活用した分散処理により、基幹系バッチの高速化を実現する。神林氏は、「Hadoopというと、WebやSNS系、BIやデータ解析での使い方がメ

    “統計の基礎を無視している”Hadoop使いが考えるビッグデータ
    Makots
    Makots 2012/05/10
    ビッグデータに対するもやもや感を代弁してもらってる感じや
  • 日本の人口推移 1950~2050

    伝わるINFOGRAPHICS〈ツタグラ〉テーマ3「これからの働き方を表現」藻谷浩介氏のセッション資料の人口推移グラフを動的に閲覧できるように再現。

  • 女性を無視したマーケティングがどれだけ痛いかがわかるデータたち – TechDoll.

    どんどんパワーアップしていく女性たち。女性の収入はどんどん上がっているし、家庭でお財布の紐を握っているのも女性。そんな女性を理解するためのデータがTheNextWebにあったので紹介するよ。 米国では、購入判断の85%を女性が決めたり影響したりしてるそう。従来の男性商品に関しても、その50%以上を女性が購入している。その一方で、女性の91%が、マーケターや広告主は自分たちを理解していないと回答してる。 収益力 1. 平均的なアメリカ人女性の収入は2028年には男性を上回ると予測されている 2. 米国の私有財産の51%が女性によってコントロールされている 3. 米国の持ち株制度の50%以上が女性によって保持されている 4. 米国の個人資産の60%以上を女性がコントロールしている 女性の購入パワー 5. 自動車からヘルスケアまで、消費者購買の85%は女性によって行われている 6. ヘルスケア関

    女性を無視したマーケティングがどれだけ痛いかがわかるデータたち – TechDoll.
  • 世界のスマートフォン利用に関する大規模調査サイトを公開します

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    世界のスマートフォン利用に関する大規模調査サイトを公開します
  • 産経が原発事故を小さく見せようと必死にグラフを捏造w:ハムスター速報

    産経が原発事故を小さく見せようと必死にグラフを捏造w Tweet カテゴリ東日大震災 1:依頼スレ(中部地方):2011/05/13(金) 22:47:22.43ID:ee8zlIWD0● 491 名無しさん@涙目です。(広島県)   DATE:2011/05/13(金) 22:07:25.76 ID:qYud9BeX0 産経が原発事故を小さく見せようと必死にグラフを捏造w http://sankei.jp.msn.com/life/expand/110428/trd11042823060023-l1.htm ↑こう見ると大したことないが。 実は・・・・ 元記事: 1960年代と同水準、米ソ中が核実験「健康被害なし」 東京の放射性物質降下量 http://sankei.jp.msn.com/life/news/110428/trd11042823060023-n1.htm 5:名無

  • 質的研究と量的研究について - 社会学者の研究メモ

    とある出版企画でそういうお話を書かなければいけないので、社会学におけるいわゆる「質的研究」と「量的研究」の区別についてメモを書いておく。 結論から言うと、次のように考えるとミスリーディングである。つまり、「まずある<理論>があって、それを<実証>する手段として質的な研究と量的な研究がある」という考えである。こういう考え方は、混乱のもとであるから、避けたほうがよい。多くの社会調査論のテキストでは調査手段の選択として「質的調査」と「量的調査」を選択することがあるかのように書かれているが、少々説明不足である。そうではなく、さしあたり量的研究とその他のタイプの研究が、量的研究とどのような関係にあるのか、と考えたほうがスッキリする。 分野外の研究者からすれば見えにくいが、実際には量的研究と言っても様々である。が、現状からして、「複数のパラメータを含むモデルを構築し、それをデータに当てはめて統計学的推

    質的研究と量的研究について - 社会学者の研究メモ
  • ウォルター〔高木(訳)〕(1999)による〔『衰退するアメリカ 原子力のジレンマに直面して』(157-166p)から〕

    『 日常のリスク リスクの評価は、感覚ではなく、測定可能な科学的データに基づく必要があります。通常はあまり口にすることではありませんが、私達は誰しも最終的にはこの世を去らねばならないことは事実です。「この世界において、死と税以外に確かなものはなにもない。」と語ったベンジャミン・フランクリンの言葉通りです。問題は、私達はいつ、どのようにして死に至るかということでしょう。 将来リスクの予想を試みた、記事、そして報道が数多くあります。私にとって最も納得のできる手法は、バーナード・コーエン教授によって展開された方法です(1,2)。彼は、損失寿命(Loss of Life Expectancy: LLE)という言葉を定義しました。損失寿命:LLEとは、ある人の寿命が、ある特定のリスクに遭遇することによって短縮される平均の寿命のことです(3)。この章では、彼の研究成果の大部分をグラフの形で提示し

  • 男性器のサイズで色分けした世界地図

    bySudhamshu 男性器の平均的な大きさで各国ごとに色分けをした世界地図が登場しました。アジアや南米、ヨーロッパといった地域によってかなり違いが出ており、なかなか興味深いマップとなっています。 一風変わった世界地図の詳細は以下から。World map of The Penis Size Worldwide (country) by Country - TargetMap これがその世界地図です。 色の内訳は、緑が一番サイズが大きく、赤が一番小さいという風になっています。 ポインタを国に合わせることで、その国の平均サイズを表示することも可能です。 赤枠をクリックすると、こんな風に色ごとの比率が見られます。黄緑が一番多いようです。 地域ごとに見ていきましょう。北米はアメリカよりもカナダ、カナダよりもメキシコの方が大きいという結果に。 続いて南米です。北端に位置するベネズエラ、コロンビア、

    男性器のサイズで色分けした世界地図
    Makots
    Makots 2011/03/24
    興味深い。アメリカは意外だった。
  • 「Goo.gl」で短縮されたURLの末尾に「+(プラス)」を付けると解析情報が分かる | ライフハッカー・ジャパン

    デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

    「Goo.gl」で短縮されたURLの末尾に「+(プラス)」を付けると解析情報が分かる | ライフハッカー・ジャパン
  • 若者とシニアは安い職を争うが、一旦働けば若者は優遇される。 - 漂流する身体。

    twitter貧困の再生産の話をたまたま紹介してくれた方がいらっしゃって、その話を読むに色々考える所はあったのだが、こういう話は印象論じゃなくて、一度は貧困の真実を数字で掴まないと思考がフワフワするなと思い、簡単にデータを拾ってみることにした。あれこれ調べるとまずは家計調査が世帯収入の代表的調査という事だが、これがクソみたいなデータしか開示していないし、時系列データが長く取れない。困ったなと思って更に探してみると、国税庁が給与所得者のデータを事細かく開示しているのを見つけた。これがめちゃ便利だ。かつ国税なら統計はすごく正確だろう。いつも2月には税務申告の尋常ならぬ面倒くささに敵意を抱く国税庁だが、こういう時はありがたい。 ○収入別分布図 出典:国税庁・民間給与実態統計調査 これはよく見る図じゃないだろうか。データが利用可能な1995年(僕はまだ20歳で労働に従事していない)と2008年の

    若者とシニアは安い職を争うが、一旦働けば若者は優遇される。 - 漂流する身体。
  • 1