タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

統計とネタに関するJULYのブックマーク (7)

  • SUUMOも木から落ちる?データの入力ミスらしいものがいくらかあったので紹介。 - Qiita

    こちらの記事をご覧いただきありがとうございます。 以前SUUMOの物件データをスクレイピングした記事を投稿しました。今回はスクレイピングしたデータから見つかった、入力ミスと思われる変なデータをご紹介します。 スクレイピングした記事 ↓でスクレイピングしたデータから見つかった変なデータを紹介します。 前置き:SUUMOに批判的な意見を主張したいわけではありません。 やっていること自体は人の揚げ足取りと思われて致し方ないことですが、決して批判的な意見を言いたいわけではありません。 機械学習をするうえで、イレギュラーなデータを見つけることは分析精度を上げることにつながります。 てかむしろSUUMO凄くない? と思います。どう見ても入力ミスだよな…?と思う場面はそんなにありませんでした。 人は誰しも細かいミスをしてしまうものだと思いますし、自分も毎日ミスだらけです。スペルミスのエラーとか1分に1回

    SUUMOも木から落ちる?データの入力ミスらしいものがいくらかあったので紹介。 - Qiita
    JULY
    JULY 2022/10/31
    単純に面白かった。世田谷で最寄りを渋谷にした物件は「渋谷へ 20 分」をアピールしたかったのかなぁ。
  • 全国1741市町村の「日本一」をコタツに入りながら調べた【究極のコタツ記事】 | SPOT

    \【お知らせ】SPOT、引きこもりメディアはじめました/ この記事はコタツ記事です。 皆さんはコタツ記事というものをご存じでしょうか。 簡単に説明しますと、「取材などをせずにネット上にある情報を収集して、再構成して書く記事」のことを指します。コタツに入ったまま完結するからそう呼ばれているわけです。 コタツから出ることなく適当に作っている内容の薄い記事、みたいな文脈で使われることの多い「コタツ記事」ですが、ここSPOTにはその「コタツ記事」が存在しません。 なぜならSPOTのコンセプトは「実際に行ってみて体験したこと観たことをもとに熱量のある記事を書く」です。このコンセプトに共感し、我々は時には死ぬほどの乗り継ぎを経て取材先に行き、時には100キロ歩き、時にはシベリアまで行かされるわけです。そうなるともちろんのこと経費がかさみ、赤字も膨らんでいくわけです。 それでも、ただコタツに入りながら再

    全国1741市町村の「日本一」をコタツに入りながら調べた【究極のコタツ記事】 | SPOT
    JULY
    JULY 2020/05/01
    我がふるさとは安定の駅弁ネタだった。
  • iOSユーザーは「家賃が高い部屋」を探す。住まい探しアプリ「LIFULL HOMES」データが語った部屋探しの傾向と、検索よりAR経由の資料請求率が高い話

    iOSユーザーは「家賃が高い部屋」を探す。住まい探しアプリ「LIFULL HOMES」データが語った部屋探しの傾向と、検索よりAR経由の資料請求率が高い話 累計500万ダウンロードの、住まい探しアプリ「LIFULL HOMES」さんにお話を伺いました。 ※株式会社LIFULL 、菊地 慧さん(左)、横山 朋子さん(右) LIFULL HOMES(ライフルホームズ)について教えてください。 横山: LIFULL HOMESは、住まい探しの総合アプリです。アプリは累計500万ダウンロードを突破しています。 運営チームとしては、エンジニアが10名、デザイナーが2〜3名、企画が4名という感じです。現在アプリはすべて内製しています。 アプリのユーザーはどこから増えているんですか? 横山: Google Playでいうと、意外なことに「関連アプリ」から入ってくる人が多くて、キーワード検索の2倍以上は「

    iOSユーザーは「家賃が高い部屋」を探す。住まい探しアプリ「LIFULL HOMES」データが語った部屋探しの傾向と、検索よりAR経由の資料請求率が高い話
    JULY
    JULY 2018/11/20
    多分、Web サイトでも、Safari でアクセスしている人が、他のブラウザを使う人より、高い家賃を探す傾向が強いだろうなぁ。単に「高価なものを持っている人ほど」というだけの話。
  • 「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE

    ほんのわずかな初期の要因の変化が最終的に思いがけないほど差のある結果を招く現象を「バタフライ効果」と呼びますが、そんな現象は身近なところでも起こっているのかもしれないと思わせるような、一見すると関係のない2つのデータに相関性を見いだすプロジェクトが「Spurious Correlations」です。 Spurious Correlations http://www.tylervigen.com/ 1999年~2009年までの「アメリカの科学・宇宙・テクノロジーに関する支出」と「首つり自殺数」の上昇傾向が一致。 「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」が、なぜか似たような傾向で上下しています。つまり、ニコラス・ケイジが映画に出演しなければプールでの事故が激減するのかもしれません。 「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」がほぼ一致。 「ア

    「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE
    JULY
    JULY 2014/05/13
    統計学最高! みたいな話があったけど、ネタと分かるレベルならまだしも、騙されそうな感じでこういった誤った使い方をされる事が多いことに、きちんと留意する必要があるのが現実。
  • 東京の雪

    今度は15日のうち10日が土日だ。 binom.test(10, 15, 2/7) p = 0.002446,うーん。やっぱり有意だ。 ちなみに,独立ではない(雪の日の次も雪の日が多いという自己相関がある)ので,これらの検定はウソです。 追記:2014年2月9日までのデータの時点で,中澤先生から次のコメントをいただいた:「じゃあ土日は平日の何倍大雪になりやすいのかと考えて、 fisher.test(matrix(c(9, 4, 1258*2-9, 1258*5-4),2)) したら、オッズ比は5.64 (95%CI: 1.57-25.09)でした。 坂さんからは「大雪が28日あったうち16日が土日なので実際多いのですが、土日気温が低めなのか?とかの関連データも気になります。」(2014年2月9日までのデータの時点)というご意見をいただいた。tokyo_temp.csv に整形したものを置

    JULY
    JULY 2014/02/11
    奥村先生がネタにマジレスw。
  • 都道府県ベスト&ワースト

    都道府県別統計とランキングで見る県民性ver 1.0 著者 プロフィール リクエスト | このサイトについて | 引用転載について | プライバシーポリシー | お問い合わせ Creative Commons CC BY 2.1 JP odomon.net

  • 海外ネタつれずれ:都道府県のワーストを描いた地図を作ってみた

    Powered By 画RSS February 14, 2011 都道府県のワーストを描いた地図を作ってみた 「The United States of Shame (CHART)」(恥のアメリカ合衆国)という地図が話題になっていました。 アメリカには50の州が存在しますが、この地図ではそれぞれの州に当てはまる「ワースト」なデータを名前にしてしまいました。地元の人たちにとっては迷惑な話ですが、面白いし、興味深いですね。ミシガン州は失業率が高いとかわかりやすいのもありますが、ニューヨークペンシルヴェニア州(指摘してくださってありがとうございます)では放火が多いとは知りませんでした。アメリカには州がありますが、日には都道府県があります。しかも47ですから、アメリカと同じように「ワースト」を当てはめることができるのではないでしょうか。 ということでありきたりに作ってみました。 この地図を作製

  • 1