STAIR Lab, Chiba Institute of Technology•4.7K views
アクセスログっぽいものに対する単純な分析の練習用のデータがほしくて、擬似アクセスログを生成するコードを書いてみました。 https://gist.github.com/abicky/dfdeaec9efded25b733a#file-access_logs-r 擬似アクセスログの仮定 ユーザの状態(新規ユーザ、アクティブユーザ etc.)によってセッションの間隔(来訪間隔)が異なる ページによってページ遷移の間隔が異なる 同じユーザはだいたい同じような時間帯にアクセスする っで、これらの仮定を表現するのに Markov renewal process が良さそうだったので採用したつもりです。「こんなの Markov renewal process じゃない!」と言われそうなので、あくまで「つもり」です。 次のコード(余計な処理は省略)がセッションごとのアクセスを表現しているところです。 p
リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら 汎用人型雑用AIの stakaya です。 たまたま数年前に社内のBLOGに書いたABテストのロジックのまとめ&比較記事を発掘したので、 このまま眠らせているのはもったいないぞと、 圧倒的もったいない精神を発揮し、シェアさせていただきます。 あの頃は私も若かった。 社内では”堅物・真面目・一途”で有名なものでして、下記文章がお硬いのはご勘弁ください。 はじめに 本記事は、施策の評価手法としてしばしば用いられるA/Bテスト(A/B testing)について、できる限り背後にある仮定を明記した上で、まとめたものである。 A/Bテストとは、主にインターネットマーケティングにおける施策の良否を判断するために、2つの施策(通常、A・Bと記載)を比較す
主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻
今年、機械学習の本を少なくとも一度は手にした人は多いのではないでしょうか。 数ページめくっていると、数式のオンパレードで、「うっ」てなって、静かに本を閉じてから数ヶ月。 すでに本棚の肥やしになっていたりしませんか? それは私です。これはイカンと思って 機械学習の本を理解するための高校数学のおさらいをしようよ!で、作りました。 誰が書くの? すでに、おさらいが終わった人、 これを機会におさらいを始めてみようと思った人、 おさらいする必要もなく理解している人、 一緒にこのアドベントカレンダーを作りませんか? 何を書いたらいいの? 得意な分野の説明をわかりやすく説明、三角関数とか行列とか統計とか・・・ 自分の勉強法の紹介 オススメの書籍やオススメ記事やオススメ勉強法の紹介 などなど 来年はもっと理解出来た状態で、機械学習と向き合う年にしましょう!
出典:アムステルダム国立美術館「Rijksstudio」 プレゼン資料に説得力を持たせたい、◯◯の情報が欲しい、デザインのアイデアが欲しい、むしろ今自分が何を調べたいか調べたい。など、調べ物をする動機はさまざまですが、なかなか目当ての情報が出てこなかったり、そもそも取得した情報が嘘だった。ということも良くあります。じゃあ本当のことは一体……と、また調べ物を再開し、底なし沼にハマったように抜け出せなくなり、気付いたら3時間後にはwikipediaでまったく関係ない「宇宙」について調べていた。という経験は、誰にでも少なからずあるのではないでしょうか。 というわけで今回は、調べ物に使えるウェブサイトを取り上げてご紹介していきます。ベタなところから、少し変化球まで取り揃えてみました。何かのお役に立てば幸いです。 高精度計算サイト「keisan」 カシオ計算機株式会社が提供している、生活や実務に役立
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く