アクセスログっぽいものに対する単純な分析の練習用のデータがほしくて、擬似アクセスログを生成するコードを書いてみました。 https://gist.github.com/abicky/dfdeaec9efded25b733a#file-access_logs-r 擬似アクセスログの仮定 ユーザの状態(新規ユーザ、アクティブユーザ etc.)によってセッションの間隔(来訪間隔)が異なる ページによってページ遷移の間隔が異なる 同じユーザはだいたい同じような時間帯にアクセスする っで、これらの仮定を表現するのに Markov renewal process が良さそうだったので採用したつもりです。「こんなの Markov renewal process じゃない!」と言われそうなので、あくまで「つもり」です。 次のコード(余計な処理は省略)がセッションごとのアクセスを表現しているところです。 p