サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
掃除・片付け
stockedge.hatenablog.com
6月12日(日)に競馬×データサイエンスをテーマとした勉強会「ウマナリティクス」で発表してきました。 umanalytics.connpass.com 勉強会の発表者としてAlphaKeibaのぬくいさんのようなちゃんと結果を出している方が参加しておられる中、単にブログの記事を何本か書いただけの「出す出す詐欺」をしている私なんかが参加していいのか…?、と内心ドキドキしながら参加したんですが、皆さん温かく迎えてくださり、楽しい時間を過ごすことができました。ありがとうございました。 発表に使った資料はSpeaker Deckにアップロードしてあります。 競馬予測の考え方 // Speaker Deck なおパフォーマンスの記述に単位の間違いがあったのと誤解を受けそうな記述があったので、内容を発表時のものから一部修正してあります。発表時にはドローダウンの欄にRのPerformanceAnalyt
たまには株や競馬以外の話題でも。 私は去年の6月から筋トレを始めた。筋トレには以下のようなメリットがあるからだ。 体力がつく 代謝が上がり太りにくくなる 引き締まってかっこいい体になる 美肌効果がある 癌の死亡率を33%下げる テストステロンの量が増えるのでモテる 鬱病が改善される ポジティブ心理学によれば運動をしている人の方がしていない人より幸福感が高いので、筋トレに限らず何かしら運動はした方がいい これだけのリターンをほぼノーリスクで得られる筋トレは恐らく最も投資効率が高い投資の一つ*1ではないかと思う。 とはいえこれらのメリットは、長期的にはこういうメリットが有るという話であって、短期的には変化が見えにくく、やりがいがない。 だから、できれば日々の成長を数値的に把握したい。そうすれば、成長している実感を感じられてモチベーションアップに繋がるかもしれない。 私は筋トレをやるたびに、何月
どうやら、私のブログを見て競馬の予測を始めたという人がちらほらいるようだ。そういう人たちの助けになるかもしれないので、私が読んだ競馬予測の論文(これまでの記事で紹介しなかったもの)をいくつか紹介する。 Comparing the effectiveness of one-and two-step conditional logit models for predicting outcomes in a speculative market 競馬予測では条件付きロジットモデルを使った予測が有効なのだそうだ。条件付きロジットモデルとは、多項ロジットモデルと似ているがちょっと違う*1モデル。この解説がわかりやすいかも。 この論文では、2ステップのモデル作成方法を提案している。まずファンダメンタル変数だけを素性として使って条件付きロジットモデルのパラメータを推定し、これをステップ1とする。次に、ス
stockedge.jpの株価予測に面白い性質があるので紹介する。 以下のグラフは、株価予測を100回行うごとに勝率を計算してその時系列をプロットしたものである。使用したのは2011年5月13日から2015年8月25日までのデータ(35860サンプル)。 グラフをよく見ると、勝率が低くなるとしばらくの間低い期間が続き、高くなるとしばらくの間高い期間が続く、という傾向があるように見える。要は、勝率の時系列に自己相関があるように見える。 実際、どの程度自己相関があるのかをRのacf関数で計算してみた。 > #ratesは勝率の時系列 > acf(rates, plot=F) Autocorrelations of series ‘rates’, by lag 0 1 2 3 4 5 6 7 8 9 10 1.000 0.506 0.415 0.449 0.321 0.241 0.271 0.2
記事のタイトル通り、競馬で回収率100%を超える方法を見つけたので、その報告をする。 ちなみに、この記事では核心部分はぼかして書いてあるため、読み進めたとしても「競馬で回収率100%を超える方法」が具体的に何なのかを知ることはできない。(私は本当に有効な手法を何もメリットが無いのに公開するほどお人好しではないので) 本当に有効な手法を見つけたいのであれば、あなた自身がデータと向き合う以外の道は無い。 ただし、大まかな仕組み(あと多少のヒントも)だけは書いておくので、もしあなたが独力でデータ解析を行おうという気概のある人物なのであれば、この記事はあなたの助けとなるだろう。 ちなみに、これは前回の記事の続きなので、読んでない方はこちらからどうぞ。 stockedge.hatenablog.com オッズの歪みを探す さて、前回からの続きである。 前回の記事のブコメで「回収率を上げたいならオッズ
を紹介する*1。手数料を考えると恐らく儲からない(少なくともこの手法単体では厳しい)ので、過剰な期待はしないように。 ※この記事を読む人は下にあるFacebookのコメント欄まで読んでください。 やりかた 日経平均株価の四本値を説明変数、翌日の終値を目的変数として、random forestなどで予測する。 ただし初値で(初値以外の)四本値および翌日の終値を割っておく。割った後、初値は説明変数から除外する。 また割られた翌日の終値を1以上か否かで分割し二値のカテゴリ変数とする。 ちなみに、この手法はこの論文に載っていた手法をちょっと変えたものなので興味があればこちらもどうぞ。 Rでやってみる RのrandomForestを使い、実際に試してみる。 OOBエラーを見ると、OOBでの正解率は70.83%。 testデータでの正解率は66.8%となっている。 なおクラスバランスはおおむね50/5
基本的に競馬なんてやるべきではないと私は思っている。胴元の取り分が多いからだ。宝くじに比べればまだましだが、それでも賭け金の20~30%は胴元に取られることになる。*1 しかし今回は、ちょっと思い立って競馬の予測をやってみることにした。 理由は馬券の安さだ。私は現在、資金量が少ない人間でも不利にならない投資先を探しているのだが、馬券の一枚100円という安さは魅力的に映る。株の場合にはどんな安い株であれ最低購入額は数万円以上*2なので、ある程度まとまった資金が必要になる。 また、競馬には技術介入の余地(努力次第で勝利できる可能性)がある。 例えばこんな例がある。 160億円ボロ儲け!英投資会社が日本の競馬で荒稼ぎした驚きの手法 - NAVER まとめ 彼らは統計解析によって競馬で勝っており、その所得を隠していたらしい。こういうニュースが出るということは、解析者の腕次第では競馬で勝てる可能性が
6月12日(日)に競馬×データサイエンスをテーマとした勉強会「ウマナリティクス」で発表してきました。 umanalytics.connpass.com 続きを読む ↓作ったサイト 家賃相場 ※JavaScriptを有効にしてご利用ください。 続きを読む 株式投資の戦略でスタイルローテーション戦略というものがある。その名の通り、投資スタイル*1を動的に変化させることで市場平均を超えるリターンを狙う戦略のことである。 以前ある目的で書いた文章がスタイルローテーション戦略について結構まとまったサーベイになっているのだけれど、残念ながらお蔵入り状態になっている。このままだと勿体無いのでここで公開してしまうことにした。原文から一部切り取ったりしているので、ちょっと歯切れの悪い文章になっているけど、どうかご容赦を。 *1:「投資スタイル」という語の意味がわからない人は、本文中に定義が書いてあるのでそっ
ポートフォリオ最適化と聞くとMarkowitzの平均分散モデルを思い浮かべる人が多いかもしれない。しかし最近はオンラインポートフォリオ選択(Online Portfolio Selection、以下OLPS)という手法が研究されており、これが目覚ましい成果を挙げている。その成果の割にはOLPSの存在があまり知られていない気がするので、ここで紹介したい。 突破口を開いたAnticor 事の発端は2004年に公開されたこの論文。 [1107.0036] Can We Learn to Beat the Best Stock 著者らはAnticorというアルゴリズムを提案している。このアルゴリズムを使うと、市場平均リターンを超えるリターンを得られる上に、そのリターンは最も値上がりした個別株のリターンすらも超えるというのだ。 Anticorでは、ある一つの株価の時系列には負の自己相関があり、複数の
クオンツ達の間では、株価の予測は難しいが株価のボラティリティ(値動きの激しさ)を予測することは比較的簡単だとよく言われている。 この記事では実際にRのrugarchパッケージを使って株価のボラティリティ予測を試してみる。 CRAN - Package rugarch ボラティリティ予測に使うのはexponential GARCH(以下eGARCH)というモデル。以下13.2 Extensions of the GARCH Modelより引用(意訳してます)。 を平均0分散1の確率変数のiid系列として、一般的なexponential GARCHモデルは以下の数式で表される。*1 とはパラメータ。 なぜこのeGARCHを使うのかというと、通常のGARCHでは株価のボラティリティをモデル化するのに問題があるため。EGARCHモデルについてより引用する。 株式市場では、株価が上がった日の翌日より
推奨銘柄無料公開ブログにて公開している予測情報の、サイト公開以後から2015年5月1日現在に至る期間の勝敗を集計する。 なお、サイト公開以後の予測だけを集計している(完全なフォワードテストとなっている)ので、この集計結果に後知恵バイアスが入る余地はない。 勝率 勝ち回数 負け回数 信頼度による条件 54.19% 2733 2310 なし 60.81% 748 482 60以上 62.21% 135 82 70以上 63.63% 21 12 80以上 もし私の集計結果が信用ならない場合は、当サイトの予測情報をCSVファイルに変換するScalaスクリプトを公開しますのスクリプトなどを用いて予測情報をスクレイピングし、自分で集計してほしい。 自分で集計を行うという方のため、以下に勝率を計算する際の細々したことを書いておく。 予測日の定義 予測を公開した日のこと。ただし、寄り付きが行われる翌日の午
このページを最初にブックマークしてみませんか?
『stockedge.jpの技術メモ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く