並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 20 件 / 20件

新着順 人気順

セイバーメトリクスの検索結果1 - 20 件 / 20件

  • 野球ではじめる機械学習 - 特徴量エンジニアリングとPython, Rを用いた成績予測 - Lean Baseball

    本日のPyCon JP 2020にてお話しました以下の発表に関する補足・解説ブログとなります. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 - PythonとRを行ったり来たり このエントリーではスライドのスクショとともに, 参考資料 細かすぎて本編で話さなかったハナシ もし真似してやるならこれぐらいは読んでおいたほうがいいよ 的な話を中心に, 過去記事のreference等を掲載しています. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 これを読むと⚾️で特徴量エンジニアリングと機械学習がいい感じにできるかと思います👍 スタメン スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 スタメン CM JX通信社 Pythonもくもく自習室 #jisyupy 特徴量エンジニアリングについて 野球データの特徴量 Python, R, SQ

      野球ではじめる機械学習 - 特徴量エンジニアリングとPython, Rを用いた成績予測 - Lean Baseball
    • 30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう - Lean Baseball

      このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例えばこれとか(スポーツ以外も含む). 野球に限らず, 様々な技術革新により, 扱うデータの種類・量が爆発的に増加(例:Baseball Savant). データサイエンス・機械学習といったキャリアを歩む・志望して学習をする方が増え, 「そうだスポーツでやってみよう」という流れも盛ん. と(大変好意的な意味で*1)目まぐるしく状況が変わってきているのでここで改めて, セイバーメトリクス(含むスポーツの統計学)とは何か? かんたんなセイバーメトリクスとむずかしいセイバーメトリクス 何をどう学べばよいのか?のヒントなど を最新

        30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう - Lean Baseball
      • 野球AIが選ぶTOKYO 2020侍JAPAN24名 - 機械学習で忖度無く選んでみた. - Lean Baseball

        ※【注意】あくまでもお遊びです, 冗談半分で読んでください! 「野生の野球データサイエンティスト」です. 本日ついにTOKYO2020侍ジャパン, 24名の内定選手が発表となりました. www.japan-baseball.jp 24名の選出って難しいですよね...中の方は色々ご苦労とかあったのではないでしょうか. 一番いい色のメダル, 期待しています! さて, 私は野球好きでもありますが, プロの(野球)データサイエンティストであり, 機械学習エンジニアでもあります. ワイ「プロ野球選手2021年の成績を予測してそこから24名の侍を選んだらいい感じになるのでは🤔 と 昨年末に思いついたので, 野球AIが選出する, TOKYO 2020侍ジャパン24名 を実際にやって選んでみました. 実際の侍ジャパンと比較して楽しんでいただけると幸いです. 要約すると 打てる人は正義 奪三振能力も正義

          野球AIが選ぶTOKYO 2020侍JAPAN24名 - 機械学習で忖度無く選んでみた. - Lean Baseball
        • オオタニサンのキャラ変とその未来 - 2022年, 投手としての成績からの気付き - Lean Baseball

          ドラフト会議前に一位指名を公言するのって何かのトレンドですか?って思ってる人です.*1 今年いや, 去年からずっと野球関連のリアルなトレンドは「何かしらのオオタニサン」で間違いないと思います. 打者として規定打席到達(わかる) ついでに2年連続30本塁打以上(まあわかる)*2 投手として15勝防御率2.33, キャリア初の規定投球回*3到達(ちょwww嘘やろwww) 一人の野球選手が(ガチで)二人分の成績(それもエースピッチャーと主軸打者を兼ねる)という驚きは改めて語るまでも無い話ではありますが, 投球回伸びてるし, (雰囲気的に)見ていて安心できる投球をしてるし何か変えてきたのでは!? と思い, 改めて「投手・大谷翔平」のデータを見てみようと思いました&実際に試したのでどうぞご覧ください. なお, オオタニサンといえば二刀流, 打者の成績も気になるところですがこちらはシーズン中に可視化し

            オオタニサンのキャラ変とその未来 - 2022年, 投手としての成績からの気付き - Lean Baseball
          • 欧州サッカーはいかにしてセイバーメトリクスと接続されたか

            サッカーは選手やボールが複雑に絡み合う動的なスポーツである。それゆえに野球のようなデータ分析、選手評価は難しいと考える人が多いのではないだろうか。実際、野球界、特にMLBでは選手の総合評価指標WAR(Wins Above Replacement)が市民権を得ているが、サッカーにこうしたスタッツは見られない。リオネル・メッシについて、ゴール数が話題になることはあっても、そのさらに先の目標である「チームの勝利をどれだけ増やしたか」が議論の的になることはない。選手評価においてサッカーはまだまだ未熟に映る。しかし実はサッカー界にも、野球に似た評価を用いて強化を行い、大きな成功を収めた例がある。イングランド・プレミアリーグに所属するリヴァプールFCだ。今回は野球とサッカーにおける評価の違いを比較しながら、リヴァプールFCがいかにして総合評価指標を作り上げたか、また活用しているかを紹介したい。 目次

              欧州サッカーはいかにしてセイバーメトリクスと接続されたか
            • 生涯イチ・エンジニア #とは - 正夢にしたあとの続きのはなし #devsumi 2020 / I want to be part of the Senior Engineer

              生涯イチ・エンジニアとして好きな技術でジャンプアップし続けよう - 夢のつづきはビッグデータで https://event.shoeisha.jp/devsumi/20200213/session/2420/ #devsumi #devsumiE #Career #Python #DataScience #Baseball #SABRmetrics #JXPress

                生涯イチ・エンジニア #とは - 正夢にしたあとの続きのはなし #devsumi 2020 / I want to be part of the Senior Engineer
              • 野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない - Lean Baseball

                読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽しみ方はありますよね.*2 そんな流れの野球界隈, つい先日(一部の野球ファンからは以前より存在が知られていた)セイバーメトリクスの書籍が発売となりました. セイバーメトリクスと野球が好きな人待望の一冊 Rによるセイバーメトリクス入門 作者:Max Marchi,Jim Albert,Benjamin S. Baumer発売日: 2020/11/13メディア: 単行本(ソフトカバー) 個人的には「待ち望んでいた本の訳書がやっとでた!」という感じで嬉しいです&ご縁があってレビューに参加させていただきました. このエントリーでは, Rによるセイバ

                  野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない - Lean Baseball
                • 機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた - Lean Baseball

                  やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良点や穴があるものの, 統計的にもアルゴリズム的にも十分に納得行くモノができたので一旦公開します. なお, どういったアプローチでやったか?特徴量はどうやって選んだか??については8/28, 29開催のPyCon JP 2020で発表します.*1 免責事項 言うてもおもちゃですしちょっとしたお遊びです. そのつもりでご覧ください. 一部のサンプルコードを除きコードおよび特徴量は公開しません. データはMLBのPublicな公開データセットであるLahman’s Baseball Databaseおよび, RETROSHEETを使っ

                    機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた - Lean Baseball
                  • 阪神の「アレ」の秘密は投打ともに「お散歩」だった - セイバーメトリクスで「そら、そうよ」と納得した理由 - Lean Baseball

                    阪神タイガースさん「アレ」おめでとうございます🎉(今更感) 野球ファンの歴史を阪神ファン(厳密に言えば新庄剛志のファン)でスタートした私(参考文献), 今は日ハムのファンなれど阪神18年ぶりの「アレ」は心からうれしく思います. 現在は野球とは無縁の仕事*1をしている私とはいえ, 阪神って結局何が良くって「アレ」したんだ? あんだけ独走しての「アレ」だから何かしらの秘密・特徴がありそう. そうだ, データを見てみよう! ...と(本業もプライベートもまあまあ詰まっているにもかかわらず)気になったのでデータを見てみることにしました. TL;DR 今回の評価方法 岡田タイガース強さのひみつ チーム 打者成績 投手成績 結び - 阪神黄金期は来るのか? Appendix: 参考文献&本記事の全グラフデータ チーム成績 打者成績 投手成績 参考文献 TL;DR 阪神タイガースはチームの投打共に「お

                      阪神の「アレ」の秘密は投打ともに「お散歩」だった - セイバーメトリクスで「そら、そうよ」と納得した理由 - Lean Baseball
                    • 野球好きとデータ好きのためのStatcastデータ入門 - スポーツデータ解析の第一歩 - Lean Baseball

                      【2022/8/13更新】打球位置のプロット例を追加しました(解説ブログのリンクを含む) プライベートの時間はウイニングポスト9*1で自家生産の馬を育てるか, 野球データと戦っている人です. 野球のデータは見れば見るほど面白いです, どれぐらい面白いかと言うと「10年見ても飽きない*2」それぐらい面白いです(個人の感想です). それはさておき, 私はメジャーリーグのデータを使って調べ物をしたりなにかのテーマに取り組む時, 以下のデータセットを用いています.*3 Lahman’s Baseball Database. 年度別のチーム・選手成績など, ある程度まとまった単位のデータ. GitHubから取得可能(https://github.com/chadwickbureau/baseballdatabank). Retrosheet. 試合・打席ごとの成績データ. GitHubから取得可能(

                        野球好きとデータ好きのためのStatcastデータ入門 - スポーツデータ解析の第一歩 - Lean Baseball
                      • 野球の防御率はたまに嘘をつくのでDIPSと合わせて見てみよう - データサイエンスから学ぶセイバーメトリクス - Lean Baseball

                        前回は打者成績の話をしたので(予告通り)投手の成績の話をします. 投手をシーズン成績(または通算成績)で見る時, 代表的な指標として以下の3つがあります(いわゆる, 「投手三冠」の対象). 勝利数(その名の通り, 投げて勝利した回数) 奪三振(打者から奪った三振の数) 防御率(9イニングあたりの自責点率. このエントリーの主人公). この成績のうち, 勝利数は投手個人の頑張り「だけ」では稼げない数字というのは野球をちょっとでも見たことある人なら想像つくと思います.*1 奪三振は「三振」が持つ意味, 見た目の派手さからすると投手の実力が生きるモノと言えます(そしてこれは事実だという話をこれからします). 問題は, 「相手に許した得点(自責点)を9イニング(ほぼ一試合分)に平均した」実に便利な指標である「防御率」で, 防御率は投手を必要以上に良く見せる(もしくは悪く見せる)ことがあり, 「たま

                          野球の防御率はたまに嘘をつくのでDIPSと合わせて見てみよう - データサイエンスから学ぶセイバーメトリクス - Lean Baseball
                        • PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball

                          プログラミングとプロダクト作りは楽しいよ, っていう「個人開発ネタ」の話です. スポーツ観戦, 具体的には野球のデータ分析DX(Digital transformation)*1を実現しました. 記事の前半はプロダクト企画とアーキテクチャ, 後半はDash(Python)を使ったマルチページ・データ・アプリケーション開発の話となります. TL;DR SpreadsheetとPythonのアプリケーションでいつでもメジャーリーガー(全選手)のパフォーマンスを好きな条件で可視化できるようにしたら野球が面白くなりました. https://example.com/batter/ohtani-shohei/2024-03-20/2024-04-28?cache=false みたいなURLを開くと, オオタニサンのパフォーマンス(現地時間2024/4/28までの数字) 以下の成績をいい感じにグラフ・可

                            PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball
                          • 野球のための特徴量エンジニアリング - データサイエンスから学ぶセイバーメトリクス - Lean Baseball

                            新型コロナウイルスに我々はかならず勝つ!というお気持ちでずっと #StayHome している私達ですが, 野球が待ち遠しい事は変わりありません.*1 お家にいながら野球どうやってやろう :thinkingface: ...と考えた結果, 「野球データで遊ぶならずっと #StayHome なまま野球ができるじゃん⚾」 ということで, 野球の統計学である「セイバーメトリクス」を「データサイエンス」の文脈で解釈しつつ データサイエンスで大事な「特徴量」の事を学びながら 野球をデータという切り口で楽しもう っていうコンテンツを何回かに分けて紹介したいと思います(つまり連載です). 連載初回となるこのエントリーでは 特徴量エンジニアリング セイバーメトリクス 野球の成績(打撃成績・投球成績) にフォーカスした話をします. スターティングメンバー スターティングメンバー この連載の対象読者 TL;DR

                              野球のための特徴量エンジニアリング - データサイエンスから学ぶセイバーメトリクス - Lean Baseball
                            • チームでもっとも貢献している(足を引っ張っている)打者は誰なのか?12球団の打者パフォーマンスを可視化してみた - Lean Baseball

                              2021年プロ野球が開幕して一ヶ月半くらい. 佐々木朗希がついに一軍デビューしたり, 伝統の一戦「巨人阪神戦」が昨日で通算2,000試合になったり, 日々話題に欠ける事無く楽しいですね. 日々流れてくるニュースも気になるとは思いますが, 贔屓チームを推してると「なぜウチのチームは強い(弱い)んじゃ?」って気になりますよね? 私の場合は地元である北海道日本ハムファイターズが最下位なのはなぜなのかすごく気になります. 野球は相手チームより得点を稼ぐことにより勝てるスポーツです. もちろん投球や守備も同じぐらい大事なのですが, 点を取らないことには勝つことはできません. というわけで, 全12球団で1打席以上立っている打者の「貢献度」を可視化し, 「誰が打線のキーマンか?」「足を引っ張ってる選手は誰なのか?」を明確にする という試みを「公式記録として手に入るデータを元に」分析・可視化してみました

                                チームでもっとも貢献している(足を引っ張っている)打者は誰なのか?12球団の打者パフォーマンスを可視化してみた - Lean Baseball
                              • 日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました. - Lean Baseball

                                誰のことかは本文に答えが! かなり久しぶりに日本プロ野球のネタやってみました⚾️ 今年の野球も残すところは日本シリーズと(一番大好きな)ストーブリーグになりました. その日本シリーズですが, news.yahoo.co.jp 訓練された日ハム(パ・リーグ)ファンの私は別に驚かない*1(震え)のですが巷では, ・「33-4の再来なのでは*2」 ・「パ・リーグのパはパーフェクト・リーグの略*3なのでは」 という声が聞こえているみたいです, Twitterトレンドに33-4は流石に草生えた...w 流石に4連勝で終わっちゃうと野球全体的に面白くない展開になっちゃうので巨人の反撃に期待するとして(意訳:日本シリーズの話題はこれでおしまい). 私個人として興味ある野球の話No.1は, 3年以上の長期契約を結んでいるチームの主砲は契約に見合った活躍をするのか? だったりします. 坂本勇人選手(巨人),

                                  日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました. - Lean Baseball
                                • 打者の成績を数字で理解する三つの視点 - データサイエンスから学ぶセイバーメトリクス - Lean Baseball

                                  私達が大好きなプロ野球, どうやら開幕の目処が立ちそうです⚾ www.nikkansports.com とはいえ(この記事を書いてる5/10時点では)正式発表ではないかつ, 仮に6/19開幕としてもあと一ヶ月と少し時間がありますね...ということでまだまだ #StayHome をやってく必要がありそうです.*1 このエントリーでは前回同様, 「野球データで遊ぶならずっと #StayHome なまま野球ができるじゃん⚾」 というお気持ちの元, 野球の統計学である「セイバーメトリクス」を「データサイエンス」の文脈で解釈しつつ データサイエンスで大事な「特徴量」の事を学びながら 野球をデータという切り口で楽しもう 以上をテーマとして野球のデータ, 特に「セイバーメトリクス」「データサイエンス」の視点で面白さを紹介できたらと思います. なお, 初回であった前回は「野球のための特徴量エンジニアリング

                                    打者の成績を数字で理解する三つの視点 - データサイエンスから学ぶセイバーメトリクス - Lean Baseball
                                  • 「アイツと似ている」野球選手をPythonでいい感じにスコア化してみた - 2020年注目の選手の特徴とは - Lean Baseball

                                    2019年のプロ野球が終わり, セイバーメトリクスと分析・解析には良いシーズンになりました. 改めましてこんにちは. @shinyorkeと申します. このエントリーでは, セイバーメトリクスで「打者の類似性」を算出する方法論と実装例(なおPython) メジャーリーグの2018年データを用いた類似性の例 2020年からプレーする助っ人とか, これからメジャー挑戦するあの選手は!? を打者の成績にフォーカスして紹介します.*1 なお, このエントリーはJX通信社 Advent Calendar 2019および, Pythonその4 Advent Calendar 2019の18日目となります.*2 免責事項 念の為お断りしておくとこの分析・解析結果は@shinyorke個人の見解であり, 現在および過去に在籍した組織・団体の見解・思想と関係ないことを予めお断りしておきます*3. なお, 計

                                      「アイツと似ている」野球選手をPythonでいい感じにスコア化してみた - 2020年注目の選手の特徴とは - Lean Baseball
                                    • セイバーメトリクスから学ぶサービス開発 - ロコガイド テックブログ

                                      はじめに こんにちは @hatuyuki4です。普段はiOSアプリを開発しているモバイルアプリエンジニアです。プロ野球が好きで、特に楽天イーグルスを応援しています(宮城出身)。最近は野球好きが講じて、セイバーメトリクスの本をいくつか読みました。セイバーメトリクスは、野球を統計学的に分析する非常におもしろい試みなのです。しかしこのアプローチは野球だけではなく、様々な問題解決にも応用できます。 というわけで今回は、セイバーメトリクスの考え方の紹介と、それのサービス開発への応用事例について書きたいと思います。 セイバーメトリクスの考え方 統計学によるデータ分析と聞くと難しいように感じますが、セイバーメトリクスの発端は非常にシンプルです。それは「どうすれば勝利を増やせるか、データから分析してみよう」というものです。その考え方を段階的に分けると以下のようなものになります。 1.勝利という明確な目的を

                                        セイバーメトリクスから学ぶサービス開発 - ロコガイド テックブログ
                                      • Python使いのためのスポーツデータ解析のきほん - PySparkとメジャーリーグデータを添えて #PyConJP 2022

                                        PyCon JP 2022 10/15 Talk Session Material # Reference https://shinyorke.hatenablog.com/entry/baseball-data-visualization-app https://shinyorke.hatenablog.com/entry/ohtani-san-pitch-2022

                                          Python使いのためのスポーツデータ解析のきほん - PySparkとメジャーリーグデータを添えて #PyConJP 2022
                                        • 君は「ラーズ・ヌートバー」という選手を知っているか? - 侍JAPAN入りすべき3つの理由 - Lean Baseball

                                          皆さんこんにちは. 野球がオフシーズンな今時期はシーズン開幕に向けてデータを整理・眺めたり, 個人的な野球データ分析システムを構築しているマンです. いきなり本題ですが, ラーズ・ヌートバーという野球選手をご存知だろうか? ja.wikipedia.org 阪神の(コントロールが)暴れ馬豪腕・藤浪晋太郎投手の移籍先オークランド・アスレチックス*1のファンである私, ナショナルリーグの試合はプレーオフでしか見ない(アスレチックスはアメリカンリーグである)ので正直に言うと知らんかったです. なお年齢は2023/1/13現在で25歳, 右投げ左打ちで身長190cm/体重95.3kgと結構でかい. 昨シーズンは.228という低打率, 規定打席未到達ながらもOPS .788とクリーンアップを打たない選手の割に良い数字を残したヌートバーを意識したのはこちらのニュース. www.nikkansports

                                            君は「ラーズ・ヌートバー」という選手を知っているか? - 侍JAPAN入りすべき3つの理由 - Lean Baseball
                                          1