タグ

データに関するmatakenoのブックマーク (6)

  • 法律のデータ構造と検索

    デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

    法律のデータ構造と検索
  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
  • 中日スポーツ:当てることと勝つことの間

    競艇ほど当てることと勝つことの違いを教えてくれるギャンブルはない。1枠に賭ければ52%も当たるが、資金は着実に減っていく。勝つための戦略は存在しないのだろうか? 競艇は300メートル離れたブイ(ターンマーク)を左回りに3周するボートレースだ。スタートラインを時速80キロで通過した選手は、4秒後には第一ターンマークを旋回する行動に移らなければならない。レースを初めて見る人の目にも、一番内側を走る1枠(1コース)が有利だと分かる。 選手はスタート前の駆け引き(待機行動)で内側のコースを取ろうとするが、この経路も左回りなので1枠が主導権を握る。1枠の99%が一番内側の進入コースを取る。 2013年から22年末までの10年間、49万レースのデータによると、1枠の52.1%が1着になっている(進入順で内側を譲った場合を含む)。 ただし、この結果がすべて1枠の効果だと簡単には言えない。 選手は、モータ

    中日スポーツ:当てることと勝つことの間
  • GitHub上に公開された「東京都公式 新型コロナウイルス対策サイト」は危機が生んだ日本の奇跡 - 俺の遺言を聴いてほしい

    東京都が奇跡を起こした。 僕たちは今、信じられない光景を見ている。 文章で説明するよりも、当事者たちのツイートを追った方がわかりやすいだろう。 心がザワザワしている時は、手を動かそうと思う。どんどん流れてくるニュースのシェアばっかりしてても、自分の心の安寧は得られない。コードを書こう!— Hal Seki (@hal_sk) February 29, 2020 東京都のアドバイザーを務めるCode for Japanの関さんが中心となって、 新型コロナウイルスの東京都が発表してきた情報をワンストップに確認できるダッシュボードができました!!!! これは良い取り組み。ぜひ皆様ご確認ください。 ・東京都公式COVID-19対策サイトhttps://t.co/YUFZsI4dFQ— 藤井あきら🐈東京都議会議員🚴🏳️‍🌈 (@fujiiakiratokyo) March 3, 2020

    GitHub上に公開された「東京都公式 新型コロナウイルス対策サイト」は危機が生んだ日本の奇跡 - 俺の遺言を聴いてほしい
  • 佐々木クリスさんと作ったNBAデータツールの取得方法と使用方法 - データとバスケ

    こんにちは。以下の記事で紹介されているNBAデータツールの取得方法と使用法を説明したいと思います。 なお、この記事とツールの対象者として 普通にこのツールを使ってみたい方 このツールと似たようなツールを作ってみたい方 を想定しています。後者向けの情報は、記事の最下部にあります。 説明の前に余談ですが、引用の記事にもあるように、佐々木クリスさんはNBAの解説の仕事の為、日々かなりのデータを収集されているそうです。シーズン中は日々データが変化していくので常にそれを追いかけなければならず、それだけでかなりの仕事量だそうです。 クリスさんがあれだけ解説で色々と話せるのはそうした下準備かあるからなのだなと、古舘伊知郎さんの実況の下準備の話を思い出したりしながら妙に納得しました。そしてクリスさんの仕事の一部分がこのブログで遊んでいた事の応用で自動化できそうだったので、ツール化してみたという次第です。

    佐々木クリスさんと作ったNBAデータツールの取得方法と使用方法 - データとバスケ
  • 【2019年】データ分析・可視化に本気でおすすめのツール30選(ノーコード型ツール含め) - Qiita

    一般的なチャート(8) インフォグラフィック(3) 地図・マップ(1) ネットワークグラフ(1) 関数のグラフ(1) エンジニア向け 一般的なチャート(10) 地図・マップ(4) ネットワークグラフ(1) 株価チャート(1) 1.一般的なチャート (1)RAWGraphs RAWGraphs はクラウド型、オープンソースのデータ視覚化ツールであり、 Excelのデータを処理するためによく使われます。RAWGraphsにデータをアップロードし、ほしいグラフを設計して、 SVGかPNGの画像に出力すれば済みます。RAWGraphsにアップロードされたデータは Web側でのみ処理されるので、 データの安全を保証できます。 (2)ChartBlocks ChartBlocks はグラフ作成のオンラインツールであり、スマートデータインポートガイドに従えば、データのインポートとグラフの設計を簡単に完了

    【2019年】データ分析・可視化に本気でおすすめのツール30選(ノーコード型ツール含め) - Qiita
  • 1