タグ

Dataに関するkohkumaのブックマーク (7)

  • 「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに

    「日の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日の住所のヤバさをもっと知るべきだと思います」がバズっているためだ。 6月4日のテレビ番組で、マイナンバーカードに記載される住所をめぐり、河野太郎デジタル大臣が「将来的にはAI技術を使って住所の表記揺れを判断することがあり得るかもしれない」と発言し、住所の正規化についてネットで議論になっていたことがきっかけだ。 記事は、「日の住所システムがカオスで、その計算機的な処理がいかに困難か」を解説する内容だ。 まず、日にはそもそも、新旧の2つの住所システム(A町1丁目3番2号/A町1234番地)が併存しており、例えば、「浦安市舞浜2」の住所が「舞浜2丁目」「舞浜2番地」の2系統あるケースを紹介。 さらに、まったく同じ住所表記が異な

    「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
    kohkuma
    kohkuma 2024/04/24
    “「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっ…”
  • とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro

    「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが(2023年6月6日)、この手の騒動は周期的に起こってる印象です。 ということはつまり いつまで経っても解消されない、解決が困難な課題である その困難さが界隈以外に共有されていない であるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。 なおこの件については既にQiitaにGeoloniaの宮内さんが鼻血の出そうな良エン

    とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro
    kohkuma
    kohkuma 2023/11/13
    “「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や…”
  • 逗子駅での客待ちタクシーの意外なデータ構造 ~年月が磨くデータ形式

    逗子駅での客待ちタクシーの意外なデータ構造 ~年月が磨くデータ形式:組み込みエンジニアの現場力養成ドリル(25)(1/3 ページ) OSやアルゴリズムの授業で必ず学習する「データの構造」や「データの編成方式」。今回は、実社会で自然発生的に、経験的に出来上がったデータ構造を考えます。意外にスゴイことをやっています。 はじめに OSやアルゴリズムの授業で必ず学習するのが「データの構造」や「データの編成方式」です。先頭からデータを読む「シーケンシャルアクセス」、の索引のような「インデックスアクセス」、テレビのリモコンのボタンを押して直接見たい番組を表示するような「ダイレクトアクセス」など、いろいろなデータ構造や編成方式があります。 データを格納する方式を決める場合、図書館を収納するのと同じで、以下の要素を考えねばなりません。 スペース効率 小さな図書館のスペースで大量の書籍(データ)を収納

    逗子駅での客待ちタクシーの意外なデータ構造 ~年月が磨くデータ形式
    kohkuma
    kohkuma 2020/03/24
    “OSやアルゴリズムの授業で必ず学習する「データの構造」や「データの編成方式」。今回は、実社会で自然発生的に、経験的に出来上がったデータ構造を考えます。意外にスゴイことをやっています。”
  • 1時間前の人口分布、10分ごとにドコモが提供 飲食店の需要や道路渋滞を予測

    NTTドコモは12月3日、最短で1時間前の人口分布を10分単位で調べられるサービス「国内人口分布統計」(リアルタイム版)の提供を、2020年1月22日に始めると発表した。500メートル四方のエリアに絞って表示する。企業向けに提供し、飲店の需要予測や観光地の混雑緩和などに役立ててもらう考えだ。

    1時間前の人口分布、10分ごとにドコモが提供 飲食店の需要や道路渋滞を予測
    kohkuma
    kohkuma 2019/12/12
    “NTTドコモは12月3日、最短で1時間前の人口分布を10分単位で調べられるサービス「国内人口分布統計」(リアルタイム版)の提供を、2020年1月22日に始めると発表した。500メートル四方のエリアに絞って表示する。”
  • Sotetsu Lab. v3

    相模鉄道こと相鉄線に関する情報を提供する、相鉄ファンサイトです。運用目撃情報・運用表・時刻表等を公開しています。

    kohkuma
    kohkuma 2019/08/21
    “Sotetsu Lab.は、神奈川県を走る大手私鉄、相模鉄道に関する情報を提供するWebサービスです。 相鉄線を走る車両の1日の動き(これを運用と呼びます)や、全駅における特定車両の発車時刻等の情報を提供しています。”
  • JR東日本「首都圏輸送密度ランキング2017」。横須賀線が減少に転じる | タビリス

    インバウンド路線は好調 輸送密度が増加しているのは、東京都心に近いエリアです。人口減少の時代ですが、東京の人口は増え続けており、それが輸送密度に反映されている形です。 また、インバウンドの影響を受ける路線も好調です。成田線の成田~成田空港間は前年度比5%増の24,592。日光線鹿沼~日光間は同6%増の4,298を記録しました。 横須賀線は2015年度がピーク ただ、沿線に鎌倉市という観光地を抱える横須賀線は、インバウンドの恩恵が数字に出ていません。14位の大船~逗子間は、利用者が減少に転じています。外国人観光客が多い路線にもかかわらず、利用者が低下しているということは、通勤・通学の需要がそれだけ減っているのでしょう。 横須賀線は逗子~久里浜間の利用者も減り始めていて、大船~久里浜間の全線でみると、2015年度を直近のピークとして利用者減に転じています。いまのところ減り幅は対前年比1%未満と

    JR東日本「首都圏輸送密度ランキング2017」。横須賀線が減少に転じる | タビリス
    kohkuma
    kohkuma 2018/07/12
    “日本で最も利用者の多い、首都圏の鉄道。その平均通過人員(輸送密度)の最新データをJR東日本が公表しました。都心部で利用者が増加する一方、首都圏の外縁部では利用者が減少している路線もあります。大船以南…
  • 銀座線や井の頭線…「稼げる路線」の共通点

    これらの路線を同じ尺度で比べることは難しいが、輸送規模の面では旅客または貨物の「平均通過数量」が役に立つ。平均通過数量とは、旅客人キロまたは貨物トンキロを年間の営業キロで除して求めた数値を指し、輸送密度ともいう。 路線ごとの収支を比較するには営業係数が向く。100円の収入を得るに当たって何円の費用を要するかという営業係数は売上高営業利益率の逆数ともいえ、鉄道業界ではこちらの数値が一般的だ。 営業係数で知る路線の特徴 多くの路線で平均通過数量は明らかにされているものの、営業係数は鉄道事業者または軌道経営者に一つの路線しか存在しない場合を除いてほぼ明らかにされていない。それでも、大手私鉄や地下鉄などでは路線ごとの収入が公表されるケースが多く、あとは路線ごとの費用がわかれば求められる。 収入、費用を推測する手段として挙げられるのは、営業キロや旅客人キロの比率に基づいた配分法だ。基的な考えとして

    銀座線や井の頭線…「稼げる路線」の共通点
    kohkuma
    kohkuma 2018/05/20
    “国内に存在する鉄道路線の数は2017年3月31日現在で延べ763路線だ。うち、JRが267路線、JR以外が496路線である。大手私鉄や地下鉄、中小私鉄、第三セクター鉄道といったグループ分けが可能なJR以外の496路線は、さまざま…
  • 1