並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 63件

新着順 人気順

住所の検索結果1 - 40 件 / 63件

住所に関するエントリは63件あります。 地図社会データ などが関連タグです。 人気エントリには 『とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro』などがあります。
  • とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro

    「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが(2023年6月6日)、この手の騒動は周期的に起こってる印象です。 ということはつまり いつまで経っても解消されない、解決が困難な課題である その困難さが界隈以外に共有されていない であるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日本の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。 なおこの件については既にQiitaにGeoloniaの宮内さんが鼻血の出そうな良エン

      とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro
    • 無料で使える「住所マスターデータ」公開、表記統一や緯度経度への変換に活用可能 全国の町丁目レベル18万9540件の住所データを記録

        無料で使える「住所マスターデータ」公開、表記統一や緯度経度への変換に活用可能 全国の町丁目レベル18万9540件の住所データを記録
      • 経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した!

        経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した! Code for Japan の関さんが SNS でシェアしてて知ったのですが、経産省さんがなにやらオープンソースで住所や電話番号の正規化などなどをするツールを公開したとのこと。 https://info.gbiz.go.jp/tools/imi_tools/ 経産省が住所変換や法人種別名、電話番号の正規化に使えるIMIコンポーネントツールを公開しました。 ソースコードも公開。README にも使い方が丁寧に書かれていました。https://t.co/fPbV00EgZP 素晴らしい動き。こういう... #NewsPicks https://t.co/bew0qGKMFE — Hal Seki (@hal_sk) May 28, 2020 ぶっちゃけ当初はあまり期待

          経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した!
        • これだけは押さえよう!住所フォームの作り方 - ケンオールブログ

          まとめ 住所フォームの作り方 住所フォームを作るときには以下の4つを押さえましょう。 オートコンプリート機能に最適化する 郵便番号フィールドは1フィールドにしてハイフン有無どちらも対応する モバイルUX優先なら郵便番号が入力されたら即座に補完。精度優先なら郵便番号補完ボタンを設置 住所フィールドは「都道府県」「市区町村」「町名以下」の3フィールドが基本。「建物」フィールドはオプション 本文 地域SNSのユーザー登録、ECサイトの配送先入力、資料請求、自治体サイトでの電子申請など、ウェブサービスを活用する上で住所入力は欠かすことができません。 住所入力をシンプルかつ正確に行えるような入力インタフェース(住所フォーム)は、離脱率を減らし、コンバージョン率を向上させる上で重要です。 郵便番号を入力すると対応する住所を自動入力する機能(郵便番号による住所補完)は、住所フォームの改善方法として最も効

            これだけは押さえよう!住所フォームの作り方 - ケンオールブログ
          • 「NAT」「NAT越え」「NATタイプ」ってなーに?

            「NAT(ナット)※1」はオンラインゲームを支える重要な技術のひとつです。 「NAT越え※2」に失敗するとマルチプレイができなくなりますし、「NATタイプ※3」の違いはマルチプレイのしやすさに影響します。 ところが、NAT は仕組みが難しく、初心者向けの記事も少ないため、イカスミカフェには NAT についての質問がよく寄せられます。 そこで今回は、Nintendo Switch(ニンテンドースイッチ)を例にして、世界一わかりやすく NAT を解説してみたいと思います。

              「NAT」「NAT越え」「NATタイプ」ってなーに?
            • 個人開発で「Excel専用のWebAPI」を作りました

              どういうもの? このように関数を使ってデータを取り込めます。 背景 元々は「インターネット上のWebAPIのデータをExcelに取り込みたい」と思ったのがきっかけです。 VBAマクロを使えば簡単ではありますが、マクロは使いたくないという方も多いのではないでしょうか。かくいう私も勤務先が属人化を防ぐためにマクロの使用を推奨していません。 そこで、関数を使用する方法を選択しました。 ExcelにはWEBSERVICE 関数という指定したURLの応答データを取り込む関数があります。 しかし、この関数は大変便利な関数ですが、ExcelはHTMLやJSONのパーサーを用意していません。結局取り込んだHTMLやJSONの処理にはVBAマクロが必要になります。 また、欲しいWebAPIが存在しない問題もありました。 そこで、Excelでデータを編集するのではなく、元々のWebAPIをExcel用に作れば

                個人開発で「Excel専用のWebAPI」を作りました
              • 日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita

                先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを「大字町丁目コード」という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得するということをやっています。 つまり、住所の正規化からコードに変換する部分がとても重要で、そもそも正規化に失敗してしまうとどうしようもないという仕様なんです。 さいわい先日経産省が公開した IMI コンポーネントツール である程度のことをやってくれるのですが(というかそうであることを期待したのですが)、いろいろ調べ始めると住所という仕組みはほんとに複雑で、Facebook で絡んでくださった @hfu さんいわくまさに「自然言語処理そのもの」であ

                  日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita
                • 個人情報テストデータジェネレーター

                  アプリケーションのテストなどで利用できる、リアルな架空の個人情報データ(疑似データ)を生成するツールです。

                    個人情報テストデータジェネレーター
                  • 日付、住所、文字列、辞書、翻訳……なんでもござれの「ExcelAPI」がスゴい/「Excel 2013」以降で利用できる「WEBSERVICE」関数と組み合わせて使う無料のWeb API【やじうまの杜】

                      日付、住所、文字列、辞書、翻訳……なんでもござれの「ExcelAPI」がスゴい/「Excel 2013」以降で利用できる「WEBSERVICE」関数と組み合わせて使う無料のWeb API【やじうまの杜】
                    • 「誰が火葬のOK出したんや」兄はどこへ消えたのか? | NHK | WEB特集

                      民衆史の研究者である今西さん。 北海道の大学を定年退職後、京都の自宅で一人暮らしをしていると聞いていた。 ついこの前の正月も、今西さんと年賀状や電話のやりとりをした。 退職後も精力的な研究活動をしている今西さんのことだ。海外調査にでも行っているだろう。 そう思って、最初は深刻には考えなかった。 しかし、連絡がとれなくなってもう3か月が経つ。 さすがにおかしい… 思い切って京都市内の今西さんの自宅を訪ねることにした。 すると、郵便受けには郵便物がどっと溜まっている。 ああ、これはただ事ではないー 堀さんは、すぐに近所の交番に駆け込んだ。 「知人と連絡が取れず、家は荒れた状態なので、調べてください」 警察官に訴えたが、台帳を見て調べたうえでこんな返事が返ってきた。 「警察は第三者に対しては何も言えません」 「調べたかったら弁護士を立てたらどうですか?」 それでも堀さんは食い下がった。 「とにか

                        「誰が火葬のOK出したんや」兄はどこへ消えたのか? | NHK | WEB特集
                      • 基本4情報での名寄せは難しい|MORIDaisuke

                        先日は住所の件でお楽しみでしたね。 私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。 異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠 正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。 一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。 なお、住所

                          基本4情報での名寄せは難しい|MORIDaisuke
                        • ダミーの個人情報を作る「個人情報ジェネレーター」登場 氏名・住所・クレカ情報など、無償で最大1万件

                          ユーザーローカルが、ダミーの氏名・住所などの個人情報を自動生成するWebサービス「個人情報テストデータジェネレーター」の無償提供を始めた。最大1万行を生成し、CSV形式のファイルなどでダウンロードできる。システム開発時の動作テストやセキュリティチェックなどに使えるという。 生成できるのは、氏名や年齢、生年月日、性別、血液型、メールアドレス、電話番号、郵便番号、住所、会社名、クレジットカード番号と期限、マイナンバーの情報。氏名は漢字・平仮名・片仮名・ローマ字などを選択でき、年齢は「20~80歳」など指定した範囲を基に日本の人口比に合わせて出力できる。 データはCSV・TSV形式かExcelファイルでダウンロードできる。生成するデータ数は1件単位で設定できるが、1万行以上はユーザーローカルへの問い合わせが必要だ。 同社はシステム開発時のセキュリティチェックなどに使うダミーデータの作成に手間がか

                            ダミーの個人情報を作る「個人情報ジェネレーター」登場 氏名・住所・クレカ情報など、無償で最大1万件
                          • ケンオール 📮 郵便番号住所検索・住所逆引き・法人情報API

                            ソフトウェアを常に最新に私たちはソフトウェアを最新に保つことがいかに難しいかを知っています。 ケンオールはデータを最新に保ち整理するプロセスを自動化し、変更を自動的に取り込むことができます。 さまざまなデータに対するAPIを使用して、既存のシステムを当社のシステムにリンクします。

                              ケンオール 📮 郵便番号住所検索・住所逆引き・法人情報API
                            • 住所の正規化は沼である。

                              杉原航太 @kota_sugihara 河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件 河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… twitter.com/i/web/status/1… pic.twitter.com/aF2jzwtBkN 2023-06-04 22:44:10

                                住所の正規化は沼である。
                              • プログラマーを苦しめてきた郵便番号データ「KEN_ALL.CSV」が改善! 扱いやすい新形式/従来形式のデータも引き続き利用できるから安心してネ【やじうまの杜】

                                  プログラマーを苦しめてきた郵便番号データ「KEN_ALL.CSV」が改善! 扱いやすい新形式/従来形式のデータも引き続き利用できるから安心してネ【やじうまの杜】
                                • 「全ての住所フォームがこうなってほしい」 SIerが公開した“使いやすい入力欄”の作り方が話題 ソースコードも掲載

                                  「郵便番号を入れる枠はひとまとまりに」「郵便番号を基にした住所の自動入力を搭載する」といった、使いやすい住所入力フォームを作る知見をまとめたブログ記事が話題だ。「はてなブックマーク」で1000ユーザー以上がブックマークした他、Twitterでも「参考になる」「全ての住所フォームがこうなってほしい」などの反応を集めている。 ブログでは、入力の煩雑さから離脱してしまうユーザーを減らすためにすべきことを大きく4つに分ける。 「郵便番号の枠はひとまとまりに」「郵便番号を入れたら即座に、もしくはユーザーがボタンを押したら住所を自動入力する」に加え「Webブラウザが備える住所の自動入力機能に対応・最適化する」「入力欄は『都道府県』『市区町村』『町名以下』の3欄を基本とし、『建物』欄はオプションとする」といった機能が必要と紹介。それぞれの実装に当たっての注意点などを説明している。 これらの機能を搭載した

                                    「全ての住所フォームがこうなってほしい」 SIerが公開した“使いやすい入力欄”の作り方が話題 ソースコードも掲載
                                  • なぜ?知らずに敗訴、差し押さえ 大分の女性、執行力排除求め提訴 | 西日本新聞me

                                    知らないうちに民事訴訟で訴えられて敗訴し、銀行預金を差し押さえられたとして、大分市で飲食店を営む女性が判決の執行力を排除する訴えを昨年10月、熊本簡易裁判所に起こしていたことが分かった。民事訴訟を起こすには、原告側が訴える相手の名前や住所を特定し、訴状に記載する必要がある。女性の代理人の弁護士が調べると、訴状には女性が住んだこともない住所が記載されていた。 女性が異変に気付いたのは2020年9月。店名義と個人名義の通帳を記帳すると「サシオサエ」とあり、入出金できなくなっていた。銀行や裁判所などに問い合わせ、債権差し押さえ命令が出ていたことを知ったという。 弁護士が訴訟記録などを調査。元従業員の男性が、30日以上前の予告なしに解雇されたとして19年6月、解雇予告手当金などを請求する訴訟を熊本簡裁に起こしていた。同8月、約68万円の支払いを命じる判決が言い渡された。口座からは約30万円が取り立

                                      なぜ?知らずに敗訴、差し押さえ 大分の女性、執行力排除求め提訴 | 西日本新聞me
                                    • 知らぬ間に敗訴、差し押さえ 原告が虚偽主張で裁判所だます | 毎日新聞

                                      • ホームレス経験者が語る「日本は家がない人間が家を借りる方法がほとんどない」事実に共感する反応続々

                                        トクロンティヌス @tokurontinus アウレリウス・トクロンティヌス(Aurelius Tokurontinus)。博士。技術士。本業はゲノム編集で遺伝子操作をするゲノムデザイナーです。小説家。イラストレーター。サイエンス向けのイラストや学会の大会イラストなどを描いています。月刊誌『実験医学』で、短編小説「フィクションで読む最新論文」を連載しています kakuyomu.jp/users/tokuront… トクロンティヌス @tokurontinus 若いときに一度ホームレスを経験したことがあるので、凄くよく知っているのだけど、日本は『家がない人間が家を借りる方法がほとんどない』んだよね。現住所がないと家が借りられない 2020-06-16 16:39:44

                                          ホームレス経験者が語る「日本は家がない人間が家を借りる方法がほとんどない」事実に共感する反応続々
                                        • 「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記

                                          note.com を読みました。私自身も日本の住所の扱いを何とかしないと業務アプリケーションの運用に支障が出ると感じ、2003年に「住所正規化コンバータ」というソフトウェアをリリースし、20年が経過しました。現在は国際航業株式会社様に取り扱っていただいています。 www.kkc.co.jp このブログにあるような指摘にどこまで応えられただろうかということで、社内で試してみました。利用したバージョンは最新の R7.2.0 で、住所マスタは2022年秋版と組み合わせました。その結果を公開します。 住居表示 丁目表記と地番表記の混在に対応しています。 浦安市舞浜2-1-1 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2790031 千葉県 浦安市 舞浜 2 1-1 号レベル 浦安市舞浜2-11 郵便番号 都道府県 市区町村 町域 小字・丁目 番地・号 マッチレベル 2

                                            「とにかく日本の住所のヤバさをもっと知るべきだと思います」に、住所正規化コンバータはどこまで応えられるのか、やってみた - ジャスミンソフト日記
                                          • 郵便局がポストの正確な位置情報を把握できていないので、ポストマップと連携するとのこと

                                            リンク www.postmap.org ポストマップ 日本全国18万本近くの郵便ポストを検索できます。郵便ポスト、コンビニ内ポスト、郵便局まで。取集時刻情報も。 949 users 421 まも @Kojimamo 「郵便局データ活用推進ロードマップ」関連 総務省 PDF soumu.go.jp/main_content/0… >※ 郵便ポストの住所データは保持しているが、 住所データをもとに電子地図上にプロットすると、 建物の中心にピンが立ってしまう等、お客さまに正確な郵便ポストの位置情報ができていない pic.twitter.com/kwYWQZUMY2 2023-03-11 01:38:24

                                              郵便局がポストの正確な位置情報を把握できていないので、ポストマップと連携するとのこと
                                            • 「住所は○丁目○番地○号で書いて」「いいや、ハイフンに統一して」住所の表記が区役所と免許センターで異なり困惑

                                              sabakichi @knshtyk 先日区役所で「住所は◯丁目◯番地◯号が正しい表記ですので◯-◯-◯といった表記は使わないように」って怒られてはえ〜ってなってたんだけど、今日免許センターで住所変更したら「表記ゆれでデータ整合取れないから今後はハイフンに統一して」「区役所の人はカタいんで」と言われぼくは困惑しています 2021-10-18 18:28:54

                                                「住所は○丁目○番地○号で書いて」「いいや、ハイフンに統一して」住所の表記が区役所と免許センターで異なり困惑
                                              • Geolonia 住所データ

                                                Skip to the content. Geolonia 住所データ 全国の町丁目、大字、小字レベルの住所データ(277,543件)をオープンデータとして公開いたします。 本データは、国土交通省位置参照情報ダウンロードサービスで配布されている「大字・町丁目レベル位置参照情報」をベースとしていますが、「大字・町丁目レベル位置参照情報」データは年に一回更新であるのに対して、本リポジトリで配布するデータは毎月更新しています。 latest.csvをダウンロード latest.dbをダウンロード リリースノート 住所データ仕様 ファイルフォーマット latest.csv: CSV latest.db: SQLite3で読み込めるバイナリ形式 列 都道府県コード 都道府県名 都道府県名カナ 都道府県名ローマ字 市区町村コード 市区町村名 市区町村名カナ 市区町村名ローマ字 大字町丁目名 大字町丁目

                                                • 全国の地名の「○本木」と「○本松」、○に入る数字を全部足したら一体何本になるの?→地図制作会社ゼンリンが本気出して調べてみた

                                                  株式会社ゼンリン @ZENRIN_official \ 〇本木 VS 〇本松 / どちらも「木」が由来で命名されていることが多い両地名、地名数を対決させてみた結果の勢力MAPがこちらです💪💪💪 〇本木は 東日本>西日本 〇本松は 東日本<西日本 #忘年会に使える地理ネタ pic.twitter.com/1tZQTta6Ie 2019-12-17 19:20:16

                                                    全国の地名の「○本木」と「○本松」、○に入る数字を全部足したら一体何本になるの?→地図制作会社ゼンリンが本気出して調べてみた
                                                  • 【高精度】クラウド郵便番号住所検索APIサービス「ケンオール」のリリース

                                                    株式会社オープンコレクター(代表:小泉守義、以下オープンコレクター)は、デジタル・トランスフォーメーション(DX)時代のシステム開発を加速する、クラウド郵便番号住所検索APIサービス「ケンオール」をリリースいたします。本サービスを活用することにより、常に最新で高精度の郵便番号データベースにアクセスすることが可能となり、郵便番号による住所自動補完などの機能の開発を大幅に簡素化することができます。 図1 ケンオール ロゴ ケンオールは、郵便番号住所検索の開発・保守に悩みを抱えていたすべてのお客様に以下の機能を提供いたします。 (1) 常に最新の状態に保たれた郵便番号データベースに基づく郵便番号住所検索を、クラウドAPIを通じて提供します。 (2) 従来製品ではほぼ未対応だった、京都市の通り名や岩手県の地割、ビル名と町名の分割などに対応。例えば、郵便番号「6020842」と「6028202」を入

                                                      【高精度】クラウド郵便番号住所検索APIサービス「ケンオール」のリリース
                                                    • 男性殺害容疑の男「裁判記録で住所知った」 | 共同通信

                                                      Published 2023/01/06 16:35 (JST) Updated 2023/01/06 16:53 (JST) 神奈川県茅ケ崎市で男性を刺殺したとして逮捕された男が「裁判記録で住所を知った」との趣旨の供述をしたことが6日、捜査関係者への取材で分かった。男は家賃を滞納して物件を所有していた男性に提訴されていた。

                                                        男性殺害容疑の男「裁判記録で住所知った」 | 共同通信
                                                      • 暇空茜氏、住所をさらされる - Colabo暇空事件

                                                        2022.12.11 暇空茜氏「Colaboの話はここまでで終わった」と宣言。来週からは若年被害女性等支援事業全体やその先の問題へ。

                                                          暇空茜氏、住所をさらされる - Colabo暇空事件
                                                        • よく訓練されたITエンジニアが『迂闊に触るな!』と徹底的に叩き込まれてる教えには理由がある

                                                          あゆゆん♪ @ayu_littlewing よく訓練されたITエンジニアは 「住所と文字コードには迂闊に手を出しちゃならん!!」と徹底的に叩き込まれているのだが、この感覚はたぶん素人には分かりにくいと思う。。。 あともうひとつくらい迂闊に触るながあった気がしたけどなんだっけな。。。 2023-06-06 08:57:31

                                                            よく訓練されたITエンジニアが『迂闊に触るな!』と徹底的に叩き込まれてる教えには理由がある
                                                          • 住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた

                                                            はじめに 数か月ほど前、住所の正規化が話題になりました。こちらの記事が特に有名ですね。 関連して、こちらの記事も話題になりました。 当時はほかにも色々な人が日本のヤバい住所の例をあげてくれて、とても楽しかったです。 実は弊社でもAddressianという住所正規化サービスを提供しています。初めて目にする変わった住所を見かけたら、とりあえず自社のAPIに投げてみて「おお、正規化できた」「すごい!」などといいながら遊んで働いています。 サービスは無料で利用できますが、今までは利用の手順が面倒でした。 ユーザー登録する APIキーを発行する 住所正規化APIを呼び出すプログラムを用意する(サンプルコードあり) プログラムを実行して住所を正規化する そこで、もっと気軽に住所正規化を試してもらえるように、ユーザー登録しなくても使えるデモ機能を作ってみました。 デモ機能の概要 住所正規化デモ画面 こち

                                                              住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた
                                                            • 郵便番号入れるなら都道府県いらんやろ…って思う入力欄に遭遇→世の中には一筋縄ではいかない住所が結構ある

                                                              深津 貴之 / THE GUILD @fladdict 画期的すぎるUIに遭遇した。 郵便番号いれるなら都道府県いんやろ…というか、郵便番号が縦なの新しすぎる pic.twitter.com/VUSCxXPIw3 2024-02-12 15:08:37

                                                                郵便番号入れるなら都道府県いらんやろ…って思う入力欄に遭遇→世の中には一筋縄ではいかない住所が結構ある
                                                              • IMI 情報共有基盤 コンポーネントツール

                                                                公開リソース一覧 gBizINFOで使用しているリソースの一覧です。 各リソースはIMI(https://imi.go.jp)が提供する以下の技術仕様に準拠して作成しています。 IMI語彙記法 バージョン1.0.1 DMD仕様 バージョン3.0.1 マッピングファイル仕様 バージョン1.0.1 構造化項目名記法 バージョン1.0.1 1.WebAPIコンポーネントと仕様書 各コンポーネントの一式(ソースコード、テストコード、仕様書に相当する README.md を含む)を収録しています。 使用方法は各コンポーネントの `README.md` をご覧ください。 (1) 住所変換コンポーネント imi-enrichment-address-2.0.0.src.tgz imi-enrichment-address-2.0.0.tgz (2) 法人種別名の抽出コンポーネント imi-enrichm

                                                                • TechCrunch | Startup and Technology News

                                                                  To run 60-minute startup board meetings that create value, replace your 80-slide deck with a simple three-page memo.

                                                                    TechCrunch | Startup and Technology News
                                                                  • 「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに

                                                                    「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっているためだ。 6月4日のテレビ番組で、マイナンバーカードに記載される住所をめぐり、河野太郎デジタル大臣が「将来的にはAIの技術を使って住所の表記揺れを判断することがあり得るかもしれない」と発言し、住所の正規化についてネットで議論になっていたことがきっかけだ。 記事は、「日本の住所システムがカオスで、その計算機的な処理がいかに困難か」を解説する内容だ。 まず、日本にはそもそも、新旧の2つの住所システム(A町1丁目3番2号/A町1234番地)が併存しており、例えば、「浦安市舞浜2」の住所が「舞浜2丁目」「舞浜2番地」の2系統あるケースを紹介。 さらに、まったく同じ住所表記が異な

                                                                      「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
                                                                    • 住所の正規化を手直ししたライブラリが涙なしには読めないものだった「エンジニア泣かせの作業だ」

                                                                      しのゆ🎀うぇぶえんじにゃぁ @shinoyu これ経由で元のコードよんだけどなかなかつらい実装になってて、ないちゃった github.com/IMI-Tool-Proje… 絶対これ以外あるでしょ....うわー twitter.com/yuya_presto/st… 2023-06-06 16:31:52 ypresto @yuya_presto 経済産業省・デジ庁が公開していたものの朽ちてしまっていた住所正規化ライブラリ、いろいろ手直しして動く状態にしました! 河野大臣が挙げていらした「東京都港区赤坂1丁目2の3」も正規化できます。 ブラウザ上でのお試しにも対応しました! imi-enrichment-address.vercel.app github.com/ypresto/imi-en… 2023-06-06 16:02:27 リンク GitHub imi-enrichment-a

                                                                        住所の正規化を手直ししたライブラリが涙なしには読めないものだった「エンジニア泣かせの作業だ」
                                                                      • ヤバいと話題の“日本の住所表記” 何がそんなに大変? ゼンリンに聞いた

                                                                        日本の住所表記の正規化・名寄せがTwitter上で話題になっている。きっかけとなったのは河野太郎デジタル大臣がテレビ番組で発した「AIを使って表記揺れを判断することがあり得るかもしれない」という言葉。これに対し、ネット上ではさまざまな議論が巻き起こっている。 Twitter上では「住所の揺らぎ程度のことでAIは不要」という意見が見られた。これに対して、ITエンジニアなどからは「住所の表記揺れはすぐ解決できる問題ではない」などと反論の声が上がり、「日本住所のヤバさをもっと知ってほしい」と訴えるユーザーも多数見られた。 そんな中、地図や地図データベースを手掛けるゼンリンもこの話題に反応。そこで住所の表記揺れを直すのがどのくらい難しいのか、またどうすれば解決できるのか。ゼンリンに話を聞いた。 表記ゆれの“ワナ”はいくらでも そもそも住所の表記揺れとは「誤字ではないが、同じ意味、同じ読み方であるに

                                                                          ヤバいと話題の“日本の住所表記” 何がそんなに大変? ゼンリンに聞いた
                                                                        • GitHub - geolonia/japanese-addresses: 全国の町丁目レベル(277,191件)の住所データのオープンデータ

                                                                          A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

                                                                            GitHub - geolonia/japanese-addresses: 全国の町丁目レベル(277,191件)の住所データのオープンデータ
                                                                          • ケンオール通信第10号: 町名を空にしなければいけない町域 - ケンオールブログ

                                                                            今回は、郵便番号データ内の町名を空にしなければいけない町域について紹介します。 データは、記載がない限り2021-05-31のデータを用いています。 ケンオールでどのようにパースされているかは、こちらのデモで試せます。 以下に掲載がない場合 ○○一円 ○○の次に番地がくる場合(○○は町名) ○○の次に番地がくる場合の歴史的背景 参考文献 ケンオールについて 更新履歴 町域に文字列が記載されているものの、コメントと同様の文字列のため削除しなければいけないパターンが存在します。 そのパターンは以下の通りです。 以下に掲載がない場合 ○○一円(○○は町名) ○○の次に番地がくる場合(○○は町名) 以下に掲載がない場合 以下に掲載がない場合とは、以降のレコードに掲載されていない住所の場合はこの郵便番号を使うよう指示しているコメント文字列です。 0600000: 北海道 札幌市 中央区 以下に掲載が

                                                                              ケンオール通信第10号: 町名を空にしなければいけない町域 - ケンオールブログ
                                                                            • GitHub - geolonia/normalize-japanese-addresses: オープンソースの住所正規化ライブラリ。

                                                                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                GitHub - geolonia/normalize-japanese-addresses: オープンソースの住所正規化ライブラリ。
                                                                              • ケンオール通信第7号: 日本の住所の構造と郵便番号データ - ケンオールブログ

                                                                                ケンオール通信第4号では、郵便番号データの処理方法の最初の一歩として、複数行の結合について紹介しました。データ処理の続きを説明する前に、まず日本の住所とはどういう構造になっているかを紹介します。 日本の住所の構造 郵便番号データの住所構造 京都の通り名 地割 特定の番地に割り当てられた郵便番号 ビルに割り当てられた郵便番号 PyData.Osaka に登壇します ケンオールについて 編集履歴 日本の住所の構造 日本の住所は、領域の大きい地域名から小さい地域に向かって書いていくという構造です。この大から小という構造は、日本の他に中国や韓国、台湾などが用いており、東アジア諸国では一般的な記法ですが、世界的には小さい領域から大きい領域に向かって書いていくという記法が一般的です。 余談ですが、東アジア以外の全ての国が小から大という表記ではなく、ハンガリーなど一部の国で大から小という表記形式を採用し

                                                                                  ケンオール通信第7号: 日本の住所の構造と郵便番号データ - ケンオールブログ
                                                                                • WebAPIで住所の正規化処理、「住所クレンジングサービス」をインクリメントPが開始

                                                                                    WebAPIで住所の正規化処理、「住所クレンジングサービス」をインクリメントPが開始 

                                                                                  新着記事