タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

業務に関するaminisiのブックマーク (1)

  • 第3回 同一データの決定と名寄せの限界

    最終回である今回のテーマは,絞り込まれた類似データをチェックして,同一データを決定する作業です。また最後に,名寄せを行うにあたっての注意点やツールについて説明します。 ◆名寄せ技術3「類似データの絞り込み」 標準化が済むと,標準化されたデータを突き合わせる作業を行います。名寄せにおける突き合わせとは,同一データかどうかの比較のことです。 完全に一致するデータは問題ありませんが,ある程度一致するデータを同一データととらえるかどうかが,名寄せの場合のポイントです(完全一致を試みるのであれば,名寄せという考え方は必要なく,一般的な付き合せ処理となります)。 「ある程度一致する」というのは人間の感覚的な要素が絡むため,難しいところです。まずは人間の感覚を見てみましょう。図10のデータは,非常に近いデータの例となっていますが,どのデータが同一人物である確率が高いでしょうか? 氏名が違ったり,住所が異

    第3回 同一データの決定と名寄せの限界
  • 1