タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

xmlに関するahat1984のブックマーク (3)

  • ShellScriptでXMLの内容を取り出す - OPEN TONE Labs

    こんにちは。itouです。 ShellScript(シェルスクリプト)でXMLをパースして内容を取り出すTIPSです。 環境はLinux(CentOS6.5)で検証します。 ツールは「xmllint」を使用します。 CentOS6.5だと「/usr/bin/xmllint」にプリインストールされています。 xmllint家サイトは「http://xmlsoft.org/」です。 まず、サンプルのXMLファイルを作成します。 ・sample.xml [code] <?xml version="1.0" encoding="UTF-8"?> <sample> <food> <name language="Japanese">りんご</name> <amount>105</amount> </food> <food> <name language="English">grape</name>

    ShellScriptでXMLの内容を取り出す - OPEN TONE Labs
    ahat1984
    ahat1984 2023/12/26
  • 法律のデータ構造と検索

    デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

    法律のデータ構造と検索
    ahat1984
    ahat1984 2023/12/19
  • クローラ作成に必須!XPATHの記法まとめ - Qiita

    最近クローラーを作成する機会が多く、その時にXPathが改めて便利だと思ったので XPathについてまとめてみました! XPathを学ぶ方の役に立てれば幸いです。 初級編 XPathとは XPathはXML文章中の要素、属性値などを指定するための言語です。 XPathではXML文章をツリーとして捉えることで、要素や属性の位置を指定することができます。 HTMLもXMLの一種とみなすことができるため、XPathを使ってHTML文章中の要素を指定することができます。 例えば、 <html> ... <body> <h1>ワンピース</h1> <div class="item"> <span class="brand">iQON</span> <span class="regular_price">1,200円</span> <span class="sale_price">1,000円</sp

    クローラ作成に必須!XPATHの記法まとめ - Qiita
    ahat1984
    ahat1984 2021/02/21
  • 1