タグ

xmlに関するmas-higaのブックマーク (12)

  • 法律のデータ構造と検索

    デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

    法律のデータ構造と検索
  • RFCの正規文書がXMLに:Geekなぺーじ

    インターネットに関連するプロトコルなどを規定するRFC(Request For Comments)の正規文書のフォーマットが、これまでのplain-text ASCIIからXMLへと変わります。そのためのRFCが、RFC 7990 - RFC 7998として策定されました。 RFC 7990 RFC Format Framework RFC 7991 The "xml2rfc" Version 3 Vocabulary RFC 7992 HTML Format for RFCs RFC 7993 Cascading Style Sheets (CSS) Requirements for RFCs RFC 7994 Requirements for Plain-Text RFCs RFC 7995 PDF Format for RFCs RFC 7996 SVG Drawings for R

    mas-higa
    mas-higa 2016/12/22
    "XMLで記述されたものからplain-text、HTML、PDFのRFCが生成されるようになります" その XML は plain-text から作られるんでしょうね。リアルな鳥の絵をどうやって plain-text に落とすのか。Photo to Text みたいなの RFC にあるの?
  • NokogoriでのXMLパース - 会者定離で(ダイアリーから)以降

    最近久しぶりにrubyをよく書いてます(デジャヴ)。 でxmlを解析するだけの簡単なお仕事。なので、Nokogiri使い始めたのですけど、 P.S. 正確にはNokogoriでのXML/HTMLパースでした>< 2点ほど罠があったんでメモっときます。 XML名前空間*1 分からなくて最初は、xml.xpath("//div")とかしても、そこにあるはずなのに引っかからないと、半日くらいはまりました>< 参考:HpricotからNokogiriに移行するときの罠(特にXML名前空間) - daily gimite 解析したいXMLに以下の感じで、のようにxmlnsの指定がある場合は <Vulnerability xmlns="http://www.icasi.org/CVRF/schema/vuln/1.1" Ordinal="86097"> <Title>CVE-2016-0001</Ti

    NokogoriでのXMLパース - 会者定離で(ダイアリーから)以降
    mas-higa
    mas-higa 2016/06/23
    XML はいったい誰を幸せにしているのか
  • XPathの構文を割と具体的にまとめておく - 檜山正幸のキマイラ飼育記 (はてなBlog)

    XPathの要点を少し抽象的にまとめておく」より: 以上のような「概念的にどんなものか」が分かれば、あとは構文を調べながらなんとか使えるでしょ。 というわけで、構文を調べたりしたのでまとめておきます。 XPathの正式な構文は、まーまー整合的なんですが、書くのがとても面倒。それで省略形を使うことになります。省略形は書くのにとても便利ですが、意味がわかりにくくなります。そんなわけで、XPathを使うときは、正式な記法と省略形のあいだの翻訳に慣れておくとよいようです。 XPathの正式な構文 XPathロケーションステップの正式な構文は、軸、ノードテスト、述語(predicate)という3つの部分からなり、次の形です。 軸::ノードテスト[述語] 述語は条件式です。ノードテストも条件式ですが、頻繁に使う条件をノードテストにしたって感じですね。述語が不要なら、正式記法であってもブラケットごと省

    XPathの構文を割と具体的にまとめておく - 檜山正幸のキマイラ飼育記 (はてなBlog)
  • [.NET][C#]XMLをクラスに変換する/クラスをXMLに変換する

    XMLデータをクラスオブジェクトに変換(デシリアライズ)したり、逆にオブジェクトをXMLに変換(シリアライズ)したりしてみます .Net FrameworkにはXML DOMを扱うクラスが用意されています(System.Xml名前空間) 通常は、このSystem.Xml名前空間のクラスを使ってXMLの内容を解析したり出力したりしますが少々面倒だったりします そこで、XMLSerializerの出番です System.Xml.Serialization名前空間にあるこのクラスを使えば、XMLデータから自作クラスのオブジェクトを生成したり、またはその逆ができます 目次 Page.1 構造が単純なXMLデータをクラスオブジェクトに変換する Page.2 階層化されたXMLデータをクラスオブジェクトに変換する Page.3 繰り返しタグ(属性付き)のあるXMLデータをクラスオブジェクトに変換する

  • 問題の検証に c# のローカル DTD ファイルと XML ファイル

    mas-higa
    mas-higa 2013/05/09
    XML ってクソだと思うの。
  • JSONに押されるXMLの存在

    Web関連のAPIからXMLが削除され、JSONが主流になりつつある。Norman Walsh氏のブログに11月17日にポストされたエントリ「Deprecating XML」は、そのような書き出しで始まっています。 Someone asked me recently what I thought about XML being removed from the Twitter streaming API. Around the same time, I heard that Foursquare are also moving to a JSON-only API 誰かが最近僕に聞いたんだ。Twitter Streaming APIからXMLが削除されたけど、どう思う? って。そういえばFoursquareもJSONだけのAPIへ移行したと聞いたけど。 JSONはXMLよりシンプルで、基

    JSONに押されるXMLの存在
    mas-higa
    mas-higa 2012/11/08
    XML はオワコン!?
  • RubyでXML操作: Netsphere Laboratories

    Warning. (2019.1) REXML は, 標準添付ですが, 品質・速度の両面であまりよくありません。Nokogiri (鋸) がメジャーで、長らく標準の地位で使われています。REXML の3倍速い。 最近は, 大鋸 (おが) の人気が高い。スレッドセーフ、高速、機能性もある。Yorick Peterse / oga · GitLab REXMLの特徴 REXMLは、 XML 1.0に準拠した、高速なXMLパーサで、DOMツリーを生成したり、XML文書を読みながらコールバックさせる (SAX2ストリームパーサ) ことができる。 XPathの実装を含み、検索式によってDOMツリーの好きな要素を取り出すことができる。 Ruby 1.8.5にはREXML 3.1.4が添付されている。チュートリアル、APIリファレンスは下記で見られる。が、APIリファレンスのほうは不十分かつ誤りもある。

  • Qu'ils mangent de la X'ruby(クリスマスリリースがないならクリスマスRubyを作ればいいじゃない) - ずっと君のターン

    この記事はRuby Advent Calendar2009の最終日です。昨日は@tomoya55さんでした。 メリークリスマス! = Merry Xmas! ≒ Merry Xml! ということで、XMLなRubyの話をします。 TokyuRuby会議*1でこんなことを言った人がいました。 「Rubyは90年代のいいとこ取り言語だけど、Scalaは2000年代のいいとこ取り言語だ」 これを聞いた敬虔なRubyistの皆さんはもちろん「2000年代いいとこ取りの結果がXMLかよ!」って思ったと思うんですが /* http://lampsvn.epfl.ch/svn-repos/scala/scala/trunk/docs/examples/xml/phonebook/phonebook.scala */ package phonebook ; object phonebook { val l

    Qu'ils mangent de la X'ruby(クリスマスリリースがないならクリスマスRubyを作ればいいじゃない) - ずっと君のターン
    mas-higa
    mas-higa 2009/12/25
    「2000年代いいとこ取りの結果がXMLかよ!」
  • DOMプログラミング虎の巻

    1 入門編 1.1 はじめに XMLの仕様書である「Extensible Markup Language(XML) 1.0 (W3C Recommendation 10-February-1998)」がW3Cから公開されてから約2年。このシンプルなメタマークアップ言語は、インタネットを支える基盤技術としてすっかり定着してきました。 「XMLとJavaが変えるオブジェクト技術」(JAVA PRESS Vol.6)で解説した通り、XMLは単なるWWWの後継技術というだけではなくオブジェクト技術全体にインパクトを与えるキーテクノロジであり、さらにJavaとの組合わせにより統合的なフレームワークとしてITシステム構築の中核技術、必須の構成要素となっています。JavaとXMLの組合わせを軸として、今後のインタネットテクノロジが旋回していくといっても過言ではないでしょう。 そのような技術的な展開が予想

    mas-higa
    mas-higa 2008/03/13
  • RELAXが目指しているもの

    注目の言語「RELAX」の最新事情 日発のXML標準になるか、 RELAXが目指しているもの XMLの構文を記述する新しい言語「RELAX」が注目を集めようとしている。W3Cが制定作業をすすめているものの、いまだに姿の見えないXML Schema。RELAXの登場はこうした状況の中、XML業界の各方面から好意を持って迎えられつつある。 XMLの制定機関であるW3Cを差し置いて、まねきをシンボルにした日発のXML標準が生まれるかもしれない。 川俣 晶 株式会社ピーデー 2000/5/23 RELAXとは何か? RELAXとはXMLの構文を記述する言語である。構文を記述するというのは、要素や属性を記述するルールを定め、あるXML文書がそのルールに合致しているかどうかをソフトウェアでチェックできるようにすることを意味する。XML 1.0仕様に含まれるDTDにほぼ相当するものと考えればよい。

    mas-higa
    mas-higa 2008/03/13
  • @IT:サンプルで覚えるXSLTプログラミング

    サンプルで覚える XSLTプログラミング 小山尚彦、Chienowa.comチーム 日オラクル株式会社 2000/8/22 2000/10/12(第9章以降追加) XMLは文書の記述の表記基準に過ぎません。ですから、XMLがその真価を発揮するにはさまざまな要素が必要です。例えば、XML文書のデータ構造を、XML文書をやり取りする人々のあいだで定義しておくことは大切です。そのために、DTDや最近ではXML SchemaというXMLデータ構造を表記する基準(スキーマ言語)が検討されています。 また、XML文書をさまざまな形式に加工することも重要でしょう。しかも、 そのような加工の方法もXMLで書かれたならなおよいでしょう。 それがXSL(Extensible Stylesheet Language)です。 XMLを自由に加工できる XSLはXSLT(XSL Transformation)と、

    mas-higa
    mas-higa 2008/03/13
  • 1