タグ

semanticWebとXSLTに関するtsupoのブックマーク (3)

  • ちょっとしたメモ - GRDDLサポートツール2つ

    2月に入ってGRDDLをサポートするツールが2つ立て続けに登場した。一つはRaptor RDF Parser Toolkit(Dave Beckettのアナウンス)、もう一つはJena GRDDL Reader(Jeremy Carrollのアナウンス)。いずれも、XHTMLプロファイルを通したスタイルシートの間接指定ができるようになっているところが大きい。 Raptorは、C#、JavaPerlPHPRubyなどの言語から利用できるRDFパーサの高速ライブラリで、RDF/XML仕様のエディタ自らが作っている定評あるもの。GRDDLは昨年からサポートしていたが、今回スタイルシートの間接指定も処理できるようになった。手元で試してみたら、XML/RDF出力だとxml:baseがうまく出てこないものの、GRDDLの処理はきちんとできている。 JenaはJavaでRDFを処理するための定番ラ

    tsupo
    tsupo 2007/02/03
    Jena GRDDL Reader: 前処理にNekoHTMLを使って整形式でない(X)HTMLを整形式にバランスさせるオプションがあるので、世の中に氾濫しているXHTMLくずれでもGRDDLが利用できるというのもポイント
  • Web 2.0からセマンティック・ウェブへ

    “Web 2.0”の主張 Tim O'Reillyによれば プラットフォームとしてのウェブ(The Web As Platform) 集合知の利用(Harnessing Collective Intelligence) データが重要(Data is the Next Intel Inside) 商品としてのソフトからサービスとしてのソフトへ(End of the Software Release Cycle) ハッキングと連動が容易な軽量プログラミング(Lightweight Programming Models) PCに限定されない利用(Software Above the Level of a Single Device) Ajaxに代表されるリッチなUI(Rich User Experiences) (What Is Web 2.0 Design Patterns and Busin

    tsupo
    tsupo 2006/11/22
    タグの表記の揺れをどうするか、など、課題は多い
  • ちょっとしたメモ - W3Cの新しいXSLTサービスとGRDDL

    W3CのオンラインXSLTサービスが新しくなって、文字コードの扱いが改善された。以前はUTF-8以外の文字コードは即座にJavaの例外を引き起こしていたのだが、今回はShift_JISでもEUC-JPでもちゃんと処理できている。これによって、日語XHTMLページからGRDDLでRDFを容易に抽出できるようになる、はずだ。 XHTML文書からRDFを抽出するには、たとえば当サイトの汎用XSLT(xh2rdf.xsl)をこのオンラインサービスで適用すればよい。整形式を満たしている文書なら、タイトルや見出しがメタデータとして取り出され、要約やキーワード、作者の連絡先があればそれも含めたRDFが得られる。 XHTML: さらに、head要素のプロファイルとしてhttp://purl.org/net/ns/metaprofを記述していれば、W3CのGRDDL demoページから直接RDF抽出を行う

    tsupo
    tsupo 2006/04/29
    XHTMLを謳っていながらも整形式になっていないケースが多く、残念ながらかなりの割合でエラーになった → さもありなん
  • 1