Fork me on GitHub

2009/07/09

Recent entries from same category

  1. perldocのbash-completionが激しく便利でうれしょん出た。 Hatena
  2. Perl音痴な私がPerlを使っている理由 Hatena
  3. TatsumakiとDUI Streamを使って画像ストリーミングサーバ作ってみた。 Hatena
  4. のび太の物は俺の物。俺の物は俺の物。 Hatena
  5. Plackで高速サーバがWindowsでも動くようにした Hatena

はてな
XML::Simpleだと格納される結果が決まっており、例えば
<statuses>
    <status>
        <id>4773580</id>
        <text>kazuhoさんがやってくれました!</text>
        <user>
            <screen_name>mattn</screen_name>
        </user>
    </status>
    <status>
        <id>4773581</id>
        <text>今日のnickは○○提供です。</text>
        <user>
            <screen_name>kazuho</screen_name>
        </user>
    </status>
</statuses>
こんなXMLを以下の様な形にしたい場合がある場合に少し不便だったりします。
---
id: 4773580
text: kazuhoさんがやってくれました!
screen_name: mattn
---
id: 4773581
text: 今日のnickは○○提供です。
screen_name: kazuho
XML::Simpleを使うと、arrayノード一つにID要素があると勝手にノード扱いになったり、不必要なノードへのアクセスが必要になったりします。以下XML::Simpleのパース結果
---
status:
  4773580:
    text: kazuhoさんがやってくれました!
    user:
      screen_name: mattn
  4773581:
    text: 今日のnickは○○提供です。
    user:
      screen_name: kazuho
こんな場合にはXML::CuteQueriesを使うと便利です。
Paul Miller / XML-CuteQueries - search.cpan.org

A cute little query language for converting XML to Perl

http://search.cpan.org/dist/XML-CuteQueries/
上の例であれば以下のコードで望み通りの形式でパース出来てしまいます。
use strict;
use warnings;
use LWP::Simple;
use XML::CuteQueries;

my $cq = XML::CuteQueries->new;
$cq->parse(get "http://api.wassr.jp/statuses/public_timeline.xml");
my @statuses   = $cq->cute_query("/statuses/*" => {'*' => '', 'user/*' => ''});
use YAML;
warn Dump @statuses;
PODを見ていただければ分かりますが、XPathでクエリ式を書きそれに対するデータシェイプを指定します。例であれば"/statuses/*"にあるノードすべて"*"はデータシェイプのルートに、また"/statuses/*"にある"user/*"(user内の全て)もデータシェイプ内のルートに置くという指定になります。
これ、XML版のWeb::Scraperって感じですかね。便利だわー。

モダンPerl入門 (CodeZine BOOKS) モダンPerl入門 (CodeZine BOOKS)
牧 大輔
翔泳社 / ¥ 2,940 (2009-02-10)
 
発送可能時間:在庫あり。

Posted at 10:34 in ソフトウェア::lang::perl | WriteBacks (3) | Edit
Tagged as: perl, xml, xpath
Bookmarks: このエントリーのtweets add to hatena add to hatena | add to delicious.com | add to livedoor.clip add to livedoor.clip | add to buzzurl add to buzzurl | add to fc2bookmark add to fc2bookmark | add to Yahoo Bookmark add to Yahoo Bookmark | add to Pookmark add to Pookmark

blog comments powered by Disqus
WriteBacks

スジで逮捕の後藤麻衣が東京都議選に出馬!

エロすぎる都議候補!スジで逮捕の後藤麻衣が東京都議選に出馬!

Posted by これはエロすぎる!都議候補! at 2009/07/10 (Fri) 17:45:00

「XML」を含むニュースと関連グッズの紹介

イマナビでは「XML」を含むニュースと関連グッズの紹介をしています。「XML」に興味があれば是非ご覧ください!

Posted by イマナビ!News&Shopping at 2009/07/13 (Mon) 16:17:10

マスク通販在庫あり

名古屋市は26日、新型インフルエンザ感染の疑いがあった市内の無職女性

Posted by 在庫あり at 2009/08/28 (Fri) 23:47:57

TrackBack ping me at
Post a comment

writeback message: Ready to post a comment.