Blog Developer's Cookbook : BlogRolling を利用して RSS 巡回先を管理

RSS は Aggregator で読むだけではなく、様々な使用方法があります。お気に入りの RSS リスト(巡回先) が肥大してくると、この管理もなかなか大変です。今回は BlogRolling というサービスを使用して、RSS 巡回先の管理を行ってみます。

BlogRolling

BlogRolling は、Weblogs.Com の changes.xml に掲載されている更新情報をもとにして(*2)、自分の巡回する Blog リストを更新順に並べかえてくれるサービスです。BlogRolling の URL リストは JavaScript で HTML 出力する機能を持っているため、巡回リストを更新時間順に(*3)ソートして、自分の Blog の SideBar などに張りつけることができます。ちょうどはてなダイアリーのサイドバーにはてなアンテナのアンテナを張りつけるのに似ていますね。

こうして巡回先リストを Web 上の BlogRolling に保持しておくことで、

BlogRolling はブラウザから 1-Click で登録する Bookmarklet や "BlogRoll Me" (*4) などの簡易登録インタフェースも用意しているため、「お、このサイトいいな」と思った際に、すぐに追加できるのも便利なところです。

BlogRolling に登録したサイトの RSS 一覧を取得

このように、BlogRolling で管理した巡回先マスタ(RSS)から Blog リストを抽出して、RSS の更新情報をメールで送信などのアプリケーションに渡すようにすれば、Web で管理した Blog リストについて、メーラで更新情報を取得できるという大層なアプリケーションが簡単に作成できます。

注意すべきは、BlogRolling の出力する RSS には、サイト毎の RSS の URL は含まれていないことです。RSS Auto Discovery を利用して RSS のリストを作成してあげればよいでしょう。

サンプルコード

実行例

See Also

Listings

List 1: sample.xml

<?xml version="1.0"?>
<!-- RSS generation done by 'Blogrolling.com'-->
<rss version="0.92">
<channel>
<title>blog.bulknews.net</title>
<link>blog.bulknews.net</link>
<description>Blogrolling.com RSS Feed</description>
<lastBuildDate>Thu, 23 Oct 2003 11:52:08 GMT</lastBuildDate>
<docs>http://www.blogrolling.com/</docs>
<webMaster>rss@blogrolling.com (Blogrolling RSS Generator)</webMaster>
<item>
<title>HAIL 2 U !! - Weblog</title>
<link>http://www2u.biglobe.ne.jp/%7Ekyo-n/blog/blosxom.cgi</link>
<description>Last updated: 12:08:48 GMT on Thursday, October 23</description>
</item>
<item>
<title>Blog Developer's Cookbook</title>
<link>http://blog.bulknews.net/cookbook/blosxom</link>
<description>http://blog.bulknews.net/cookbook/blosxom</description>
</item>
<item>
<title>blog.bulknews.net</title>
<link>http://blog.bulknews.net/mt/</link>
<description>http://blog.bulknews.net/mt/</description>
</item>
<item>
<title>Shibuya Perl Mongers</title>
<link>http://shibuya.pm.org/</link>
<description>http://shibuya.pm.org/</description>
</item>
<item>
<title>NDO::Weblog</title>
<link>http://naoya.dyndns.org/</link>
<description>http://naoya.dyndns.org/</description>
</item>
</channel>
</rss>

List 2: blogrolling2rss.pl

#!/usr/local/bin/perl -w
# blogrolling2rss - extract RSS feeds from BlogRolling URL list

use strict;
use HTML::RSSAutodiscovery;
use LWP::Simple;
use Storable;
use XML::RSS;

our $CacheFile     = "rss.cache";
our $BlogRollingId = "fd16d26c9ad1029c21a48955b8c19731";

my $cache = eval { Storable::retrieve($CacheFile) } || {};

my $url = "http://rpc.blogrolling.com/rss.php?r=$BlogRollingId";
my $xml = LWP::Simple::get($url);

my $rss = XML::RSS->new();
   $rss->parse($xml);

for my $item (@{$rss->{items}}) {
    $cache->{$item->{link}} ||= discover_rss($item->{link}) or next;
    print $cache->{$item->{link}}, "\n";
}

Storable::nstore($cache => $CacheFile);

sub discover_rss {
    my $url = shift;
    my $discovery = HTML::RSSAutodiscovery->new();
    my $rss = $discovery->parse($url);
    unless (@$rss) {
        warn "no RSS found for $url\n";
        return;
    }
    return $rss->[0]->{href};
}

*1) そうしたサービスがすべて廃れていることには目をつむりましょう ;-)
*2) BlogRolling 独自に Ping を受けつける RPC Interface も公開しています。
*3) 設定で更新時間順以外のソートも可能です。
*4) Blog サイトが、自サイトを BlogRolling リストに追加させるためのリンク
*5) Outline Processor Markup Language: 今回は扱いません
*6) BlogRolling の用語で巡回リストのこと
*7) BlogRolling にログインして "Get Code" で取得できます。
*8) RSS が見つからないときだけは、何度も引きにいってしまいます。これを防ぐ場合には、見つからないときでも 0 や '' などの結果を入れて defined で判別するように変更します。