いくつか Trackback をいただきました。以下のように RDF 的に考案していただいた方もいるんですが、僕としては RDF にはこだわってはいないので、
<robot:noindex />
までシンプルにしてもいいかな、とか思い始めています。でも User-Agent にマッチすることは必要条件かな。とすると、
<robot:noindex user-agent="googlebot" />
とかかなあ。でもせっかくだから robots.txt と全く同じセマンティクスにすれば、robots.txt を読む実装 (Perl でいえば WWW::RobotRules とか) を再利用できてうれしいかなとは思うんですけどね。
でも robots.txt は site-wide なのに対して、meta name="robot" はコンテンツごとだからセマンティクスが変わってしまうのはしょうがないか。じゃあ、meta 要素そのまま書くのはだめかな。。
<xhtml:meta name="robot" content="noindex" />
って、xhtml だったら html/head/meta にないと意味的にはアレか。。結構めんどいですな。
<robot:noindex><robot:agent name="googlebot" /></robot:noindex>
こんな感じかな。。
2004 年 7 月の履歴もしくは日誌 / おのひろきおんらいん
robots.txt に RSS についてもそのまま記述すれば良いと思うのですが,robot.txt の編集をする権利を持たないっていう人も少なく無い訳で,そうすると HTML の meta 要素のように,RSS 自体に組み込む仕組みが必要というわけですね.