某所に投げたメールですが、ここにも掲載しておく。
検索エンジンのロボットが読む /robots.txt や HTML の META name="robot" content="noindex" に相当するメタデータをRSSに埋め込むための規格がほしいなと思っています。
Bulkfeeds や FeedBack などの RSS フィード検索エンジンに乗ってほしくないRSSフィードを吐いている方も、中にはいらっしゃるとおもいます。これらを表現するには、現状 dc:rights や creativecommons などのモジュールを使うと思うんですが、バリエーションが多すぎていまいち統一性のとれた規格にはできなそうです。
コンテンツを index してほしくないという理由のほかにも、たとえば Bulkfeeds のような検索エンジンが検索結果をさらにRSSフィードで出力したり、RNA や RssRolling のような、アグリゲートしたフィードを再度まとめて出力したりすると、これを検索エンジンでひっかけると非常にややこしいことになります。
# Bulkfeeds では個別にこういうのを見つけ次第、検索対象からはずすようなフィールド定義して対応してるんですが。。
シンタクスとしては、
<robot:user-agent>*</robot:user-agent>
<robot:noindex>1</robot:noindex>
のようなシンプルなものでいいかなと。
ご意見ください。