July 13, 2004

RFC: RSS に noindex

某所に投げたメールですが、ここにも掲載しておく。

検索エンジンのロボットが読む /robots.txt や HTML の META name="robot" content="noindex" に相当するメタデータをRSSに埋め込むための規格がほしいなと思っています。

BulkfeedsFeedBack などの RSS フィード検索エンジンに乗ってほしくないRSSフィードを吐いている方も、中にはいらっしゃるとおもいます。これらを表現するには、現状 dc:rights や creativecommons などのモジュールを使うと思うんですが、バリエーションが多すぎていまいち統一性のとれた規格にはできなそうです。

コンテンツを index してほしくないという理由のほかにも、たとえば Bulkfeeds のような検索エンジンが検索結果をさらにRSSフィードで出力したり、RNARssRolling のような、アグリゲートしたフィードを再度まとめて出力したりすると、これを検索エンジンでひっかけると非常にややこしいことになります。

# Bulkfeeds では個別にこういうのを見つけ次第、検索対象からはずすようなフィールド定義して対応してるんですが。。

シンタクスとしては、

<robot:user-agent>*</robot:user-agent>
<robot:noindex>1</robot:noindex>

のようなシンプルなものでいいかなと。

ご意見ください。

Posted by miyagawa at July 13, 2004 04:02 PM | Permalink | Comments (0) | TrackBack(1)
Comments
Trackbacks
TrackBack URL for this entry: http://blog.bulknews.net/mt3/mt-tb.cgi/1093
「RSS に noindex」に対しての提案
Excerpt: robots.txt に RSS についてもそのまま記述すれば良いと思うのですが,robot.txt の編集をする権利を持たないっていう人も少なく無い訳で,そうすると HTML の meta 要素のように,RSS 自体に組み込む仕組みが必要というわけですね. ぼくも RSS 1.0 ベースで考えてみました
Weblog: おのひろきおんらいん
Tracked: July 14, 2004 12:52 PM
Post a comment