Bulkfeeds の Similarity REST API で、どの単語が特徴的単語かを bulkfeeds:similarTerms というエレメントからとれるようにしました。[sample]
UPDATE: similarTerms の埋め込みが RDF 的にあんまよくないみたいなので、RSS 1.0 の方のAPIに埋め込むのはやめました。similar.xml あるいは terms.xml の方(↓)を使用してください。
Similarity API は RSS Feed の形で取得することができます。RSS Feed 形式の場合、特徴的単語をひいたあとに検索が走るため、ちょっと遅いです。それがイヤ、単語だけほしいんだ!というひとは、similar.xml の方をつかってください。[sample]
similarity の API は、url に Bulkfeeds でアグリゲートされている Permalink を入れる必要があります。Bulkfeeds に補足されてないけど、文字列から特徴的単語だけ抜き出したいという人は、http://bulkfeeds.net/app/terms.xml に POST で content パラメータに本文をいれてなげてください(エンコーディングは utf-8)。MT の記事作成時に特徴的単語を抜きたいときとかに使えるとおもいます(新規投稿時は、まだ Bulkfeeds にインデクスされていないので)
このAPIでなにか面白いアプリやプラグインをつくられた方は、このエントリまでコメントやTrackbackおねがいします。
>>かずきんさん
なるほど、RSS1.0 使ってるといろいろめんどくさいですね。。といりそぎはずしておいて .xml の方だけにしておきました。
>>asakura-tさん
はてなダイアリーに飛ばすのは面白そうですね。
はてなに存在するかどうかのAPIがあるといいんですけどね。
キーワードのAPIはちと重いからなぁ。