March 19, 2004

Bulkfeeds: Similarity API 更新

BulkfeedsSimilarity REST API で、どの単語が特徴的単語かを bulkfeeds:similarTerms というエレメントからとれるようにしました。[sample]

UPDATE: similarTerms の埋め込みが RDF 的にあんまよくないみたいなので、RSS 1.0 の方のAPIに埋め込むのはやめました。similar.xml あるいは terms.xml の方(↓)を使用してください。

Similarity API は RSS Feed の形で取得することができます。RSS Feed 形式の場合、特徴的単語をひいたあとに検索が走るため、ちょっと遅いです。それがイヤ、単語だけほしいんだ!というひとは、similar.xml の方をつかってください。[sample]

similarity の API は、url に Bulkfeeds でアグリゲートされている Permalink を入れる必要があります。Bulkfeeds に補足されてないけど、文字列から特徴的単語だけ抜き出したいという人は、http://bulkfeeds.net/app/terms.xml に POST で content パラメータに本文をいれてなげてください(エンコーディングは utf-8)。MT の記事作成時に特徴的単語を抜きたいときとかに使えるとおもいます(新規投稿時は、まだ Bulkfeeds にインデクスされていないので)


このAPIでなにか面白いアプリやプラグインをつくられた方は、このエントリまでコメントやTrackbackおねがいします。

Posted by miyagawa at March 19, 2004 02:08 AM | Permalink | Comments (2) | TrackBack(5)
Comments

>>かずきんさん
なるほど、RSS1.0 使ってるといろいろめんどくさいですね。。といりそぎはずしておいて .xml の方だけにしておきました。


Posted by: miyagawa on March 20, 2004 04:10 AM

>>asakura-tさん
はてなダイアリーに飛ばすのは面白そうですね。
はてなに存在するかどうかのAPIがあるといいんですけどね。
キーワードのAPIはちと重いからなぁ。

Posted by: miyagawa on March 20, 2004 04:16 AM
Trackbacks
TrackBack URL for this entry: http://blog.bulknews.net/mt3/mt-tb.cgi/849
Bulkfeeds を使って特徴的単語を表示
Excerpt: Bulkfeeds: Similarity Search を表示していると、ときどき「これどの単語でひっかけてんだよ」という謎の記事が関連付けられることがあります。記事一覧と一緒に関連付けに用いられた特徴的単語も表示できるといいなぁ、と思っていたら、特徴的単語を取得する API が用意...
Weblog: bricklife.*
Tracked: March 20, 2004 02:23 AM
中継君JSリリース
Excerpt: とっても小さなCGIである、中継君JSをリリースします。 どんなとき使うのか?と言いますと、 1. Jacascript を出力するサービスを使っているけど、応答がおせーよー 2. でもいいサービスだからつかいたいんだよな 3. しかも、別にリアルタイム応答は不要だし って場�...
Weblog: UnderDone jugem
Tracked: March 24, 2004 12:56 PM
オートニュー速
Excerpt: またくだらないHack。 オートニュー速 asahi.com の RSS から link を HTML 取得して本文らしきところを抜きだし、それを Bulkfeeds Similarity API に渡して形態素解析して、スコア上位2語を元のタイトル前後につけてます。すると、なんか2ちゃんねるニュー速スレ風タイ�...
Weblog: blog.bulknews.net
Tracked: March 25, 2004 06:12 PM
Similarity Hatena KeyWord Ver.1.0.0リリース
Excerpt: http://bulkfeeds.net/さんのところで公開されているAPIを使用して、特徴語上位10語を取得し、はてなキーワードとリンクする内容を表示するCGIを公開します。 [表示例] エントリページのエントリ内容下に表示している「Similarity H...
Weblog: UnderDone
Tracked: April 15, 2004 01:20 PM
キーワード抽出モジュールを作ってみた
Excerpt:  一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらって...
Weblog: Kazuho@Cybozu Labs
Tracked: April 26, 2006 04:13 PM
Post a comment