<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
<title>blog.bulknews.net: Bulkfeeds</title>
<link>http://bulkfeeds.net/</link>
<description>RSS feed for Bulkfeeds updates.</description>
<language>ja</language>
<copyright>Copyright 2012</copyright>
<lastBuildDate>Thu, 15 Dec 2005 07:58:12 +0900</lastBuildDate>
<generator>http://www.movabletype.org/?v=3.2</generator>
<docs>http://blogs.law.harvard.edu/tech/rss</docs>

<item>
<title>Bulkfeeds Search module for Google HomePage</title>
<description><![CDATA[<p><a href="http://google-code-updates.blogspot.com/2005/12/google-releases-homepage-api.html">Google Homepage のモジュール (Widget) を定義できる API が公開</a> というわけで、さっそく Bulkfeeds のサーチボックスをつくってみました。</p>

<p><a href="http://blog.bulknews.net/mt/archives/googlehomepage.gif"><img alt="googlehomepage.gif" src="http://blog.bulknews.net/mt/archives/googlehomepage-thumb.gif" width="300" height="204" /></a></p>

<p><a href="http://bulkfeeds.net/googleig.xml">http://bulkfeeds.net/googleig.xml</a> を Create a Section のフィールドにいれれば追加できます。HTML をいれるだけなのでカンタン。Widget 上で HTTP でデータをやり取りしたければ、<a href="http://www.google.com/apis/homepage/guide.html#Proxy">GreaseMonkey っぽい HttpRequest</a> をつかって javascript でゴリゴリかけるようです。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001867.html</link>
<guid>http://blog.bulknews.net/mt/archives/001867.html</guid>
<category>bulkfeeds</category>
<pubDate>Thu, 15 Dec 2005 07:58:12 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Happy Birthday, Bulkfeeds!</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> が 10/30 で、2003年のローンチから数えて2歳になりました。</p>

<p><a href="http://www.flickr.com/photos/bulknews/44213815/" title="Photo Sharing"><img src="http://static.flickr.com/33/44213815_54b08ad005_m.jpg" width="240" height="180" alt="IMG_1374" style="border:0" /></a></p>

<p>今後ともよろしくおねがいします。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001846.html</link>
<guid>http://blog.bulknews.net/mt/archives/001846.html</guid>
<category>bulkfeeds</category>
<pubDate>Mon, 31 Oct 2005 15:27:57 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds is unavailable now</title>
<description><![CDATA[<p>Bulkfeeds が本日 9:45 ごろよりアクセスできない状態となっています。ホストしているマシンが物理的にダウンしているためで、現在 iDC の方に復旧をお願いしています。なお、DNSBL (rbl.bulkfeeds.jp) は別ホストで運用していますので影響はありません。</p>

<p><strong>UPDATE:</strong> 12:24 復旧しました。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001844.html</link>
<guid>http://blog.bulknews.net/mt/archives/001844.html</guid>
<category>bulkfeeds</category>
<pubDate>Thu, 27 Oct 2005 12:16:22 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: DNSBL の登録状況を RSS でトラック</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> の DNSBL と SPAM Submission を開始して5日がたちますが、おかげさまで多くの方に利用していただいているようです。<a href="http://bigfield.ddo.jp/diary/20051013.html#p01">tDiary</a> や <a href="http://blog.cles.jp/item/1107">Nucleus</a> でも DNSBL のプラグインが出ているようですね。</p>

<p>現状 DNSBL への登録は、SpamSubmission や SPAM フィルタから自動的にキューイングされたデータを、半自動的にフィルタリングした後、マニュアルでチェックして反映しています。十分注意して運用していますが、SPAM ではないサイトが登録されてしまう可能性がないともいえません。そこで、RSS フィードを利用して DNSBL への登録状況をトラックできるようにしてみました。</p>

<p><a href="http://blog.bulknews.net/mt/archives/rssdnsbl.gif"><img alt="rssdnsbl.gif" src="http://blog.bulknews.net/mt/archives/rssdnsbl-thumb.gif" width="300" height="89" style="border: 0" /></a></p>

<p><a href="http://bulkfeeds.net/app/lookup_rbl">Lookup Blacklist</a> の検索結果に RSS フィードのアイコンが用意されています。たとえばこの Blog の登録状況は <a href="http://bulkfeeds.net/app/lookup_rbl.xml?url=blog.bulknews.net">この URL</a> でトラックできます。Blacklist に登録されているかどうかによって、生成される RSS の item:title や item:description が変化しますので、RSS リーダーで Subscribe しておけば、間違って登録されることがあってもすぐ気づくことができます。（そのような場合は bulkfeeds at bulknews.net までご連絡ください）</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001838.html</link>
<guid>http://blog.bulknews.net/mt/archives/001838.html</guid>
<category>bulkfeeds</category>
<pubDate>Mon, 17 Oct 2005 01:21:40 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: SPAM ブラックリストの公開、Submission API と MT プラグイン</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> では、<a href="http://blog.bulknews.net/mt/archives/001828.html">ボランティアによる SPAM サイト登録</a> と、自作の SPAM フィルタによるブラックリストの強化を行ってきましたが、<a href="http://bulkfeeds.net/app/blacklist">API による公開</a>の準備ができたのでお知らせします。</p>

<p>今回の API および機能拡充は以下のリストから構成されます。</p>

<p>1. DNS によるブラックリスト問い合わせ API の公開（ベータ）<br />
2. Movable Type の JunkFilter フレームワークと連携した自動登録<br />
3. REST による ブラックリストへの URL 登録 API の公開</p>

<p><br />
</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001834.html</link>
<guid>http://blog.bulknews.net/mt/archives/001834.html</guid>
<category>bulkfeeds</category>
<pubDate>Wed, 12 Oct 2005 03:43:57 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds Bot on FeedBurner</title>
<description><![CDATA[<p>先日 GMO アフィリエイトとの提携で来日していた <a href="http://www.feedburner.com/">FeedBurner</a> の Steve Olechowski (CEO) と Eric Lunt (CTO) に会う機会がありました。Eric とは以前からメールで何度かやりとりしたことがあったのですが、2人ともナイスガイで、日本での取材やミーティングを楽しんでいるようでした。</p>

<p>Eric とは頻繁にメールをやりとりするようになり、FeedBurner で <a href="http://bulkfeeds.net/">Bulkfeeds</a> のクローラを Bot として登録したと教えてくれました。Bulkfeeds では現在 Atom を未サポートなので、SmartFeed を利用時には RSS 2.0 が返るように登録してあるようです。</p>

<p><a href="http://blog.bulknews.net/mt/archives/feedburner.gif"><img alt="feedburner.gif" src="http://blog.bulknews.net/mt/archives/feedburner-thumb.gif" width="400" height="136" style="border:0" /></a></p>

<p>というわけで FeedBurner を利用している方は、Readership 画面で ↑ のように Bulkfeeds のクローラがきているか確認できます。もしうまくきていない場合には、http://bulkfeeds.net/rpc まで update ping を打ってみてください。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001832.html</link>
<guid>http://blog.bulknews.net/mt/archives/001832.html</guid>
<category>bulkfeeds</category>
<pubDate>Sun, 09 Oct 2005 15:20:15 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: Update Log 2005.10.08</title>
<description><![CDATA[<p>ひさしぶりに Blog サービスプロバイダのアグリゲートを見直した結果、新着がうまく拾えていないサービスがいくつか見つかったので、もろもろ修正を行いました。Livedoor が1週間ほど拾えてなかったのはちょっと痛いですね。<a href="http://bulkfeeds.net/app/stats.html">Stats</a> の新規追加フィードにも如実にあらわれてます。(Livedoor Blog は SPAM の率も高いのでその分はよかったかもしれませんが。。。）</p>

<p>また、韓国・中国系のサイトがいくつかひっかかってくる事例がみつかっていますのでフィルタを組み込みました。</p>

<p>r1663: search2 検索結果の「検索にかかった秒数」を小数点以下2桁表示に変更<br />
r1661: 中国・韓国系サイトをフィルタするモジュールを SPAM フィルタに追加<br />
r1659: JUGEM, ラブログのアグリゲートを高速化; goo Blog, AOL Diary, ヤプログのアグリゲートを修正<br />
r1658: Livedoor Blog の新着 RSS が変更されていたのに対応<br />
r1657: FAQ の ping 送信ドキュメントを更新<br />
r1656: ブログ人のアグリゲートロジックを修正<br />
r1655: TypePad Japan をアグリゲートサイトに追加<br />
</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001831.html</link>
<guid>http://blog.bulknews.net/mt/archives/001831.html</guid>
<category>bulkfeeds</category>
<pubDate>Sun, 09 Oct 2005 15:09:51 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: Update Log 2005.10.07</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> のアップデートフィードを http://blog.bulknews.net/bulkfeeds.xml に作成するように変更しました。以前の更新フィードを登録していた方は、自動で 301 Redirect されるはずです。今後 bulkfeeds カテゴリに日々の更新情報をポストしていくことにします。</p>

<p>以下は subversion （公開してませんが）のリビジョンのうち、サイト機能にかかわるもののリストです。</p>

<p>r1654: report_spam ページで url パラメータを canonical URL に変更<br />
r1652: アサブロ http://asahi-net.jp/asablo/ をアグリゲートに追加<br />
r1651: Developer 登録プログラムのメール送信部のバグを修正<br />
r1650: report_spam ページで TypeKey login ができないバグを修正<br />
r1649: バージョン番号を svn の Revision から取得するように変更 クローラの User-Agent: を修正<br />
r1648: クエリがない場合の search2 ページと index を統合、whatsnew の再表示<br />
r1647: rssitem のタイトル・本文取得メソッドの不具合を修正<br />
r1643: SpamReport bookmarklet の追加、rssad.jp の広告を strip するモジュール追加<br />
</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001829.html</link>
<guid>http://blog.bulknews.net/mt/archives/001829.html</guid>
<category>bulkfeeds</category>
<pubDate>Fri, 07 Oct 2005 21:06:32 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: SPAM Blog / Fake Blog のレポートを開始</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> で、SPAM Blog / Fake Blog の URL 登録を開始しました。Bulkfeeds の検索結果に SPAM Blog っぽいのを見つけたり、Google など他の検索エンジンで見つけたサイトも SPAM サイトとして登録することができます。</p>

<p>Bulkfeeds をふだん利用している場合には、検索結果画面のリンクにある [!] をたどる（スクリーンショット参照）か、<a href="http://bulkfeeds.net/app/report_spam">Report SPAM</a> ページから URL を登録することができます(*1)。</p>

<p><a href="http://blog.bulknews.net/mt/archives/report_spam.gif"><img style="border:0" alt="report_spam.gif" src="http://blog.bulknews.net/mt/archives/report_spam-thumb.gif" width="400" height="47" /></a></p>

<p>また、<a href="http://bulkfeeds.net/app/developer.html">API ページ</a> に <a href="http://bulkfeeds.net/app/developer.html#bookmarklet-report-spam">Bookmarklet</a> を用意しておきました。ブラウズしているページの URL を Spam として簡単にレポートすることができます。</p>

<p>登録していただいた URL は手動でチェックし、SPAM blog / Fake Blog と判断された場合には、Bulkfeeds のブラックリストに登録されます。すでに <a href="http://blog.bulknews.net/mt/archives/001815.html">SPAM Blog 検知のフィルタ</a> は開発・動作済みでかなりの精度を出していますが、それでも対策しきれない SPAM サイトも存在しています。Blog 検索精度の向上にぜひご協力をお願いします。もちろん、今後サブミットしていただいたデータやフィルタリングによる検出結果をなんらかの形でユーザのみなさんに還元できる形を検討しています。</p>

<p>*1) 検索結果の RSS 内 content:encoded にリンクを含めることもできるのですが、余計なメタデータを配信することで remix のさまたげになるのは好ましくないため、現状は bulkfeeds:reportSpamLink というエレメントにリンク先を追加してあります。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001828.html</link>
<guid>http://blog.bulknews.net/mt/archives/001828.html</guid>
<category>bulkfeeds</category>
<pubDate>Thu, 06 Oct 2005 16:50:40 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds: Fighting with SPAMs</title>
<description><![CDATA[<p>Google Blog Search や Ask.jp の参入で盛り上がりを見せている Blog 検索ですが、<a href="http://bulkfeeds.net/">Bulkfeeds</a> も地道にバージョンアップしています。</p>

<p>スケールや速度で Google などに真っ向勝負するのはちょっと無理があるので、</p>

<p>* ノイズのすくない検索結果を<br />
* リーズナブルな速度 （エントリの反映は更新から1時間以内、検索レスポンスは 3秒以下) </p>

<p>で提供する、あたりをリーズナブルな目標にしようかなとチューニングしています。フィードリーダーでキーワードを追いかけたり、ちょっといま流行しているキーワードを調べる（<a href="http://bulkfeeds.net/app/search2?q=%E5%AE%89%E9%81%94">安達</a>, <a href="http://bulkfeeds.net/app/search2?q=%E3%81%AE%E3%81%BE%E3%83%8D%E3%82%B3">のまネコ</a> など）といった用途に特化しようかな、と。</p>

<p>ということでいま一番力をいれているのがいわゆる Fake Blog や、SPAM Blog, API によるアフィリエイト自動生成 Blog への対策です。かなり経験則重視ですが、ドメイン名・URL・本文・リンク数・文字キャラクタセットなどをベースにしたフィルタルールをつくって、極力こうした Blog をはじくように先ほどバージョンアップしました。いまのところかなりイイ感じで動いています。</p>

<p>実際には、このフィルタの副作用として、SPAM ではない Blog も SPAM 判定されてしまうこともあるかと思いますが、先にあげた目標を実現するにはこちらの方針のほうがよいと判断しました。</p>

<p>また、上記の目標の実現のため、より多くの Blog をクロールするようにアグリゲータも改良していますが、ストレージの限界もあるため、1週間以上古いエントリはインデクスしないように修正しています。なので検索結果の件数だけで比較されると困ってしまうのですが、直近3日以内などの条件で比較してもらうとかなり有意な数字が出るのではないかと思います。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001813.html</link>
<guid>http://blog.bulknews.net/mt/archives/001813.html</guid>
<category>bulkfeeds</category>
<pubDate>Thu, 15 Sep 2005 13:24:05 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds のフィードが100万件を突破</title>
<description><![CDATA[<p><a title="Bulkfeeds: Home - RSS Directory & Search" href="http://bulkfeeds.net/">Bulkfeeds: Home - RSS Directory & Search</a><br />
<blockquote>2005/05/16 09:27 現在 1,001,148 件の RSS が登録され、3,273,950 件の item がインデクスされています。</blockquote></p>

<p>Bulkfeeds の登録フィードが100万件を突破しました。</p>

<p>また連休中にいくつかソフトウェアのバージョンアップをしています（あまりユーザに見える部分での変化はないんですが）。</p>

<p>* 検索結果の時刻に「2時間前」などを付加<br />
* クローラ・インデクサのロジックを改良・最適化（現状15分〜2時間ほどでインデクスされます）<br />
** RSS パーサの一部を LibXML 化<br />
** ホスティングサービスの RSS Auto-Discovery を行わずヒューリスティックに URL 変換<br />
* 携帯版に Buzzwords を掲載<br />
* アフィリエイト SPAM ブログへの対策を強化（まだ完全ではありません）<br />
</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001703.html</link>
<guid>http://blog.bulknews.net/mt/archives/001703.html</guid>
<category>bulkfeeds</category>
<pubDate>Mon, 16 May 2005 09:33:22 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds is down (again)</title>
<description><![CDATA[<p>現在マシンの IP アドレス変更に伴うトラブルのため Bulkfeeds にアクセスができない状態となっています。4/4 11:00 以降に復旧の予定です。たびたびで申し訳ありません。</p>

<p>→ 2005/04/04 14:00 復旧しました。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001625.html</link>
<guid>http://blog.bulknews.net/mt/archives/001625.html</guid>
<category>bulkfeeds</category>
<pubDate>Sun, 03 Apr 2005 21:09:09 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds メンテナンス中</title>
<description><![CDATA[<p>Bulkfeeds ですがサーバの HDD に障害が発生していて、断続的にアクセスできない状態となっています。現在対応およびインデクスの再構築などを行っておりますが、復旧の見通しはたっておりません。</p>

<p>ご迷惑をおかけしますがご了承ください。</p>

<p><strong>UPDATE</strong>: 現在ハードウェアおよびOSの入れ替え作業を行っております。3/31 ごろには復旧できるかと思います。→ 3/31 17:30 ごろ復旧しました。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001610.html</link>
<guid>http://blog.bulknews.net/mt/archives/001610.html</guid>
<category>bulkfeeds</category>
<pubDate>Thu, 24 Mar 2005 22:08:22 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds モバイル: 京ぽんのデフォルトをモバイルテンプレートに変更</title>
<description><![CDATA[<p><a title="Bulkfeeds モバイル対応: blog.bulknews.net" href="http://blog.bulknews.net/mt/archives/001439.html">Bulkfeeds モバイル対応: blog.bulknews.net</a><br />
<blockquote>うまくいかない場合や、PC から携帯版にアクセスしたい場合には http://bulkfeeds.net/app/index.mob で見ることができます。</blockquote></p>

<p><a href="http://www.kyocera.co.jp/prdct/telecom/consumer/ah-k3001v/">京セラの AH-K3001V</a> Opera バージョンで、モバイル版がデフォルトで出るようにしました。PC 版を見たい場合には、http://bulkfeeds.net/app/index.html へアクセスしてもらえれば大丈夫だと思います。</p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001443.html</link>
<guid>http://blog.bulknews.net/mt/archives/001443.html</guid>
<category>bulkfeeds</category>
<pubDate>Sun, 12 Dec 2004 08:33:12 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>
<item>
<title>Bulkfeeds モバイル対応</title>
<description><![CDATA[<p><a href="http://bulkfeeds.net/">Bulkfeeds</a> で携帯電話ブラウザからのアクセスに対応しました。URL は そのまま http://bulkfeeds.net/ です。User-Agent を見て自動的にテンプレートを切り替えています。うまくいかない場合や、PC から携帯版にアクセスしたい場合には http://bulkfeeds.net/app/index.mob で見ることができます。</p>

<p>機能的には、現在RSS記事の検索、および検索結果の記事本文(content:encoded や description) のブラウズが可能です。RSS に本文が含まれない場合は、元ページへのリンクと、Google の WAPProxy 経由のリンクを提供しているのでそちらでブラウズするとよいかと思います。</p>

<p>現在 iモードのみ対応を確認していますが、vodafone, au, AirH" Phone でもアクセスできるかと思います。何か不具合等ありましたらお知らせください。</p>

<p>QR コードもはっておきます。</p>

<p><img src="http://gorou.zapto.org/ruby/url2qrcode/cache/6e023b35de34bfe4c16c5c247c0ec9df.png" alt="http://bulkfeeds.net/" /></p>]]></description>
<link>http://blog.bulknews.net/mt/archives/001439.html</link>
<guid>http://blog.bulknews.net/mt/archives/001439.html</guid>
<category>bulkfeeds</category>
<pubDate>Fri, 10 Dec 2004 13:06:21 +0900</pubDate>
<dc:creator>miyagawa</dc:creator>
</item>


</channel>
</rss>

