いろいろと追加・削除など

大変遅まきながら、あけましておめでとうございます。

昨年末から本日にかけて、ページの追加・削除をしたり、昨年5月に少し説明した「更新されているのに上がってこない」現象にある程度対処しました。その中で、「データの不整合」が原因だったページについては、アンテナの運営元に問い合わせて対処をお願いしていたのですが、問い合わせに対する返事が半年以上なかったので、URLの末尾に「?」をつけたりするというかなり強引な方法で一応の対処をすることにしました。サーバへの負荷という意味では決して褒められたやり方ではありませんが、他に方法がありませんでした。

他に、アンテナで更新状況を取得できないページの中に女流棋士会があります。これは、検索エンジンなども拒否する「noindex,nofollow」の指定がなされているのが原因です。このため、ウェブ検索で女流棋士会のページを直接見つけることもできません。これは関してはページ作成者のポリシーの問題ですのでこちらでは対処できません。

カテゴリごとのページ

勝手に将棋アンテナは将棋に関連するページを中心に扱っています。つまり、上に来ているページへのリンクをたどれば、いつでの将棋関連の記事が見られるようになっているのが理想という方針です。プロ棋士などの書いたものは直接将棋に関係なくても将棋関連とみなすことにしているので、プロ棋士が著者のページはほぼ自動的に登録しています。そうでない人の書いているページの場合は、内容が一定水準を超えているなどの基準をクリアした上で、将棋についての記事がほぼ100%であれば問題ありません。

しかし、ときどき迷うのが、多数の人が読みたいと思うであろう記事がしばしば読めるものの、将棋に関する記事の割合がそれほど高くない場合です。この理由でアンテナに登録していないページは結構な数があります。そこで、その対策としてカテゴリごとのページを登録するという手法を以前より積極的に導入してみることにしました。例えば、梅田望夫氏のMy Life Between Silicon Valley and Japanは、将棋に関して読みがいのあることが書かれます。しかし、割合としてはそれ以外の記事の方が多く、直接登録するのはためらわれる感じです。(もちろん、それ以外の記事も読みたい方はたくさんいらっしゃると思います。しかし、アンテナの方針にはそぐわないということです。)そこで、「将棋」カテゴリのみを抽出して登録しておけば、将棋の記事だけにアンテナが反応するようにできるというわけです。

ただし、この手法がすべてのページに通用するわけではありません。条件が2つあります。一つはページの著者が「将棋」のカテゴリを設けていること。そうでない場合、ブログ内検索の結果などにリンクする方法もなくはありませんが、将棋の記事に「将棋」ということばが登場するとは限らないので確実性が低そうです。

もう一つは、ブログでカテゴリごとのRSSが配信されていること。最新記事のRSSはほぼ全てのブログで配信されていますが、それを特定カテゴリに限定したものとなると、意外にサポートされていないことが多いです。私の調べた範囲では、これが使えるのは次の3つのサービスしか見つかりませんでした。

このうち、livedoor blogでは手動でRSSのURLを指定しなければならないことが多いので、ご自分のRSSリーダーなどで利用される際には、下記のページを参考にしてください。

上記の3つのほかに、カテゴリごとのRSSに対応しているサービスがありましたら教えていただけると助かります。

本当は、RSSを配信していないページでも、勝手にRSSを作ってしまうというのが一番の対処法なのかもしれません。そのようなRSSがどの程度安定的に使えるのかがよくわからないので、今のところ活用していないのですが、goo フィードメーカーとか、Page2RSSとかいろいろありますね。それよりも、Yahoo! PipesとかPlaggerとかを利用して根本的にどうにかする方がいいのかもしれませんが、いろいろ試しながらいじっている時間的余裕がありません。そもそもどういうものなのかも今ひとつわかっていないくらいです。