AKIBA PC Hotline!がうまく取れない
AKIBA PC Hotline!のフィードがとりあえずできた。
ただし全文フィードではなく(全文のも作ったけど)あえて見出しのみ。これは前の記事でGreasemonkeyで取れることがわかったので、Pipesでフェッチしまくるよりもそのほうがいいかなと思ってそうしたのだが、強制的に全文読める…のではなかった。データベース: LDRFullFeed - wedataにそれぞれのページの本文を抜き出すXPathが書いてあって、スクリプトはその情報を元に本文を抜き出して表示するようになっている。オレンジニュースで全文読めていたのはURLがたまたまデータベースに登録されていたからだった。
ということで、AKIBA PC Hotline!も全文読めるようにしようと思ってそれぞれのページのHTMLを眺めつつXPathを作ってみる(http://pearl-white.hp.infoseek.co.jp/xpath/が超便利)。凝ればもっと複雑にもできそうだが、とりあえずシンプルに
/html/body/table[2]/tr/td[1]/*
で本文を取れそうだ。YQLでも確認(日本語は化けるけど)。データベースに登録した。
そしてGoogle Readerで[G]ボタンが出たのでぽちっと押してみると…「Error : This SITE_INFO is unmatched to this entry」。えー、なんでー?
(いまここ)