スクレイピングをしていて思った。

| コメント(0) | トラックバック(0)

もしかしたら...というか絶対mixiのプロフィール欄かき集めて秘密裏にデータベースを作ってる人が居るんじゃないかと。

show_friend.plに渡すidは連番だし、あのサイトと違って、mixiのプロフィール欄はスクレピングしやすいHTMLコードだ。
今日もどっかでbotちゃんが頑張っているにちがいない。

...といってもそんな一人一人のプロフィールは大した情報じゃないけどねぇ。
大量に集めたところで統計を取ってみると面白いことが分かるかもしれない。

---

Web::ScraperのCLIをさっき初めて試してみたけど、もっとはやくから触っておくべきだったと激しく後悔した。
[参考元:http://d.hatena.ne.jp/hetappi/20070830/1188491543]

FireBugsのXPathじゃ引っ張れないときとかあるからなぁ....。

トラックバック(0)

トラックバックURL: http://hoge.sub.jp/blog-cgi/mt/mt-tb.cgi/515

コメントする

このブログ記事について

このページは、Lyoが2007年11月12日 01:08に書いたブログ記事です。

ひとつ前のブログ記事は「PoCo::Server::TCPに大量のデータ送って大丈夫だっけ?」です。

次のブログ記事は「超薄型MacBookが出る?」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

OpenID対応しています OpenIDについて
Powered by Movable Type 4.261