Quantcast
Channel: 初心者タグが付けられた新着記事 - Qiita
Viewing all articles
Browse latest Browse all 21085

PythonでRSSのスクレイピングする

$
0
0

lxml.etreeモジュールを使う

公式

importlxml.etree#ファイルを読み込む
tree=lxml.etree.parse('rss2.xml')#getroot()メソッドでXMLのルート要素い対応する
root=tree.getroot()#xpath()メソッドでXPathにマッチする要素をリストを取得
foriteminroom.xpath('要素を階層で指定'):#取得したいデータを指定し、取得

feedparserを使う

RSSのフォーマットを意識せずにスクレイピングできる。RSSフィードには、RSS1.0, RSS2.0,Atomなど複数フォーマットがあって、めんどくさいので、おすすめ。

公式

Dockerのタグがついたqiitaの記事を取得

importfeedparserd=feedparser.parse('https://qiita.com/tags/docker/feed')forentryind.entries:print(entry.link,entry.title)

とっても簡単なので、、、。定期実行して、自分用のRSSリーダー作れそう。。


Viewing all articles
Browse latest Browse all 21085

Trending Articles