мне нужно разобрать фид, но один из элементов (тег) имеет colon
<dc:creator>leemore23</dc:creator>
как я могу разобрать его с помощью lxml
? поэтому я сделал это таким образом
r = requests.get('http://www.site.com/feed/')
foo = (r.content).replace("dc:creator","dc")
tree = lxml.etree.fromstring(foo)
for article_node in tree.xpath('//item'):
data['dc'] = article_node.xpath('.//dc')[0].text.strip()
но я думаю, что есть лучший способ, что-то вроде
data['dc'] = article_node.xpath('.//dc:creator')[0].text.strip()
or
data['dc'] = article_node.xpath('.//dc|creator')[0].text.strip()
так что без замены
что вы можете мне посоветовать?
feedparser
библиотеку и не изобретать велосипед. - person Martijn Pieters   schedule 20.11.2012