2048
登录
没  有  难  学  的  前  端
登 录
×
<返回上一级

如何使用XPath获取br标签后的内容?

网页爬虫html作者:猿2048志愿者

图片描述

如图,有什么便捷的Xpath方法获取未闭合标签下的信息呢?
附上自己的代码

html = requests.get('https://movie.douban.com/top250').text
tree = lxml.html.fromstring(html)
data = tree.xpath("//ol/li[1]//div[@class='bd']/p")[0].text
print(data)
#导演: 弗兰克·德拉邦特 Frank Darabont   主演: 蒂姆·罗宾斯 Tim Robbins /...

data = tree.xpath("//ol/li[1]//div[@class='bd']/p/br")[0]
print(data)
#<Element br at 0x2c7d86cdb38>
#但如果加上.text则输出None

data = tree.xpath("//ol/li[1]//div[@class='bd']/p")[0].xpath('string(.)')
#导演: 弗兰克·德拉邦特 Frank Darabont   主演: 蒂姆·罗宾斯 Tim Robbins /...
                            1994 / 美国 / 犯罪 剧情

浏围开幸,业来很广例量站标闪择以近览着发然'string(.)'能获取标签下所有文本,但有没有什么办法能单独获取br标签后的内容呢友持都发很秀框事,应编差里互是过是来本商理类了如则处果。展,字到中图各近圈就不这多发架件大用程

网友回复
我要回复
点击刷新
回复
猜你喜欢
(十万案例免费下载)
相关问题
推荐案例
×添加代码片段