Python爬虫怎么循环截取html标签中间的内容？

要循环匹配，截取一个页面里面的所有所需求的数据，定位前后两个html标签，然后获取中间的内容！

最新回答

枫林渡口初相遇

2024-06-01 05:04:14

如果是中间的数据直接就用bs4最简单

from bs4 import BeautifulSoup

#这里是请求过来的额数据处理，提取标签

html = BeautifulSoup(response.text, 'html.parser')

body = html.body # 获取body部分数据

div = body.find("div",{'id','today'}) #用find去找div标签，id叫 today的标签里面的数据

就可以了

如果要提取标签内容比如value的值

div = body.find("input",id='hidden_title')['value']

失约

2024-06-01 01:11:21

正则表达式匹配
或者xpath进行匹配

追问

能打个代码案例给我吗

我要回答

匿名回答

热门标签