无名商城论坛

搜索
查看: 416|回复: 0

[其他技术] 【代码分享】Python正则爬取数据

[复制链接]

1万

主题

1万

帖子

3万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
32464
发表于 2022-5-8 18:54:32 | 显示全部楼层 |阅读模式
所需包 request re

爬取豆瓣电影高分榜

import requests
import re
headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; U; Android 8.1.0; zh-cn; BLA-AL00 Build/HUAWEIBLA-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/8.9 Mobile Safari/537.36'
}

url = '
本帖隐藏的内容需要【资源会员】才可浏览,您需要升级才可浏览,点击这里升级【资源会员】

response = requests.get(url)
results = re.findall('.*?href="(.*?)".*?cover.*?src="(.*?)"\salt="(.*?)">.*?(.*?).*?meta.*?>(.*?).*?recommend.*?>(.*?)',response.text,re.S)
for result in results:
      #print(result)
      print(result[0],result[1],result[2],result[3],result[4])
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表