news 2026/4/16 18:31:31

【BUG】【Python】【爬虫】爬取加载中的数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【BUG】【Python】【爬虫】爬取加载中的数据

示例网页链接:https://movie.douban.com/subject/36907263/

BUG

浏览器开发者模式可以看到所需信息有对应的HTML显式结构

但代码爬取时发现结构被hidden,需要二次加载

importrequests url='https://movie.douban.com/subject/36907263/'headers={'User-Agent':'Mozilla/5.0'}response=requests.get(url,headers=headers)print(response.text)


即便使用selenium将修改type属性,让其不隐藏,再取出被隐藏的数据,也不行

fromseleniumimportwebdriver driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')js="document.getElementById('red').type='text';"driver.execute_script(js)content=driver.find_element(by='id',value='red').textprint(content)driver.quit()



其实我觉得这个逻辑是对的,但结果非预期,求助是不是哪块代码没写对? T^T 想打印下修改后的HTML也没打印出来 o(╥﹏╥)o

DEBUG

Selenium 的核心功能是模拟用户在浏览器中的操作,所以只需要增加等待时间,等待页面全部加载出来即可。加载后的页面就是我们在浏览器开发者模式下看到的全部HTML结构。

fromseleniumimportwebdriverimporttime driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')time.sleep(5)# 等待页面加载content=driver.find_element(by='id',value='info').textprint(content)driver.quit()


注意加载后要找的就是加载后的数据,即id=info,不再是之前的id=red。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:50:47

【BUG】【Python】清除字符串空格问题

BUG strip()后依旧有空格DEBUG strip()只清除字符串前后的包括空格、制表符、换行符等),中间的不处理。这时使用replace即可

作者头像 李华
网站建设 2026/4/16 12:59:21

五大智能建站工具真实测评:不画饼,真能上线那种

最近在搞一个支付平台的项目,我前端水平一般,实在不想花几周去啃UI框架。干脆试了一圈AI建站工具,结果还真发现了几个能打的——不光能生成页面,连后台逻辑、数据对接都能搞定,几分钟就能搭出能跑起来的应用。 下面这…

作者头像 李华
网站建设 2026/4/16 18:15:34

人群仿真软件:Vadere_(6).Vadere中的障碍物设置

障碍物设置 在人群仿真软件Vadere中,障碍物的设置对于模拟真实环境中的各种情况至关重要。障碍物可以是墙壁、柱子、家具等,这些障碍物会影响行人的行走路径和行为。本节将详细介绍如何在Vadere中设置障碍物,包括障碍物的定义、添加、编辑和…

作者头像 李华
网站建设 2026/4/13 9:21:44

免费工艺流程模板下载_在线编辑建筑/汽车/物流工艺流程图图表

良功绘图网站 (https://www.lghuitu.com ) 在建筑、汽车、物流等行业的日常运营与项目推进中,工艺流程可视化是提升效率、规范管理的核心手段。无论是建筑工程的施工管控、汽车制造的生产线优化,还是物流行业的仓储配送调度,一份清晰、规范的…

作者头像 李华
网站建设 2026/4/16 12:42:24

AI金融风控:智能反欺诈与个性化理财

一、AI金融风控的核心价值与行业背景 随着数字金融的快速迭代,金融欺诈手段呈现智能化、隐蔽化、团伙化趋势,传统风控模式面临严峻挑战。2023年某电商平台披露数据显示,全年因恶意刷单、账号盗刷等造成的损失超2.3亿元,某银行信用…

作者头像 李华