HOOOS

动态网页抓取

使用Playwright抓取动态网页内容的实战技巧，以需要登录的页面为例

传统爬虫遇到动态加载内容就束手无策——页面数据通过AJAX异步加载、需要执行JavaScript才能渲染、登录状态校验严格。Playwright作为现代浏览器自动化工具，能完美模拟人类操作：支持Chromium/Firefox/...

400 2025/4/26 Playwright爬虫动态网页抓取自动化测试
Scrapy 遇上 Selenium：解锁动态网页抓取新姿势

在网络爬虫的世界里，Scrapy 框架以其高效、灵活的特点，赢得了众多开发者的青睐。然而，当面对那些需要 JavaScript 渲染才能完整呈现内容的动态网页时，Scrapy 往往显得有些力不从心。这时候，将 Scrapy 与 Selen...

301 2025/6/16 Scrapy Selenium 动态网页爬虫
Scrapy 结合 Splash 实战：动态网页数据抓取指南

许多现代网站使用 JavaScript 来动态加载内容，这给传统的 Scrapy 爬虫带来了挑战，因为 Scrapy 默认只能抓取静态 HTML。为了解决这个问题，我们可以将 Scrapy 与 Splash 结合使用。Splash 是一...

271 2025/6/18 Scrapy Splash 动态网页抓取