字体反爬案例分析与爬取实战
本节再分析一个反爬案例,该案例将真实的数据隐藏到字体文件里,使我们即使获取了页面源代码,也没法直接提取数据的真实值。
案例介绍
案例网站为 https://antispider4.scrape.center/ ,打开之后看着和之前的电影网站没什么不同。我们按照 7.7 节类似的分析逻辑来爬取一些信息,例如电影标题、类别、评分等,代码实现如下:
这里先用 Selenium 打开案例网站,等待所有电影加载出来,然后获取页面源代码,并通过 pyquery 提取和解析每一个电影的信息,得到名称、类别和评分,之后输出,运行结果如下: