当前位置:
首页
2020新版栏目
新书通报
Python 3反爬虫原理与绕过实战
本书描述了爬虫技术与反爬虫技术的对抗过程, 并详细介绍了这其中的原理和具体实现方法。首先讲解开发环境的配置、Web网站的构成、页面渲染以及动态网页和静态网页对爬虫造成的影响。然后介绍了不同类型的反爬虫原理、具体实现和绕过方法, 另外还涉及常见验证码的实现过程, 并使用深度学习技术完成了验证。最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。