报告：互联网上，73%流量来自网络爬虫 | 恶意爬虫防控指南 - 杂谈

Arkose Labs发布的2023年第三季度《恶意爬虫报告》显示，恶意爬虫程序及欺诈流量占互联网流量的73%，恶意爬虫已成为互联网安全的主要威胁之一。 以下从恶意爬虫增长原因、攻击方向、辨别方法及防控手段展开分析：

恶意爬虫增长原因

人工智能技术普及：人工智能技术的广泛应用降低了恶意爬虫的开发门槛，显著提升了其性能。例如，通过机器学习算法优化爬取策略，可绕过传统反爬机制，实现更高效的数据窃取。
黑灰产“犯罪即服务”（CaaS）模式：CaaS通过提供标准化攻击工具和服务，使非技术背景的攻击者也能发起恶意爬取。这种模式加速了攻击的商业化进程，导致黑灰产规模扩大，攻击频率上升。

恶意爬虫的主要攻击方向

恶意爬虫被广泛用于窃取数据、欺诈用户或破坏服务，对多个行业造成严重损失。受攻击最多的行业包括：

具体场景示例：

如何辨别恶意爬虫？

恶意爬虫通过随机IP、匿名代理、模仿人类行为等手段规避检测，但可通过以下特征识别：

有效的防控手段

针对恶意爬虫的智能化和复杂化，需采用多层次立体防控方案：

环境加固与链路加密：
定期检测平台和App运行环境，通过代码混淆、加壳等技术保护客户端安全。
对通讯链路进行加密传输，保障端到端安全性。
精准识别与拦截：
智能验证码：利用人工智能技术阻挡恶意爬虫盗取数据，在注册、登录等关键环节实时核验和拦截恶意行为。
设备指纹技术：监控代码注入、模拟器、root等风险，通过设备唯一标识符实现精准识别和风险评估。
Dinsight风控引擎：基于多维度数据（如请求信息、设备指纹、用户行为）分析异常行为，动态调整防控策略。
动态策略更新：
Xintell智能模型平台：深度分析风险数据和业务数据，挖掘潜在威胁并构建专属风控模型，实现安全策略的实时迭代。

总结

恶意爬虫已成为互联网安全的重大挑战，其增长源于技术普及和黑灰产商业化。通过分析攻击方向、辨别特征，并采用环境加固、智能识别和动态策略更新等手段，可构建全流程防控体系，有效降低恶意爬取风险。

报告：互联网上，73%流量来自网络爬虫 | 恶意爬虫防控指南