本课程由黑马程序员提供。
订票网站提供查询、预订服务,有用户访问,也存在爬虫。爬虫消耗了系统资源,却没有转化成销量,导致系统虚耗,造成系统波动。为了爬虫访问,需要开发大数据防爬工具。 项目采用Lua+Spark+Redis+Hadoop框架搭建,包含状态监控,反爬指标配置,运营指标监控展示等功能。
项目分为七个阶段,本阶段根据已经算出的八项指标结果,进行爬虫识别、剔除非爬虫数据、写入Redis,写入HDFS,Redis数据恢复等。
课程第一阶段链接:https://edu.aliyun.com/course/2064
课程第二阶段链接:https://edu.aliyun.com/course/2065
课程第三阶段链接:https://edu.aliyun.com/course/2069
课程第四阶段链接:https://edu.aliyun.com/course/2070
课程第五阶段链接:https://edu.aliyun.com/course/2071
课程第六阶段链接:https://edu.aliyun.com/course/2074
课程第七阶段链接:https://edu.aliyun.com/course/2075