大数据分析与挖掘

日期:2020-10-30点击率:11

本书是大数据分析与挖掘领域的入门教材, 全书共6章, 内容主要涵盖大数据分析与挖掘过程中用到的基本算法, 目的是通过算法原理的介绍, 使学生能更高效地将它们运用于数据分析与挖掘实务实践中。第1章主要介绍大数据分析与挖掘技术发展与应用的特点, 以及三种主流的工具。第2章主要讲解数据特征与预处理, 详细介绍了数据各种特征的描述方法、预处理技术, 以及Spark机器学习库中的数据预处理功能。第3章详细介绍了频繁模式挖掘的几种经典算法, 并结合Spark机器学习库进行实践, 对序列模式挖掘进行了了解。第4章详细介绍几种基本的分类与回归算法, 并结合Sklearn和Spark机器学习库进行实践。第5章详细介绍主流的聚类算法。第6章综合运用多种数据挖掘算法进行异常检测。