教学内容
1、数据分析的基本方法及流程。(重点)
2、关系数据库作为数据源与BI模型分析平台的连接配置,以及SQL语句的编程方法。(重点)
3、ID3决策树算、KNN最近邻算法、贝叶斯分类等有监督学习算法的应用场景点。(重点)
4、数据集中区分特征和目标变量的基本方法。(重点)
5、基于BI模型分析平台构建工程、实施数据分析的基本方法。(重点)
6、有监督学习算法和无监督学习算法的应用场景和区别。(难点)
7、有监督学习算法参数的理解及使用。(难点)
8、正确合理地设置挖掘流程,尤其是数据预处理环节,该环节可能会出现缺少流程、错误设置流程等情况。(难点)
9、BI模型分析平台操作流程的使用和调试;根据错误报告定位流程问题点的方法;对模型结果实施合理性的评估和解读。(难点)
学习要求
1、掌握数据库在数据分析应用中的作用。
2、了解有监督学习算法(ID3决策树算、KNN最近邻算法、贝叶斯分类等)的原理和应用场景。
3、能够在数据集中区分特征和目标变量。
4、掌握BI模型分析平台的基础操作流程和方法。
5、能够选择合适的数据分析算法解决具体问题。
6、能够利用BI平台进行基本的数据分析建模。
学习资源列表
1、SPOC微课视频:分类-朴素贝叶斯、分类-KNN、分类-决策树
2、实践任务
3、参考文献
(1)从决策树到随机森林:树型算法的原理与实现
(2)贝叶斯分类算法
(3)深入浅出KNN算法- KNN算法原理
(4)数据预处理
(5)TipDM大数据挖掘建模平台——操作手册
(6)Python数据挖掘建模平台简易操作手册
学习任务
第28讲:
1、自主学习SPOC视频资源。
2、完成实践任务:高阶项目-《基于有监督学习算法的鸢尾蝶数据分析与实践》;作业成绩计入平时成绩。
3、拓展阅读参考文献。
第29讲:
1、完成模型的后续应用-基于有监督学习算法的鸢尾蝶数据分析与实践;作业成绩计入平时成绩。
2、拓展阅读参考文献。

