| D002 
 | 《数据分析与数据挖掘》课后基础题之题号清单(学时24~28)
 | 
 
    
      | 第1章 | 5、6、9、10、14、15 软件或编程练习:17
 | 
    
      | 第4章 | 7、8、10 软件或编程练习:计算协方差、相关系数、秩相关系数、列联系数、Cramer's V系数
 | 
    
    
      | 第5章 | 11、12 软件或编程练习:13、14、15、16
 | 
        
    
      | 第7章 | 9 软件或编程练习:10、11
 补充知识:简述主成分分析降维的主要工作原理。
 | 
    
      | 第8章 | 1、2、3、4、5 补充知识:频繁模式增长树会根据数据集绘制出树,会写出条件模式基就可以,理解递归过程。
 | 
    
    
      | 第9章 | 1、2、3、4、6、7、8、13、14、16、17 软件或编程练习:会建立ID3树、C4.5树和CART树。
 补充知识:需要掌握ID3的手工确定树的根,掌握代价树剪枝的具体计算,如17题。
 | 
    
    
      | 第10章 | 2、3、5 软件或编程练习:6、朴素贝叶斯分类。
 补充知识:掌握朴素贝叶斯分类的工作原理;理解多元正态分布贝叶斯的分界面;能对给定数据集,进行手工计算朴素贝叶斯的分类结果。
 | 
            
    
      | 第11章 | 1、2(补充,评价特征空间性能的一般性准则有哪些?)、3(特征空间变换的常见目的包括哪些?)4、7、8 软件或编程练习:9
 | 
   
      | 第12章 | 1、3、4、11、12、13、14、17、23、25、26 软件或编程练习:SVM模型进行鸢尾花数据集上的分类(线性核、多项式核、径向基核)
 补充知识:(1)硬间隔线性支持向量机的主要工作原理;(2)软间隔线性支持向量机的主要工作原理;(3)非线性SVM中核函数的作用。
 | 
   
      | 第13章 | 1、2、3、4、5、8、9、10、11、17、19 软件或编程练习:14、BP网络对鸢尾花数据集分类
 补充知识:(1)BP网络的输入编码和输出编码的常用方法;(2)BP网络如何实现非线性映射;(3)BP网络结构的ACON模式和OCON模式;(4)BP网络训练的收敛时机。
 | 
   
      | 第14章 | 3、4、5、6、7、8、14、16、18、19 软件或编程练习:11
 补充知识:(1)基于Bagging的决策树分类方法;(2)随机森林的主要工作原理;(3)XGBoost如何改善泛化性能。
 | 
        
    
      | 第15章 | 2、3、4、6、7、10、20 软件或编程练习:12、14
 | 
            
    
    | 书籍 | 姜维.《数据分析与数据挖掘》。电子工业出版社.2023. | 
  
    
    | 软件 | 各种软件或编程语言 |