课后作业:决策树(Decision Tree)与随机森林(Random Forests)

作者:欧新宇(Xinyu OU)

本文档所展示的测试结果,均运行于:Intel Core i7-7700K CPU 4.2GHz

【作业提交】

将分类结果保存到文本文档进行提交(写上每一题的题号和题目,然后再贴答案),同时提交源代码。

  1. 测试结果命名为: ex06-结果-你的学号-你的姓名.txt
  2. 输出图片命名为: ex06-性能对比图-你的学号-你的姓名.png (.jpg)
  3. 源代码命名为: ex06-01-你的学号-你的姓名.py, ex06-02-你的学号-你的姓名.py, ex06-03-你的学号-你的姓名.py

*结果文件,要求每小题标注题号,两题之间要求空一行*


要求在 “糖尿病预测” 数据集上分别使用决策树与随机森林完成以下任务,要求如下:

  1. 要求训练集和测试集的分割比例为75%:25%
  2. 使用决策树模型输出树的深度分别为3和5的得分,要求同时输出训练集和测试集上的评分结果。(ex06-01)
  3. 使用随机森林模型输出森林中树的个数分别为4和6的得分,随机数种子=8,要求同时输出训练集和测试集上的评分结果。(ex06-02)
  4. 同时使用决策树(树深度={1:20})和随机森林(树的棵树={1:20})进行建模,并输出性能对比图。(ex06-03, ex06-性能对比图)
  • 决策树
  • 随机森林
  • 性能对比