目录

  • 1 项目介绍
    • 1.1 项目背景
    • 1.2 项目环境
  • 2 项目任务
    • 2.1 新型冠状病毒数据分析项目数据采集与清洗
    • 2.2 新型冠状病毒数据分析项目数据分析与可视化
    • 2.3 新型冠状病毒数据分析项目模型训练
  • 3 项目报告
    • 3.1 数据采集
    • 3.2 数据分析与可视化
    • 3.3 模型训练
新型冠状病毒数据分析项目数据分析与可视化

任务名称:新型冠状病毒数据分析项目数据分析与可视化

子任务一

数据集:


步骤一:测试环境和读取数据集

示例文件:


1.在本机上打开jupyter notebook工具,打开 2-5-1.ipynb文件,输入"hello,world"并运行,测试运行环境,测试成功则截图并保存,图片保存到考生文件夹下,并命名为“测试环境.png”。

2.导入pandas、matplotlib、seaborn库,截图并保存,图片保存到考生文件夹下,并命名为“导入第三库.png”。

3.读取数据集base.csv,打印显示原始数据前5行,查看数据集的shape属性,截图并保存,图片保存到考生文件夹下,并命名为“数据集.png”。

步骤二:数据分析与可视化

1.使用plt.rcParams['font.sans-serif']=['SimHei']语句添加中文字符,使用heatmap()函数绘制热力图查看数据集base.csv各个列缺失值的情况,热力图标题设置为“热力图查看缺失值情况图”,查看结果截图并保存,图片保存到考生文件夹下,并命名为“缺失值热力图.png”。

2. 选取数据集中5-8行数据,使用heatmap()函数绘制热力图分析多地区确诊病例、死亡病例、疑似病例数量等的分布情况,具体参数设置要求:热力图显示颜色柱,色彩颜色cmap参数设置为"Reds"。热力图保存到考生文件夹下,并命名为“病例分布热力图.png”。

3.保存2-5-1.ipynb到考生文件夹下。

步骤三:撰写报告

1.新建word文档,结合任务2结果以及C:\data\2-5-1\路径下的图片,撰写项目分析报告,要求图文并茂,根据数据和图片进行分析,例如:结合实际情况具体分析疫情发展变化情况;结合图片分析国内外疫情变化趋势,为科学防控提出合理性建议等。

2.文档中各级标题、正文应分别统一字体、字号、行距、段前缩进等基本排版要素。文档中的图片、表格应有对应的图题、表题,其中图题在图片下方,表题在表格上方。

3.保存word文档到考生文件夹下,并命名为 “项目报告.docx”。

子任务二

数据集:


步骤一:测试环境和读取数据集

示例文件:


1.在本机上打开jupyter notebook工具,打开 2-5-2.ipynb文件,输入"hello,world"并运行,测试运行环境,测试成功则截图并保存,图片保存到考生文件夹下,并命名为“测试环境.png”。

2.导入pandas、matplotlib、seaborn库,截图并保存,图片保存到考生文件夹下,并命名为“导入第三库.png”。

3.读取数据集data.csv,打印显示原始数据后5行,查看数据集的shape属性,截图并保存,图片保存到考生文件夹下,并命名为“数据集.png”。

步骤二:数据分析与可视化

1.使用plt.rcParams['font.sans-serif']=['SimHei']语句添加中文字符。根据data.csv数据集,求取武汉市的死亡率(通过confirmed、dead列求得),并绘制死亡率的箱型图,箱型图标题设置为“数据箱型图”,查看结果截图并保存,图片保存到考生文件夹下,并命名为“箱型图.png”。

2.编写程序,使用语句,将数据集中日期格式进行转换,例如:data.index = pd.to_datetime(data['date'])。

3.选取武汉市的数据,绘制折线图,显示确诊病例数、治愈病例数、死亡病例数随时间的变化情况,设置要求如下:三条折线显示在同一个图中,三条折线显示不同的颜色,显示图例,图片标题设置为“疫情变化折线图”。显示图片保存到考生文件夹下,并命名为“疫情变化折线图.png”。

4.保存2-5-2.ipynb到考生文件夹下。


步骤三:撰写报告

1.在考生文件夹下,新建word文档,结合任务2结果以及C:\data\2-5-2\路径下的图片,撰写报告,要求图文并茂,具体分析数据集反应的基本情况,并对图片反应出来的疫情变化情况做简要分析。

2.文档中各级标题、正文应分别统一字体、字号、行距、段前缩进等基本排版要素。文档中的图片、表格应有对应的图题、表题,其中图题在图片下方,标题在表格上方。

3.保存word文档到考生文件夹下,并命名为 “项目报告.docx”。 

作品提交要求:

①在目录“C:\exam\submit\”下建立以“机位号_题号”命名的考生文件夹,所有提交文件均放在该目录下。例如:张三考试的机位号为30,试题编号为2-5-2,则考生文件夹为“C:\exam\submit\30_2-5-2”

② 将各任务源文件分别保存在考生文件夹下,运行结果分别截图并保存。