案例展示 STAC32 Assignment 2
编辑
24
2024-10-01
案例展示 STAC32 Assignment 2
任务介绍
在这个作业中,你需要独立完成所有任务。你可以与其他人讨论总体思路,但作业的编写和最终呈交必须完全由你独立完成。如果你提交的作业与其他学生过于相似,你可能会被要求解释原因。
在作业中遇到问题时,你需要自己解决。唯一的例外是,如果有些任务因为技术原因无法完成,例如无法读取数据文件。这与不了解如何做之间存在区别,前者可以联系我,而后者需要你自行解决。
提交要求
你必须提交一个已渲染的文档,显示代码、代码输出和你的答案。最终提交的文件应以 .html
为扩展名。未渲染的 .qmd
文件将不会被评分,因为评分者无法确认代码是否正常运行。提交后,请检查提交的文件是否正确并如预期显示。
提示
你应该频繁地渲染文档,并逐步解决任何出现的问题,而不是在最后时刻处理所有问题。如果渲染失败,通常是因为代码中存在错误,错误信息会提示你问题所在,你需要自行解决。
Baseball Cards
棒球卡片的数据集包含 59 名棒球球员的信息,其中球员可以分为“投手”(pitchers)和“野手”(fielders)。以下是一些数据列:
- height: 球员的身高(英寸)
- weight: 球员的体重(磅)
- bat: 球员击球的方式(左手、右手或双手)
- throw: 球员投球的方式(左手或右手)
- field: 球员是否为投手(0 表示投手,1 表示野手)
- average: 对于投手是防御率,数值越低越好;对于野手是击球率,数值越高越好。
数据来源:Rfit_baseball.csv
问题要求:
- 读取并显示部分数据。(2 分)
- 计算所有球员的体重均值和标准差。(2 分)
- 比较投手和野手的平均体重,哪个群体更重?(3 分)
- 分别计算投手和野手的
average
的中位数和四分位距,并解释为什么中位数差异如此大。(3 分) - 计算左手击球、右手击球和双手击球的野手的平均击球率,并统计每类击球员的人数。(3 分)
Acidity of Lakes
在美国东北部的 155 个湖泊中,测量了酸度指数,该指数表示为 lg_anc。
数据来源:acidity.csv
问题要求:
- 读取并显示部分数据。(1 分)
- 绘制酸度分布的直方图。(2 分)
- 考虑到我们关注的是 lg_anc 的均值,为什么使用 t 检验仍然是合理的?(2 分)
- 为 lg_anc 的总体均值计算 99% 的置信区间。(3 分)
- 检验 lg_anc 的总体均值是否为 5.32,假设备择假设是均值与 5.32 不同。(3 分)
US Regional Mortality
该数据集记录了 2011-2013 年美国按性别和城乡状态划分的死亡率数据,涵盖 10 个 HHS 区域。数据来源:USRegionalMortality.csv
问题要求:
- 读取并显示部分数据。(2 分)
- 显示与健康区域、死亡原因及死亡率相关的列。(2 分)
- 显示列名以 S 开头的列。(3 分)
- 显示列名中包含字母 A 的列。(2 分)
- 选择包含文本的数据列,而不是数字列。(3 分)
- 显示第 04 号健康区域的数据行。(2 分)
- 对每个健康区域显示心脏病的中位死亡率。(3 分)
- 显示死亡率大于 230 或死于癌症的记录及死亡原因。(3 分)
Car Repairs
1969 年的数据集中记录了 33 种汽车型号的维修记录,涉及多个维修类别(如刹车系统、燃油系统等)。数据来源:cars69_long.csv
问题要求:
- 读取并显示部分数据。(2 分)
- 统计每个汽车型号在多少维修类别上高于平均值,并保存结果。(3 分)
- 读取集群信息,并显示部分数据。(1 分)
- 创建一个包含汽车型号、维修类别和集群信息的数据框,并保存。(3 分)
- 绘制维修类别数量与集群信息的关系图,简要解释图表结论。(3 分)
联系我们
WeChat:pythonyt001
Email: [email protected]
- 0
-
分享