这是关于FIT5137课程作业2的详细说明,作业要求为M – Stay公司设计并开发数据仓库,并从该数据仓库生成BI报告。具体包括设计数据仓库(进行数据探索和清理,并绘制星型/雪花型模式图)、实施设计(使用SQL创建事实表和维度表)、进行数据分析(通过SQL查询探索数据并呈现发现),最后以报告、海报和视频的形式提交作业。作业提交截止日期为2024年9月20日下午4点30分,逾期提交将每天扣除5%的分数,截止日期为2024年9月27日下午4点30分。
FIT5137作业2 – 2024年第二学期(权重 = 40%)
截止日期 – 2024年9月20日星期五,下午4:30
版本:3.0 – 2024年8月14日
一般信息和提交
这是一项个人作业。
提交方式:通过Moodle在线提交。
逾期提交惩罚:每天扣除5%。
作业常见问题解答:在EdStem论坛上为作业2设置了一个作业常见问题解答页面。
问题描述
M – Stay是一家为墨尔本周围的莫纳什学生和工作人员提供寄宿家庭和租赁服务的住宿服务公司。该公司有一个现有的运营数据库,用于维护和存储管理层日常运营所需的所有业务交易信息(例如,房产、房东、房源、预订等)。随着业务的增长,M – Stay决定建立一个数据仓库来提高他们的分析和工作效率。然而,由于M – Stay的工作人员在商业智能和数据仓库方面的知识有限,他们决定聘请您来设计、开发并从数据仓库快速生成BI报告。 MStay账户中可以找到运营数据库表。例如,您可以执行以下查询:
select * from MStay.;
MStay中每个表的数据定义如下:
A. 转换阶段
本作业的第一阶段分为两个主要任务: 1. 为上述M – Stay数据库设计一个数据仓库。 您需要为M – Stay数据库创建一个数据仓库。 管理层对以下指标特别感兴趣: – 评论数量 – 房源数量 – 平均预订成本 以下是您应该在数据仓库中包含的维度属性列表: – 房源类型 – 房源时间[月,年] – 房源季节 – (春季:9月至11月,夏季:12月至2月,秋季:3月至5月,冬季:6月至8月) – 房源最大住宿时长[短期:少于14晚,中期:14至30晚,长期:超过30晚] – 房源价格范围[低:低于100美元,中:100至200美元,高:超过200美元] – 渠道 – 预订时长[短期:少于30晚,中期:30至90晚,长期:超过90晚] – 评论时间[月,年] – 预订成本范围[低:低于5000美元,中:5000至10000美元,高:超过10000美元] 对于属性,请确保它符合您提交的规范中指定的范围或组的要求。
准备阶段。 在开始设计数据仓库之前,您必须确保已经探索了运营数据库并进行了充分的数据清理。一旦完成了数据清理过程,您需要解释您采取了哪些策略来探索和清理数据。 此任务的报告输出为: – 如果您进行了数据清理过程,请解释您在该过程中使用的策略(您需要展示探索运营数据库的SQL和数据清理的SQL,以及数据清理前后的数据截图)。
- 通过绘制星型/雪花型模式图设计数据仓库。
设计任务A: 此数据仓库的星型模式可能包含多个事实。您需要确定星型/雪花型模式图的事实度量、维度和属性。以下查询可能有助于您确定事实度量和维度: – Facebook上列出了多少长期住宿时长的房源? – 2015年6月列出了多少房源? – 夏季中价格范围为中等的“整套房屋/公寓”有多少房源? – 2013年3月的平均预订成本是多少? – 2015年“私人房间”的短期住宿时长有多少预订? – 2014年4月有多少高成本预订? – 2016年2月给出了多少评论? 注意:您在设计任务A中创建的星型模式作为最高级别的聚合。
设计任务B: 在本作业中,将您在设计任务A中创建的星型模式视为最高级别的聚合。M – Stay公司经理希望实现向下钻取功能以探索更详细的信息。您的任务是建议几种方法来增加设计任务A中事实表的粒度。换句话说,经理希望降低您在设计任务A中创建的事实表的聚合级别。 任务A和B的报告输出为: – 设计任务A的星型/雪花型模式图。(您可以使用Lucidchart绘制星型模式图。) – 列出增加设计任务B中事实表粒度的建议。
使用SQL实现设计任务A的星型/雪花型模式。 您需要使用SQL实现您在设计任务A中绘制的星型/雪花型模式。这意味着您需要在SQL中创建事实表和维度表。输出是一系列执行此任务的SQL语句。您还需要展示此任务已成功执行。 注意: – 如果您的账户已满,您需要删除在教程中之前创建的所有表。 – 如果您已删除账户中的所有表,但仍然遇到ORA – 01536:表空间“TABLE_NAME”的空间配额超出的问题,请检查您的SQL代码是否正确连接了所有表。此问题主要是由于您在连接表时不正确导致记录数量在过程中倍增。 此任务的报告输出为: – 您为设计任务A创建的表结构的截图,包括维度表和事实表。
B. 数据分析阶段
使用您在设计任务A中创建的星型模式进行数据分析,通过编写SQL查询进一步探索数据。以清晰简洁的方式呈现您的发现,展示您对数据集的理解,并突出任何值得注意的观察或模式。 此任务的报告输出为: – 发现报告:对您的发现的详细解释,包括在分析过程中确定的任何重要观察或模式。
提交清单
步骤1:报告(占总分的25%) 将所有上述任务保存为一个合并的pdf文件:YourstudentID_A2_report.pdf,包括: – 封面页 – 如果您进行了数据清理过程,请解释您在该过程中使用的策略(您需要展示探索运营数据库的SQL和数据清理的SQL,以及数据清理前后的数据截图)。请注意,您在此阶段仅需找到大约5个(五个)数据错误。 – 设计任务A的星型/雪花型模式图 – 设计任务B中增加事实表粒度的建议列表 – 您为设计任务A创建的表结构的截图,包括维度表和事实表。 – 创建星型/雪花型模式的SQL文件不需要提交 – 发现报告:对您的发现的详细解释,包括在分析过程中确定的任何重要观察或模式。
步骤2:海报(占总分的35%) 将一页标准A4海报保存为PDF格式:YourstudentID_A2_poster.pdf 从您创建的报告中提取关键信息并在一页海报中呈现。海报必须为标准A4尺寸且为PDF格式,可以是横向或纵向。内容应清晰易懂。避免使用技术术语或复杂语言。在提交前审查海报,以确保它有效地传达了您报告的关键信息。 注意: 确保海报内容与您报告的关键结构和发现一致,并选择适当的布局以有效地以清晰和逻辑的方式组织信息。保持文本和视觉效果的良好平衡以增强可读性,并确保所有视觉效果相关并支持海报的内容。清楚地标记所有视觉效果并在必要时提供说明。避免在海报上过度拥挤过多的文本或过多的视觉效果,并确保海报没有任何语法或排版错误。 设计海报的关键指导: – 您想要表达的海报的主要主题/目标是什么? – 此海报的目标受众是谁? – 您真的需要海报上所有来自您报告的细节吗?
步骤3:视频演示(占总分的40%) 将五分钟的视频演示保存为mp4格式:YourstudentID_A2_video.mp4 基于您创建的报告和海报,在五分钟的视频演示中展示您的设计和发现。确保您彻底理解报告和海报,以有效地提取和传达关键要点。
作业提交
作业必须通过Moodle以电子方式提交。请确保以下几点:
步骤1输出:一个合并的pdf文件,保存为:YourstudentID_A2_report.pdf
步骤2输出:一页标准A4海报,以PDF格式保存为:YourstudentID_A2_poster.pdf
步骤3输出:五分钟的视频演示,以mp4格式保存为:YourstudentID_A2_video.mp4 将上述步骤1至3的所有文件压缩为一个ZIP文件夹,并将该ZIP文件夹命名为A2_YourstudentID.zip。 截止日期:截止 – 2024年9月20日星期五,下午4:30 本作业的提交必须以单个ZIP文件的形式。ZIP文件内仅接受PDF和.mp4文件。不接受其他格式。 在将作业提交到Moodle之前,您必须确保拥有此清单中的所有文件。未能提交完整的文件列表将导致扣分。 请注意,我们的支持时间有限,我们无法处理工作时间以外的提交问题。在将作业提交到Moodle之前,您必须确保拥有此清单中的所有文件。未能提交完整的文件列表将导致扣分。
逾期惩罚:未经批准的延期而逾期提交的作业,在首席考官和/或讲师的批准下,最多可接受七天,但将按每天5%的比例扣分(包括周末和公共假期)。在截止日期后超过七天提交的作业将获得该作业的零分,并且可能不会收到任何反馈。
特殊考虑: 所有延期/特殊考虑现在将由中央Spec Con团队处理。请不要通过电子邮件向教学人员请求延期或特殊考虑。 仅根据大学特殊考虑政策才会考虑对评估制度进行延期和其他个别更改。学生应仔细阅读特殊考虑网站,特别是关于需要哪些正式文件的详细信息。 所有特殊考虑请求应使用特殊考虑申请提出。 请不要假设提交特殊考虑申请就一定能保证获得批准 – 您必须收到官方确认已获得批准。
获取帮助和支持: 您可以获得哪些帮助?
与教学团队协商 与教学团队交谈: https://learning.monash.edu/course/view.php?id=19675§ion=5
英语语言技能 与英语连接交谈:https://www.monash.edu/english – connect
学习技能 与学习技能顾问交谈:https://www.monash.edu/library/skills/contacts
咨询 与辅导员交谈:https://www.monash.edu/health/counselling/appointments
抄袭和串通:
莫纳什大学致力于维护标准和学术诚信。请花时间查看这些链接。 – 学术诚信模块 – 学生学术诚信政策 – 测试您的知识,串通(FIT无串通模块)
祝您作业顺利!