Research topic
基于历史航班与气象数据的美国机场延误预测模型:随机森林与聚类分析
applied_ml: 能否利用美国交通统计局(BTS)的航班准点率数据和NOAA气象数据,训练随机森林模型预测航班延误是否超过15分钟,并通过聚类分析识别延误特征相似的机场群?
所有数据集免费公开耗材:仅需个人电脑AP统计学:单元2 探索双变量数据
Draft10 weeksIntermediateDesk research · laptopPortfolio score 8/10
Why this matters
现有研究依赖高精度实时数据优化机场地面交通,但历史航班延误模式与公开气象、拥堵指标的关联尚未被机器学习方法系统挖掘。
Admissions radar & narrative
从一次延误经历出发,你开始思考:能否用数据预测航班延误?通过整合航班和气象数据,你训练了随机森林模型,发现天气和拥堵是延误的关键因素。这段经历让你认识到数据科学在改善日常生活中的潜力。
Curriculum alignment
AP统计学:单元4 概率、随机变量和概率分布AP计算机科学A:数组/列表、循环、条件
Project roadmap10 weeks
Weeks 1-2
下载BTS航班准点率数据和NOAA气象数据,熟悉数据结构和变量定义。
Weeks 3-4
数据清洗:处理缺失值、合并数据集、创建目标变量(延误>15分钟)。
Unlock the full research scaffold & literature chain
Sign in to open competition fit, the complete milestone roadmap, admissions narrative drafts, and the full research write-up for this topic.