恭喜
来自【威斯康星大学麦迪逊分校】的Z学员斩获
加州大学伯克利分校MEng、南加利福尼亚大学Computer Science
2021Fall offer!!!
Z同学已收获的2021offer
来自Z同学的科研体验分享:
很高兴能和老师合作,并收获一段与数据处理和分析相关的经历。
项目前期Allen老师为我们补充了一些背景知识和分析数据的模型,在理解原理的同时很详细地讲解了在实际课题中的运用方法。在做抓取数据的作业时,我利用课上介绍的方法抓取了NBA球员的赛场数据并做了简单的统计分析,感受到利用R语言的库可以做很多有趣的课题。
在初步定下课题时,我希望能做与身边实事相关的题目。由于我因为疫情留在美国老虎机规则,于是选择了预测美国新冠病例这个方向。一开始我的思路比较简单老虎机规则,只考虑了将人口密度,各个州的防疫政策等变量。Allen老师为我的模型补充了很多可以注意的细节,如注意每个州的ICU病床数和经济情况,很大程度上帮助我将课题做得更成熟。
随着课题的稳步推进,我逐步完成了数据库网站上和每个州的官方网站上的抓取、处理数据,利用linear regression和random forest做初步预测,但误差较大。Allen老师每周都会给出建议,耐心回答我汇报时和邮件中提出的哪怕是很细节的问题。经过老师对传染病模型和数据分析的经验介绍,我增加了一些变量,如当地已出现病例的天数和每个州的政治倾向,同时给州设置了分组,并使用XGBoost做预测。最后预测值的误差有了明显的降低。
*Z同学的部分report展示在暑研课题的整个过程中我都在不断进行思考,寻找优化的方法,也在老师的指导和同学们的分享中获得新的思路,这无疑是一段有益而愉快的假期经历。感谢Allen老师和小伙伴们的努力和付出。
↓↓ 100%好评科研项目 ↓↓
点击添加图片描述(最多60个字)
*项目结束后,你可以:
建造属于自己的网络爬虫从网站上提取信息;理解不同种类的机器学习算法;学习适用于不同种类商科类问题的机器学习算法;使用 R 分析非结构化数据;用 R语言(Python)编辑和实现机器学习的算法;
*你将收获:
积极参与项目,完成课题探索,表现优异可获得导师学术推荐(详情咨询科研顾问);导师签发的项目结业证明(电子版);
2021年5月/7月(春暑)正在招募