数据科学2020学期简介最终项目
这是“数据科学概论”课程中的最后一个项目。 在本学期中,我们学习了用于预测分类类型问题和回归类型问题的结果的模型。 我们了解了两种类型的预测之间的区别:一种分类是根据数据所属的类别(例如狗或猫)对数据进行分类,而回归则可以预测一定数量(例如公寓价格的预测),并且永远不会为100 % 准确的。
笔记本1是有关概率,基本律和随机变量的问题的解决方案。
笔记本2是有关Python编程语言的问题的解决方案。 在这个笔记本中,我正在编写代码,以解决从数据集等中查找特定数据的问题。
笔记本3和笔记本4是处理分类和回归的笔记本。
分类:笔记本3的目的是根据年龄,血压等各种数据对一个人是否患有心脏病进行分类。本笔记本分析从数据集中获得的信息,以了解各种疾病之间的关系。因素和患有心脏病。 了解信息后,可以使用不同的模型,将数据分为训练集和测试集,在训练集上训练后,模