2023-05-29
Q1 论述题
1. 本门课程所学习的内容概述:
本门课程涉及机器学习的基本概念、方法和应用。学习内容包括有监督学习和无监督学习
的算法和技术,数据预处理和特征工程,模型评估和选择,以及机器学习在实际问题中的
应用。课程还可能介绍一些高级主题,如深度学习、强化学习和自然语言处理等。
2. 有监督学习与无监督学习的区别以及主要的方法:
有监督学习和无监督学习是机器学习的两种基本范式。
有监督学习是指从标记的训练数据中学习预测模型。其关键在于使用有标签的数据集,其
中包含输入样本和对应的标签或输出。有监督学习的目标是通过学习输入和输出之间的关
系,构建一个能够对新的未标记样本进行准确预测的模型。常见的有监督学习方法包括线
性回归、逻辑回归、决策树、支持向量机和神经网络等。
无监督学习是指从未标记的数据中学习模型,目标是发现数据中的潜在结构、模式和关系
。无监督学习不需要事先标记的输出,而是通过对数据进行聚类、降维、异常检测等技术
来进行数据的自动分析和挖掘。常见的无监督学习方法包括聚类算法(如K均值聚类和层
次聚类)、降维方法(如主成分分析和因子分析)和关联规则挖掘等。
3. 评价一个有监督模型的优良性:
评价一个有监督模型的优良性需要考虑多个方面,以下是一些常见的评价指标和方法:
• 准确率(Accuracy):模型在预测时的正确率,即正确预测的样本数与总样本数之
比。
• 精确率(Precision)和召回率(Recall):适用于二分类问题的评价指标,精确率
表示被正确预测为正类别的样本在所有预测为正类别的样本中的比例,召回率表示
被正确预测为正类别的样本在所有实际为正类别的样本中的比例。
• F1分数(F1
Score):F1分数是精确率和召回率的调和平均值,具有平衡两者之间的关系的特
点。更高的F1分数表示模型在预测正例和负例方面都取得了较好的结果。
4. PCA 的基本原理与步骤:
PCA(Principal Component
Analysis)是一种常用的降维方法,用于在保留数据主要信息的同时减少数据的维度。
基本原理:
PCA
的主要思想是将原始数据通过线性变换,转换为一组新的变量,这些新变量称为主成分。