电影收视率数据集的聚类/分类
将数据转换成用户电影评分矩阵。 应用主成分分析以减少电影的尺寸。 将k均值聚类应用于转置电影收视率数据集。 将奇异值分解应用于转置的用户电影矩阵。
决策树ID3
考虑到旅行,年龄,票价等7个属性,使用迭代二分法3算法实现了二叉决策树,并将其针对一个巨大的幸存者数据集运行。第一个“幸存”属性是类别标签。
ML评论情绪分析器
评论情绪分析器接受训练和测试数据集,每行都有正面和负面的评论。 清理数据后,将对每个单词进行分析,并根据其频率及其在正面评论与负面评论中的出现程度分配权重。 使用TF-IDF矢量化计算最终的“得分”。 用户输入一个句子,程序将告诉您该评论对人类语言的影响是正面还是负面。 根据我的测试数据集,通常精度约为〜85%。
感知器分类
感知器分类项目使用与决策树相同的数据集。 类似的分析,但使用感知器算法。