# machine_learning
哈尔滨工业大学2018年秋季机器学习相关实验
## Update:
在正心自习的时候,偶然看到前面的同学在看这个里面的实验报告复习,让我很担心我里面写的小错误会影响他们的考试。。。
请以后看这个仓库的同学,如果发现错误及时PR,**另外我的水平真的非常非常有限,请参考老师PPT、李航博士的《统计机器学习》、周志华老师的《机器学习》和Bishop的PRML来复习!**
另外,发现里面公式的输入也有问题,好多不够规范,比如`argmin`的写法,就请参考[Command for argmin or argmax?](https://tex.stackexchange.com/questions/5223/command-for-argmin-or-argmax),当时处在刚学习LaTeX没多久的情况,很多符号都是看着像什么就打的什么:new_moon_with_face::new_moon_with_face:。
----
这个仓库用于对2018年秋季哈工大机器学习相关实验的备份。对于这个学期的ML课程,在考试结束后的一天对课程内容进行一些总结。
总的来说这门课程是大学以来最**硬核**的一门课程。虽然这只是机器学习入门的非常基础的知识,但是这种利用数学工具以及对数学背后的物理含义的更深理解,是这门课给我留下的最深印象;在考前复习的时候,对很多上课时提到的问题重新梳理,有了更清晰的理解。希望以后可以继续学习相关的知识,也推荐给后来的同学这门课程。
~~但是真的考炸了啊,虽然实验没炸。~~
## 仓库组成
- 实验代码 lab1~lab4
- [课程使用的PPT](https://github.com/1160300314/machine_learning/tree/master/PPT)
- [参考的cmu考试题目](https://github.com/1160300314/machine_learning/tree/master/exam_cmu)
- [复习机器学习的笔记](https://github.com/1160300314/machine_learning/blob/master/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%A4%8D%E4%B9%A0%E7%AC%94%E8%AE%B0.pdf)
## lab 1 多项式拟合正弦函数
- [x] 1. 生成数据,加入噪声;
- [x] 2. 用高阶多项式函数拟合曲线;
- [x] 3. 用解析解求解两种loss的最优解(无正则项和有正则项)
- [x] 4. 优化方法求解最优解(梯度下降,共轭梯度);
- [x] 5. 用你得到的实验数据,解释过拟合。
- [x] 6. 用不同数据量,不同超参数,不同的多项式阶数,比较实验效果。
- [x] 7. 语言不限,可以用matlab,python。求解解析解时可以利用现成的矩阵求逆。梯度下降,共轭梯度要求自己求梯度,迭代优化自己写。不许用现成的平台,例如pytorch,tensorflow的自动微分工具。
## lab 2 Logistics Regression 逻辑回归
- [x] 1.实现两种损失函数的参数估计(1、无惩罚项;2、加入对参数的惩罚),可以采用梯度下降、共轭梯度或者牛顿法等。
- [x] 2. 可以手工生成两个分别类数据(可以用高斯分布),验证你的算法。考察类条件分布不满足朴素贝叶斯假设,会得到什么样的结果。
- [x] 3. 逻辑回归有广泛的用处,例如广告预测。可以到UCI的网站上,找一实际数据加以测试,共使用3种不同数据(Mushroom, Blood Donation 和Banknote)。
## lab 3 实现k-means聚类方法和混合高斯模型
### 实验目标
- [x] 实现一个k-means算法和混合高斯模型,并用EM算法估计模型中的参数。
### 测试
用高斯分布产生k个高斯分布的数据(不同均值和方差)(其中参数自己设定)
- [x] 用k-means聚类测试效果
- [x] 用混合高斯模型和你实现的EM算法估计参数,看看每次迭代后似然值变化情况,考察EM算法是否可以获得正确结果(与你的设定结果比较)。
### 应用
- [x] 可以在UCI上找一个简单数据,用你实现的GMM进行聚类。
<!-- 存在问题 在Iris数据上GMM表现一般 -->
## lab 4 PCA模型实验
### 实验目标
实现一个PCA模型,能够对给定数据进行降维(即找到其中的主成分),可以利用已有的矩阵特征向量提取方法。
### 测试
- [x] 首先人工生成一些数据(如三维数据),让它们主要分布在低维空间中,如首先让某个维度的方差远小于其它维度,然后对这些数据旋转。生成这些数据后,用你的PCA方法进行主成分提取。
- [x] 利用手写体数字数据mnist,用你实现PCA方法对该数据降维,找出一些主成分,然后用这些主成分对每一副图像进行重建,比较一些它们与原图像有多大差别(可以用信噪比衡量)。
没有合适的资源?快使用搜索试试~ 我知道了~
2018年秋季哈工大机器学习相关实验.zip
共75个文件
pdf:40个
py:17个
md:6个
需积分: 5 0 下载量 153 浏览量
2024-05-08
11:09:21
上传
评论
收藏 120.46MB ZIP 举报
温馨提示
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。 机器学习的发展历程可以追溯到20世纪50年代,当时Arthur Samuel在IBM开发了第一个自我学习程序,一个西洋棋程序,这标志着机器学习的起步。随后,Frank Rosenblatt发明了第一个人工神经网络模型——感知机。在接下来的几十年里,机器学习领域取得了许多重要的进展,包括最近邻算法、决策树、随机森林、深度学习等算法和技术的发展。 机器学习有着广泛的应用场景,如自然语言处理、物体识别和智能驾驶、市场营销和个性化推荐等。通过分析大量的数据,机器学习可以帮助我们更好地理解和解决各种复杂的问题。例如,在自然语言处理领域,机器学习技术可以实现机器翻译、语音识别、文本分类和情感分析等功能;在物体识别和智能驾驶领域,机器学习可以通过训练模型来识别图像和视频中的物体,并实现智能驾驶等功能;在市场营销领域,机器学习可以帮助企业分析用户的购买行为和偏好,提供个性化的产品推荐和定制化的营销策略。 总的来说,机器学习是一个快速发展且充满潜力的领域,它正在不断地改变我们的生活和工作方式。随着技术的不断进步和应用场景的不断扩展,相信机器学习将会在未来发挥更加重要的作用。
资源推荐
资源详情
资源评论
收起资源包目录
2018年秋季哈工大机器学习相关实验.zip (75个子文件)
content
lab1
analytical_solution.py 596B
lab1-report.md 34KB
gradient_descent.py 2KB
多项式拟合正弦曲线 .docx 12KB
lab1.py 6KB
conjugate_gradient.py 2KB
lab1-report.pdf 1.92MB
newton_method.py 1KB
机器学习复习笔记.pdf 53.88MB
机器学习实验报告模板.doc 26KB
exam_cmu
midterm2007s-solution.pdf 253KB
midterm2006-solution.pdf 3MB
midterm2010f_sol.pdf 456KB
10f-601-midterm.pdf 239KB
related_work
9_model_selection.pdf 1.24MB
8_feature_selection.pdf 1.62MB
3_numerical_computaion.pdf 2.84MB
2_probability.pdf 2.33MB
EM_huaxiaozhuan.pdf 4.33MB
PCA_huaxiaozhuan.pdf 2.82MB
AI算法工程师手册.pdf 608KB
nearest_search.pdf 868KB
5_knn.pdf 792KB
Simple Bagyesian Classifiers Do Not Assume Independence(AAAI 1996 Domingos).pdf 166KB
Bishop-PRML-solution.pdf 867KB
Beyond Independence Conditions for the Optimality of the Simple Bayesian Classifier.pdf 172KB
4_decision_tree.pdf 1.19MB
1_algebra.pdf 928KB
0_introduction.pdf 728KB
1_linear.pdf 1.36MB
Cluster_huaxiaozhuan.pdf 6.04MB
2_svm.pdf 2.2MB
3_bayesian.pdf 792KB
lab4
lab4.pdf 1.01MB
lab4.py 4KB
lab4.md 14KB
mnist
train-images.idx3-ubyte 44.86MB
t10k-images.idx3-ubyte 7.48MB
train-labels.idx1-ubyte 59KB
t10k-labels.idx1-ubyte 10KB
PPT
机器学习(1).pdf 2.45MB
机器学习(3).pdf 1.03MB
HMM.pdf 9.05MB
机器学习(5).pdf 1.99MB
机器学习(5)重置.pdf 1.77MB
PCA.pdf 10.12MB
机器学习(2).pdf 1.99MB
机器学习(4).pdf 1.31MB
机器学习(6).pdf 1.85MB
机器学习(7).pdf 1.68MB
GMM-EM.pdf 7.34MB
lab3
gaussian_mixture_model.py 4KB
k_means.py 2KB
iris_read.py 980B
lab3.md 13KB
lab3.py 4KB
iris.csv 4KB
lab3.pdf 688KB
template.md 930B
.gitignore 1KB
template.pdf 180KB
lab2
mushrooms.csv 365KB
watermelon-3.3.csv 276B
blood_read.py 758B
blood.csv 13KB
gradient_descent.py 2KB
lab2.pdf 824KB
lab2.md 13KB
mushroom_read.py 753B
conjugate_gradient.py 85B
lab2.py 11KB
bank_note_read.py 706B
data_banknote_authentication.csv 44KB
newton_method.py 1KB
README.md 4KB
共 75 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3824
- 资源: 5235
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- c#优质学习资源和工具与案列应用场景.txt
- 《医疗与在线教育PPT模板合集》-点亮您的演讲与教学!
- VisualBasic优质学习资源和工具与案列应用场景.txt
- 传热 - 化工原理实验Mathmatica代码
- 传热 - 化工原理实验Mathmatica代码
- Delphi优质学习资源和工具.txt
- Rust优质资源和工具.txt
- Kotlin优质资源和工具.txt
- OpenCASCADE入门(2)-openCasCade7.6.0版本的exe方式安装,vs2017环境配置,编译和使用draw
- ACM(Association for Computing Machinery,计算机协会)相关的资源.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功