Coursera机器学习笔记

5星(超过95%的资源)
所需积分/C币:10 2014-12-31 14:34:44 4.13MB PDF
12
收藏 收藏
举报

转载网络上的资源,匿名网友翻译的外国网友整理出来的Coursera公开课上Stanford University斯坦福大学教授Andrew Ng开设的Machine Learning机器学习这门课的学习笔记,非常详细和具有参考价值!
多项式回归( 正规方程( Week3归一化 21 逻辑回归( 分类问题 分类问题建模 判定边界( 代价函数 多类分类( Week3归-化 .28 归—化( 过拟合问题( 归一化代价函数( 归一化线性回归( 戶一化逻辑回归( Week4神经网络:表达 申非非 32 7神经网络:表达 非线性假设 神经网络介绍 模型表达 神经网络模型表达 正向传播 对神经网络的理解 神经网络示例:二元逻辑运算符( 多类分类 Week5神经网络:学习 39 8神经网络:学习 神经网络代价函数 反向传播算法( 梯度检验( 随机初始化( 综合起来 Week6机器学习应用建议… 45 机器学习应用建议 决定下一步做什么 假设的评估( 模型选择(交叉验证集) 偏倚和偏差诊断( 归一化与偏倚偏差 学习曲线( 决定下一步做什么 Week6机器学习系统设计 52 机器学习系统设计 首先要做什么 误差分析( 类偏斜的误差度量( 查全率和查准率之间的权衡 机器学习的数据 Week7支持向量机… .56 支持向量机( 优化目标( 支持向量机判定边界( 核函数( 逻辑回归与支持向量机 Week8聚类 64 聚类( K-均值算法 优化目标 随机初始化 选择聚类数 Week8降维 67 降维( 动机一:数据压缩( 动机二:数据可视化( 主要成分分析( 主要成分分析算法 选择主要成分的数量 应用主要成分分析 Week9异常检测 73 4异常检测( Anomaly Detection) 密度估计( 高斯分布 异常检测 评价一个异常检测系统 异常检测与监督学习对比 选择特征 多元高斯分布 Week9推荐系统… 80 推荐系统( 问题形式化 基于内容的推荐系统( 协同过滤算法( 均值归一化 Week10大规模机器学习…… 84 16大规模机器学习( Large Scale Machine Learning) 大型数据集的学习 随机梯度下降法 微型批量梯度下降( 随机梯度下降收敛( 在线学习( Online Learning) 映射化简和数据并行( Week10应用示例图像文字识别… …89 应用实例:图像文字识别( 问题描述和流程图 获得大量数据个人工数据 上限分析( Ceiling analysis) 机器学习介绍 机器学习介绍 什么是机器学习 对于机器学习并没有一个一致认同的定义一个比较古老的定义是由 Arthur Samue在1959 年给出的 机器学习硏究的是如何赋予计算机在没有被明确编程的情况下仍能够学习的能力。 Field of study that fives computers the ability to learn without being explicitl programmed. Samuel编写了一个跳棋游戏的程序,并且让这个程序和程序自身玩了几万局跳棋游戏,并且 记录下来棋盘上的什么位置可能会导致怎样的结果,随着时间的推移,计算机学会了棋盘上的 哪些位置可能会导致胜利,并且最终战胜了设计程序的 Samuel 另一个比较现代且形式化的定义是由 Tom mitchel!在1998年给出的: 对于某个任务T和表现的衡量P,当计算机程序在该任务T的表现上,经过P的衡量, 随着经验E而增长我们便称计算机程序能够通过经验E来学习该任务。( computer program is said to learn from experience e with respect to some task t and some performance measure P, if its performance on T, as measured by P, improves with experience E 在跳棋游戏的例子中,任务T是玩跳棋游戏,P是游戏的输嬴,E则是一局又一局的游戏。 一些机器学习的应用举例: 数据库挖掘 2.一些无法通过手动编程来编写的应用:如自然语言处理,计算机视觉 3.一些自助式的程序:如推荐系统 理解人类是如何学习的 监督学习( 在课程稍后阶段我们再给监督学习一个更加正式的定义,现在我们从一个例子开始 假设你有下面这些房价数据,图表上的每个实例都是一次房屋交易,横坐标为交易房屋的占地 面积,纵坐标为房屋的交易价格。 Housing price prediction Price(S) in1000g200 100 0 500 1000 1500 2000 2500 Size in feet 现在,假设你希望能够预测一个平方英尺的房屋的交易价格可能是多少。一种方法是根据 这些数据点的分布,画一条合适的直线,然后根据这条直线来预测。在房价预测这个例子中, 一个二次函数可能更适合已有的数据,我们可能会更希望用这个二次函数的曲线来进行预测。 100 300 n100s0 Price 100 500 0015002000 2500 a st Size in feet 我们称这样的学习为监督学习。称其为监督式的学习,因为我们预先给了算法“正确结果 一即所有我们观察到的变量。 上面这个问题又称为回归问题( ,因为我们能预测的结果是连续地值。 再来看另一种类型的监督学习问题 假使你希望预测一个乳腺癌是否是恶性的你现在有的数据是不同年龄的病人和她们身上肿瘤 的尺寸以及这些肿瘤是否是恶性的。如果我们将这些信息绘制成一张图表,以横坐标为肿 瘤的尺寸,以纵坐标为病人的年龄,以代表良性肿瘤,以代表恶性肿瘤。则我们的算法 要学习的问题就变成了如何分割良性肿瘤和恶性肿瘤。 x O Tumor Size 这样的问题是分类问题( ),我们希望算法能够学会如何将数据分类到不同的类 里。 上面的例子中我们只适用了两个特征( )来进行分类,现实中,我们会有非常多的特 征,并且我们希望算法能够处理无限多数量的特征,在课程后面我们会介绍能够处理这样问题 的算法,例如支持向量机( 非监督学习( 在监督学习中,无论是回归问题还是分类问题,我们的数据都具有一个结果(房价问题中的房 价,肿瘤问题中的良性与否)。 而在非监督学中,我们的现有数据中并没有结果,我们有的只是特征,因而非监督学习要解决 的问题是发现这些数据是否可以分为不同的组。 非监督学习的一个例子是聚类问题( Clustering),例如对一个大型的数据中心的网络传输数 据情况进行分析,发现那些多数时候是在协作的计算机。 再一个例子,给定一些人和他们所有的基因,非监督学习可以根据是否具有某些基因而将这些 人聚类:

...展开详情
试读 93P Coursera机器学习笔记
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
cplover25 是Coursera的,而且带目录清晰版,好资源
2017-12-25
回复
zxr957034573 非常详细的一份笔记。作者对ppt也进行了归纳总结,其过程初学者看着基本没有困难。很棒。学习时有笔记在手也减少了迷茫。
2017-01-13
回复
liuuaju 非常好的一个资源。特别适合初学者学习。强烈推荐。
2016-10-10
回复
qq_26636577 非常感谢分享
2016-05-27
回复
lixinguo0812 很好 很适应 学习了
2016-04-20
回复
郭了个治浩 一直在找,很赞
2016-04-14
回复
我们即将毕业了 非常有用的学习资料,我们这种入门级的都能看懂,整理得非常好,很感谢
2016-03-21
回复
lichade124080 正是想要的,谢谢分享!
2016-03-20
回复
AvalonsCN 整理的非常好,,,感谢分享
2016-03-13
回复
bill陈 一直在找,很赞
2016-01-13
回复
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
上传资源赚钱or赚积分
最新推荐
Coursera机器学习笔记 10积分/C币 立即下载
1/93
Coursera机器学习笔记第1页
Coursera机器学习笔记第2页
Coursera机器学习笔记第3页
Coursera机器学习笔记第4页
Coursera机器学习笔记第5页
Coursera机器学习笔记第6页
Coursera机器学习笔记第7页
Coursera机器学习笔记第8页
Coursera机器学习笔记第9页
Coursera机器学习笔记第10页
Coursera机器学习笔记第11页
Coursera机器学习笔记第12页
Coursera机器学习笔记第13页
Coursera机器学习笔记第14页
Coursera机器学习笔记第15页
Coursera机器学习笔记第16页
Coursera机器学习笔记第17页
Coursera机器学习笔记第18页
Coursera机器学习笔记第19页

试读结束, 可继续读1页

10积分/C币 立即下载