斯坦福机器学习公开课6-8资源-CSDN文库

共3个文件

pdf：3个

机器学习

5星 · 超过95%的资源需积分: 10 12 浏览量 2013-08-06 22:41:57 上传评论 2 收藏 1MB 7Z 举报

资源推荐

资源详情

资源评论

收起资源包目录

6-8.7z （3个子文件）

斯坦福ML公开课笔记8.pdf 360KB

斯坦福ML公开课笔记6.pdf 443KB

斯坦福ML公开课笔记7.pdf 278KB

雨石 @zyx_1991 http://blog.csdn.net/stdcoutzyx

斯坦福 ML 公开课笔记 6

本篇笔记针对斯坦福 ML 公开课的第 6 个视频，主要内容包括朴素贝叶斯的

多项式事件模型、神经网络、支持向量机。

朴素贝叶斯多项式事件模型

在上篇笔记中，那个最基本的 NB 模型也被成为多元伯努利事件模型

（Multivariate Bernoulli Event Model，以下简称 NB-MBEM）。该模型有多种扩展，

一种是在上一篇笔记中已经提到的每个分量的多值化，即将 p(x

|y)由伯努利分布

扩展到多项式分布；还有一种在上一篇笔记中也已经提到，即将连续变量值离散

化。本文将要介绍一种与多元伯努利事件模型有较大区别的 NB 模型，即多项式

事件模型（Multinomial Event Model，以下简称 NB-MEM）。

首先，NB-MEM 改变了特征向量的表示方法。在 NB-MBEM 中，特征向量

的每个分量代表词典中该 index 上的词语是否在文本中出现过，其取值范围为

{0,1}，特征向量的长度为词典的大小。而在 NB-MEM 中，特征向量中的每个分

量的值是文本中处于该分量的位置的词语在词典中的索引，其取值范围是

{1,2,…,|V|},|V|是词典的大小，特征向量的长度为相应样例文本中词语的数目。

举例来说，在 NB-MBEM 中，一篇文档的特征向量可能如下所示：















































































(1)

其在 NB-MEM 中的向量表示则如下所示：

















































































(2)

在 NB-MEM 中，假设文本的生成过程如下：

 确定文本的类别，比如是否为垃圾文本、是财经类还是教育类等；

 遍历文本的各个位置，以相同的多项式分布生成各个词语，生成词语时

相互独立。

雨石 @zyx_1991 http://blog.csdn.net/stdcoutzyx

由上面的生成过程可知，NB-MEM 假设文本类别服从多项式分布或伯努利

分布，而词典中所有的词语服从多项式分布。生成过程还可如下解释，即先在类

别所服从的多项式分布中选取类别，然后遍历整个文本，在词语所服从的多项式

分布中选取词语，放到文本中相应的位置上。

于是，NB-MEM 的参数如下所示：





󰇛󰇜 (3)









 (4)









 (5)

于是，我们可以得到参数在训练集上的极大似然估计：













󰇛

󰇛



󰇜



󰇛󰇜

󰇜





󰇭󰇡



󰇛



󰇜

󰇻







󰇢







󰇮





󰇛

󰇛



󰇜





󰇜 (6)

极大化似然估计函数，可以得到各个参数的极大似然估计：







 

󰇝



󰇛



󰇜

 

󰇛



󰇜

󰇞













󰇝

󰇛



󰇜

󰇞









(7)







 

󰇝



󰇛



󰇜

 

󰇛



󰇜

󰇞













󰇝

󰇛



󰇜

󰇞









(8)









󰇝

󰇛



󰇜

󰇞







(9)

在



和



上使用 Laplace 平滑，得到公式如下：







 

󰇥



󰇛



󰇜

 

󰇛



󰇜

󰇦  













󰇝

󰇛



󰇜

󰇞









 

(10)







 

󰇥



󰇛



󰇜

 

󰇛



󰇜

󰇦  













󰇝

󰇛



󰇜

󰇞









 

(11)

其中，|V|为词典的大小。

神经网络

之前介绍的无论是感知器算法还是逻辑斯蒂回归还是刚才所介绍的朴素贝

叶斯模型（朴素贝叶斯算法是前置假设是多项式分布的多项式模型，所以也属于

评论收藏

内容反馈

super_cocoa

2014-03-04

正在看这个公开课，中文课件很有用
signalexpress

2013-12-19

正在看这个公开课，中文课件很有用
ouchxp

2014-08-19

上课看这个笔记很有用
liu6tot

2015-11-14

CourseEra 公开课的有益辅助帮顶楼主真心好人
Justdoitfan

2016-08-28

挺好的，值得一看

张雨石

粉丝: 4966
资源: 15

斯坦福机器学习公开课6-8

斯坦福机器学习公开课笔记1-5

斯坦福机器学习公开课-吴恩达

斯坦福机器学习公开课讲义

斯坦福机器学习公开课讲义+个人笔记

coursera斯坦福机器学习公开课作业2

斯坦福大学公开课-机器学习-个人笔记完整版v4.21

斯坦福机器学习公开课笔记下载

斯坦福机器学习公开课笔记+讲义

coursera斯坦福机器学习公开课作业1

斯坦福机器学习公开课编程作业答案ex6

斯坦福ML公开课笔记_中文版

斯坦福大学公开课 ：机器学习课程课件讲义学习笔记（高清最全讲义+课件+学习笔记）

吴恩达-斯坦福大学-机器学习公开课-讲义原稿

斯坦福机器学习公开课编程作业答案ex5

斯坦福机器学习公开课笔记（吴恩达）

斯坦福机器学习公开课课件

机器学习公开课笔记1-12

斯坦福机器学习公开课编程作业答案ex8

python大作业 含爬虫、数据可视化、地图、报告、及源码（整和为一个文件）（2014-2020全国各地区原油加工量）.rar

仿真电路以及操作方法

【纯干货啊】华为IPD流程管理(完整版).pptx

可编程语言标准IEC61131-3中文版.pdf

OFDM完整仿真过程与教程.zip

信号与系统——保研复习资料.pdf

Landsat_WRS2.zip

最全的Visio形状/图形库

AxureRP9项目原型50套、案例20个、元件库1套.zip

北理工+成电+东南——通信/信号保研面试真题.pdf

数字信号处理——保研复习资料.pdf

最新资源

斯坦福大学公开课：机器学习课程课件讲义学习笔记（高清最全讲义+课件+学习笔记）

python大作业含爬虫、数据可视化、地图、报告、及源码（整和为一个文件）（2014-2020全国各地区原油加工量）.rar