强调如何基于环境而行
动,以取得最大化的预期
收益。
人工智能
分类算法
特征
向量
向量之间的距离
余弦相似度
曼哈顿距离
欧几里得距离
分类
逻辑回归算法
决策树算法
支持向量机算法
K最近邻算法
1. 计算目标特征向量与样本数据中各数据的相似性
2. 将相似性由大到小排序
3. 选取距离最近的K个样本
4. 确定这K个样本中各类型的比例,以比例最高的样
本类型作为该目标的类型
神经网络算法
朴素贝叶斯算法
深度学习算法
标签
有监督学习:使用带标签的样本数据来训练模型
无监督学习:使用不带标签的样本数据来训练模型
回归
回归问题
线性回归
神经网络回归
观测并采集数据
数据清洗
训练
预报
其他回归
模型
y=ax+b
loss函数
训练过程
获取训练数据,求解模型参数
计算损失函数
根据损失函数调整参数
评估
应用:图片降噪 模糊
回归模型:未知处值=参数1 x 已知值1+参数2 x 已知
值2+参数3 x 已知值3+参数4 x 已知值4+参数5 x 已
知值5+参数6 x 已知值6+参数7 x 已知值7+参数8 x
已知值8
平均滤波模型:参数1-8都取0.125
聚类
聚类问题
传统聚类 K均值
混合模型
神经网络聚类
隐藏属性
均值
置信区间
EM算法(期望最大化)
是一种迭代算法
E步用于估计隐藏属性分布
M步用于最大化概率
人工神经网络(ANN)
感知机(一种前馈神经网络)
输出>阈值-->兴奋
输出<阈值-->不兴奋
感知机只有两层,一层是输入一层是输出。如果中间
还有更多感知机可以形成一层一层像网络一样的结
构,我们将其成为神经网络算法。如果神经网络算法
中间有多个隐藏层,我们就将其称为深度学习。
激活函数
sigmoid函数
在神经网络中,节点的激活函数在给定数输入集的情
况下定义了该节点的输出。
神经网络
输入层
隐藏层 有很多隐藏层的神经网络称为深度神经网络
输出层
模型训练
特征工程
训练过程
预测过程
梯度下降法
批量梯度下降(BGD) 对整个数据集求梯度,然后对全中国进行更新
随机梯度下降(SGD)
对整个数据集采一个样本后求梯度,然后对权重进行
更新
小批量随机梯度下降(Mini-BGD)
对整个数据集采一个小批量样本后求梯度,然后对权
重进行更新
深度学习(Deep learning)
卷积神经网络(CNN)>图像识别
应用于解决计算机视觉(图像、视频分析)问题,取
得了非常好的效果
图像在计算机追踪的表示
灰度图像 一个像素点对应的色块只需要一个取值
彩色图像 RGB图像:每个像素点有红、绿、蓝三个通道组成
图像的不变性
平移不变性
旋转/视角不变性
尺度不变性
卷积神经网络
卷积层
卷积核:特征提取
滤波器
步长
优化传统全连接层的计算量
池化层
平均池化
最大池化
聚合统计特征
ImageNet
物体检测
人脸识别
循环神经网络(RNN)>情感识别
能够处理时序依赖关系
循环与记忆
记忆与向量
长短期记忆
双向网络
编码与解码
注意力机制
文本处理
文本向量
词语
字
字母
文本顺序 加入顺序标签
声音识别
文本生成
通过卷积层和池化
层将不同位置的特
征提取出来,进而
消除人工神经网络
对位置的依赖性
适合解决时序数据的机器学习问题。其中,长短期记忆单元(LSTM)适合于处理和预测时间序列中间隔和延
迟非常长的重要事件
大数据技术
大数据就是数据量非常大、数据种类繁多,无法由单
台计算机处理的数据集
特点
海量的数据规模(volume)
快速的数据流转和动态的数据体系(velocity)
多样的数据类型(variety)
巨大的数据价值(value)
分布式计算
将应用分解成许多小部分,并分配给多台计算机进行
处理
大数据机器学习
是指对海量数据运用机器学习算法,实现分类、聚
类、回归等机器学习任务。
搜索引擎
是指收集互联网的信息,并对信息进行组织和处理
后,提供给用户使用的检索服务。
数据收集部分
数据存储部分
用户检索
推荐系统
推荐系统根据用户的兴趣特点和历史对网站的访问行
为,向用户推荐个性化的信息和商品。
云计算与人工智能
云计算是一种按使用量付费的模式,这种模式提供可
用的、便捷的、按需的网络访问,进入可配置的计算
资源共享池(资源包括网络、服务器、存储、应用软
件、服务),这些资源能够被快速提供,只需投入很
少的管理工作,或与服务供应商进行很少的交互。
人工智能(Aritificial
Intelligence)
前沿
增强学习
Agent
State
Action
Reward
Q-learning算法
是一种无模型的强化学习算法,用于学习告诉代理在
某种情况下采取何种措施的策略。
深度增强学习
探索:科学与艺术
应用:对话机器人
对话机器人
对话模板
信息检索
Seq2Seq模型
准备对话的问答数据
训练Seq2Seq模型
使用人工智能Seq2Seq模型
文本在计算机中的表示
TF-IDF
TF (Term Frequency,词频)
IDF (Inverse Document Frequency,逆文档频率)
词频
主题模型
深度学习
情感分析
1、文本预处理,对文本进行向量化表示
2、对数据人工进行评判正向或者负向情感,标记训
练数据和测试数据
3、通过训练文本数据训练情感来分析分类模型
4、使用训练好的模型对测试数据或者新的数据进行
情感判定
展望:智能医疗
知识
参数不合适
含多隐层的多层感知器就是一种深度学习结构