没有合适的资源?快使用搜索试试~ 我知道了~
人工智能面试图-问题+答案.docx
资源推荐
资源详情
资源评论
人工智能笔试题目及答案
1. 深度学习和过往的神经网络训练方法有什么区别?列举几种深度
学习的 loss function,并说明意义
深度学习是一种方法,神经网络是个模型,深度学习方法呢可以有效解决层数多的神经
网络不好学习的问题,为了让层数较多的多层神经网络可以训练,能够起作用并演化出
来的一系列的 新的结构和新的方法;
结构:一般分为两大阵营,CNN,RNN,感觉这里欠妥,请指正。
方法:权重初始化方法(逐层初始化,XAVIER 等),损失函数,防止过拟合方法
(Dropout, BN 等)。
这些方面主要都是为了解决传统的多层神经网络的一些不足:梯度消失,过拟合等。
分类问题常用的损失函数:
(1)交叉熵损失函数,也称作 softmax 损失函数,可用于解决多分类问题,通过指数
化将输出转换成概率的形式;
(2)合页损失函数,一般情况下,交叉熵损失函数的效果优于合页损失函数;
(3)坡道损失函数,对离群点或者噪声的抗干扰能力强,是一种鲁棒性的损失函数,
对误差较大的区域会进行截断;
(4)大间隔损失函数,保证能够正确分类的同时,还满足增大类间的差异,提升了特
征的分辨能力,防止网络发生过拟合;
(5)中心损失函数,保证能够正确分类的同时,还满足减少类内的差异,提升了特征
的分辨能力;
回归问题常用的损失函数:
(1)l1 损失函数,衡量的是预测值与真实值之间的偏差;
(2)l2 损失函数,效果 优于 l1;
(3)tukey‘s biweight 损失函数,是一种具有鲁棒性的损失函数;
其他任务的损失函数:
KL 散度损失函数,衡量的是样本标记分布与真是标记分布的差异,可用于年龄估计等。
2. 什么是卷积神经网络?请说明卷积的意义
分开看就明确了,“卷积” 和 “神经网络”.
卷积也就是说神经网络不再是对每个像素的输入信息做处理了,而是图片上每一小块像
素区域进行处理, 这种做法加强了图片信息的连续性. 使得神经网络能看到图形, 而非一
个点. 这种做法同时也加深了神经网络对图片的理解.
具体来说, 卷积神经网络有一个批量过滤器, 持续不断的在图片上滚动收集图片里的信
息,每一次收集的时候都只是收集一小块像素区域, 然后把收集来的信息进行整理, 这时
候整理出来的信息有了一些实际上的呈现, 比如这时的神经网络能看到一些边缘的图片
信息, 然后在以同样的步骤, 用类似的批量过滤器扫过产生的这些边缘信息, 神经网络从
这些边缘信息里面总结出更高层的信息结构,比如说总结的边缘能够画出眼睛,鼻子等等.
卷积的重要的物理意义是:一个函数(如:单位响应)在另一个函数(如:输入信号)
上的加权叠加,这就是卷积的意义:加权叠加,不同的卷积核提供了不同的加权方式,
从而得到鲁棒的特征,进行参数共享,大大减少了参数量,避免过拟合;
3. 什么是中文分词? 列举出几种你所知的分词方法
中文分词就是将中文按语义分出词语来,与英文不同,中文词语之间没有空格,需要根
据语义经验等知识来将一组汉字序列进行切分出一个个词语
中文分词主要分为三种:
(1)机械分词法:是一种基于词典的方法,是将文档中的字符串与词典中的词条一一
匹配,如果在词典中找到了某个字符串,则匹配成功,可以切分,否则不予切分。该方
法实现简单,使用性强,但对于词典的完备性要求很高。
(2)基于语法和规则的分词方法:是在分词的同时进行句法和语义分析,通过句法和
语义信息来标注词性,以解决分词歧义的现象。但汉语语法笼统,复杂,所以该种方法
的精度不尽人意,目前仍处于试验阶段。
(3)基于统计的分词法:根据字符串在语料中出现的统计词频来判断其是否构成一个
词。词是字的组合,相邻的字同时出现的次数越多越有可能成为一个词。该种方法因精
度高,效果稳定,成为目前最流行的一种方法,常见的分词模型有 HMM, CRF, biLSTM+CRF
等
4. 现在深度学习在 nlp 领域有哪些应用? 请具体说明
1.机器翻译,or 神经机器翻译(NMT)在翻译中提供了统计方式之外的另一种方式,同
时也更加简便。
2.知识问答,问答机器人,可以用深度学习模型,从语料中学习获得一些问题的答案。
3.自然语言生成,能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过
程,来自动生成一段高质量的自然语言文本。
5. 传统图像处理提取的 sift 特征是什么意思?
sift 指的是 scale invarient feature transform,即尺度不变特征变换。
sift 特征是一种对缩放、旋转、光照变化等不敏感的局部图像特征,其提取过程是先生
成图像的尺度空间,然后在尺度空间中检测极值点作为关键点,最后利用关键点邻域的
梯度信息生成特征描述符。
6. 什么叫过拟合,避免过拟合都有哪些措施?
答:过拟合:就是在机器学习中,我么测试模型的时候,提高了在训练数据集的表现力
时候,但是在训练集上的表现力反而下降了。
解决方案:
1.正则化
2.在训练模型过程中,调节参数。学习率不要太大.
3.对数据进行交叉验证
4.选择适合训练集合测试集数据的百分比,选取合适的停止训练标准,使对机器的训练
在合适
5.在神经网络模型中,我们可以减小权重
7. LR 和 SVM 的联系与区别是什么?
1.都是分类算法
2.如果不考虑核函数,LR 和 SVM 都是线性分类算法,也就是说他们的分类决策面都是
线性的
3.LR 和 SVM 都是监督学习算法
4.LR 和 SVM 的损失函数不同
5.SVM 只考虑局部的边界线附近的点 ,LR 考虑全局,远离的点对边界线的确定也起作
用
8. 给你一个有 1000 列和 1 百万行的训练数据集,这个数据集是基于
分类问题的。经理要求你来降低该数据集的维度以减少模型计算时间,
但你的机器内存有限。你会怎么做?(你可以自由做各种实际操作假
设。)
1.由于我们的 RAM 很小,首先要关闭机器上正在运行的其他程序,包括网页浏览器等,
以确保大部分内存可以使用。
2.我们可以随机采样数据集。这意味着,我们可以创建一个较小的数据集,比如有 1000
个变量和 30 万行,然后做计算。
3.为了降低维度,我们可以把数值变量和分类变量分开,同时删掉相关联的变量。对于
数值变量,我们将使用相关性分析;对于分类变量,我们可以用卡方检验。
4.另外,我们还可以使用 PCA(主成分分析),并挑选可以解释在数据集中有最大偏差
的成分。
5.利用在线学习算法,如 VowpalWabbit(在 Python 中可用)是一个不错的选择。
6.利用 Stochastic GradientDescent(随机梯度下降法)建立线性模型也很有帮助。
7.我们也可以用我们对业务的理解来估计各预测变量对响应变量的影响的大小。但是,
这是一个主观的方法,如果没有找出有用的预测变量可能会导致信息的显著丢失。
9. 给你一个数据集,这个数据集有缺失值,且这些缺失值分布在离
中值有 1 个标准偏差的范围内。百分之多少的数据不会受到影响?为
什么?
约有 32%的数据将不受缺失值的影响。
因为,由于数据分布在中位数附近,让我们先假设这是一个正态分布。我们知道,在一
个正态分布中,约有 68%的数据位于跟平均数(或众数、中位数)1 个标准差范围内,
那么剩下的约 32%的数据是不受影响的。因此,约有 32%的数据将不受缺失值的影响。
10. 真阳性率和召回有什么关系?写出方程式。
真阳性率=召回。它们有相同的公式(TP / TP + FN)。
11. 在 k-means 或 kNN,我们是用欧氏距离来计算最近的邻居之间的
距离。为什么不用曼哈顿距离?
我们不用曼哈顿距离,因为它只计算水平或垂直距离,有维度的限制。另一方面,欧氏
距离可用于任何空间的距离计算问题。
因为,数据点可以存在于任何空间,欧氏距离是更可行的选择。
例如:想象一下国际象棋棋盘,象或车所做的移动是由曼哈顿距离计算的,因为它们是
在各自的水平和垂直方向做的运动。
原文链接:https://blog.csdn.net/sinat_36458870/java/article/details/83716304
基础人工智能面试题
(1)什么是人工智能?
人工智能,是一个计算机科学领域,它强调智能机器的创造,它像人类一样工作
和反应。
(2)什么是人工智能神经网络?
人工智能神经网络可以模拟生物大脑的工作方式,使机器能够以与人类相同的方
式进行思考和学习:使它们能像我们一样识别语音、物体和动物。
(3)可以使用 AI(人工智能)的各个领域是什么?
人工智能可用于许多领域,如计算,语音识别,生物信息学,人形机器人,计算
机软件,空间和航空等。
(4)哪种是 AI 不常用的编程语言?
Perl 语言不是 AI 常用的编程语言。
(5)AI 中的 Prolog 是什么?
在 AI 中,Prolog 是一种基于逻辑的编程语言。
(6)解释强 AI 和弱 AI 之间的区别?
强大的 AI 声称计算机可以在与人类相等的水平上进行思考,而弱 AI 只是预测一
些类似于人类智能的功能可以合并到计算机中,使其成为更有用的工具。
(7)提到统计 AI 和经典 AI 之间的区别?
统计 AI 更关注“归纳”思想,如给定一组模式,诱导趋势等。经典 AI 更关注作为
一组约束给出的“演绎”思想,推导出一个结论等等。
(8)什么是备用,人工,复合和自然键?
备用密钥:排除主密钥所有候选密钥称为备用密钥。
人工密钥:如果没有明显的密钥可以单独使用或复合可用,那么最后的方法是,
只需创建一个密钥,通过为每个记录或事件分配一个数字。这被称为人工密钥。
复合键:当没有单个数据元素唯一地定义构造中的出现时,则集成多个元素以为
构造创建唯一标识符称为复合键。
自然键:自然键是存储在构造中的数据元素之一,并且用作主键。
(9)生产规则由什么组成?
生产规则包括一组规则和一系列步骤。
剩余73页未读,继续阅读
资源评论
ArronPhilipLouis
- 粉丝: 3
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功