【免费】人工智能面试图-问题+答案.docx资源-CSDN文库

人工智能

需积分: 0 9 浏览量 2022-12-29 19:31:41 上传评论收藏 2.46MB DOCX 举报

资源推荐

资源详情

资源评论

人工智能笔试题目及答案

1. 深度学习和过往的神经网络训练方法有什么区别？列举几种深度

学习的 loss function，并说明意义

深度学习是一种方法，神经网络是个模型，深度学习方法呢可以有效解决层数多的神经

网络不好学习的问题，为了让层数较多的多层神经网络可以训练，能够起作用并演化出

来的一系列的新的结构和新的方法；

结构：一般分为两大阵营，CNN,RNN，感觉这里欠妥，请指正。

方法：权重初始化方法（逐层初始化，XAVIER 等），损失函数，防止过拟合方法

（Dropout, BN 等）。

这些方面主要都是为了解决传统的多层神经网络的一些不足：梯度消失，过拟合等。

分类问题常用的损失函数：

（1）交叉熵损失函数，也称作 softmax 损失函数，可用于解决多分类问题，通过指数

化将输出转换成概率的形式；

（2）合页损失函数，一般情况下，交叉熵损失函数的效果优于合页损失函数；

（3）坡道损失函数，对离群点或者噪声的抗干扰能力强，是一种鲁棒性的损失函数，

对误差较大的区域会进行截断；

（4）大间隔损失函数，保证能够正确分类的同时，还满足增大类间的差异，提升了特

征的分辨能力，防止网络发生过拟合；

（5）中心损失函数，保证能够正确分类的同时，还满足减少类内的差异，提升了特征

的分辨能力；

回归问题常用的损失函数：

（1）l1 损失函数，衡量的是预测值与真实值之间的偏差；

（2）l2 损失函数，效果优于 l1；

（3）tukey‘s biweight 损失函数，是一种具有鲁棒性的损失函数；

其他任务的损失函数：

KL 散度损失函数，衡量的是样本标记分布与真是标记分布的差异，可用于年龄估计等。

2. 什么是卷积神经网络？请说明卷积的意义

分开看就明确了，“卷积” 和 “神经网络”.

卷积也就是说神经网络不再是对每个像素的输入信息做处理了,而是图片上每一小块像

素区域进行处理, 这种做法加强了图片信息的连续性. 使得神经网络能看到图形, 而非一

个点. 这种做法同时也加深了神经网络对图片的理解.

具体来说, 卷积神经网络有一个批量过滤器, 持续不断的在图片上滚动收集图片里的信

息,每一次收集的时候都只是收集一小块像素区域, 然后把收集来的信息进行整理, 这时

候整理出来的信息有了一些实际上的呈现, 比如这时的神经网络能看到一些边缘的图片

信息, 然后在以同样的步骤, 用类似的批量过滤器扫过产生的这些边缘信息, 神经网络从

这些边缘信息里面总结出更高层的信息结构,比如说总结的边缘能够画出眼睛,鼻子等等.

卷积的重要的物理意义是：一个函数（如：单位响应）在另一个函数（如：输入信号）

上的加权叠加，这就是卷积的意义：加权叠加，不同的卷积核提供了不同的加权方式，

从而得到鲁棒的特征，进行参数共享，大大减少了参数量，避免过拟合；

3. 什么是中文分词？列举出几种你所知的分词方法

中文分词就是将中文按语义分出词语来，与英文不同，中文词语之间没有空格，需要根

据语义经验等知识来将一组汉字序列进行切分出一个个词语

中文分词主要分为三种：

（1）机械分词法：是一种基于词典的方法，是将文档中的字符串与词典中的词条一一

匹配，如果在词典中找到了某个字符串，则匹配成功，可以切分，否则不予切分。该方

法实现简单，使用性强，但对于词典的完备性要求很高。

（2）基于语法和规则的分词方法：是在分词的同时进行句法和语义分析，通过句法和

语义信息来标注词性，以解决分词歧义的现象。但汉语语法笼统，复杂，所以该种方法

的精度不尽人意，目前仍处于试验阶段。

（3）基于统计的分词法：根据字符串在语料中出现的统计词频来判断其是否构成一个

词。词是字的组合，相邻的字同时出现的次数越多越有可能成为一个词。该种方法因精

度高，效果稳定，成为目前最流行的一种方法，常见的分词模型有 HMM, CRF, biLSTM+CRF

等

4. 现在深度学习在 nlp 领域有哪些应用？请具体说明

1.机器翻译，or 神经机器翻译（NMT）在翻译中提供了统计方式之外的另一种方式，同

时也更加简便。

2.知识问答，问答机器人，可以用深度学习模型，从语料中学习获得一些问题的答案。

3.自然语言生成，能够根据一些关键信息及其在机器内部的表达形式，经过一个规划过

程，来自动生成一段高质量的自然语言文本。

5. 传统图像处理提取的 sift 特征是什么意思？

sift 指的是 scale invarient feature transform，即尺度不变特征变换。

sift 特征是一种对缩放、旋转、光照变化等不敏感的局部图像特征，其提取过程是先生

成图像的尺度空间，然后在尺度空间中检测极值点作为关键点，最后利用关键点邻域的

梯度信息生成特征描述符。

6. 什么叫过拟合，避免过拟合都有哪些措施？

答：过拟合：就是在机器学习中，我么测试模型的时候，提高了在训练数据集的表现力

时候，但是在训练集上的表现力反而下降了。

解决方案：

1.正则化

2.在训练模型过程中，调节参数。学习率不要太大.

3.对数据进行交叉验证

4.选择适合训练集合测试集数据的百分比，选取合适的停止训练标准，使对机器的训练

在合适

5.在神经网络模型中，我们可以减小权重

7. LR 和 SVM 的联系与区别是什么？

1.都是分类算法

2.如果不考虑核函数，LR 和 SVM 都是线性分类算法，也就是说他们的分类决策面都是

线性的

3.LR 和 SVM 都是监督学习算法

4.LR 和 SVM 的损失函数不同

5.SVM 只考虑局部的边界线附近的点，LR 考虑全局，远离的点对边界线的确定也起作

用

8. 给你一个有 1000 列和 1 百万行的训练数据集，这个数据集是基于

分类问题的。经理要求你来降低该数据集的维度以减少模型计算时间，

但你的机器内存有限。你会怎么做？（你可以自由做各种实际操作假

设。）

1.由于我们的 RAM 很小，首先要关闭机器上正在运行的其他程序，包括网页浏览器等，

以确保大部分内存可以使用。

2.我们可以随机采样数据集。这意味着，我们可以创建一个较小的数据集，比如有 1000

个变量和 30 万行，然后做计算。

3.为了降低维度，我们可以把数值变量和分类变量分开，同时删掉相关联的变量。对于

数值变量，我们将使用相关性分析；对于分类变量，我们可以用卡方检验。

4.另外，我们还可以使用 PCA（主成分分析），并挑选可以解释在数据集中有最大偏差

的成分。

5.利用在线学习算法，如 VowpalWabbit（在 Python 中可用）是一个不错的选择。

6.利用 Stochastic GradientDescent（随机梯度下降法）建立线性模型也很有帮助。

7.我们也可以用我们对业务的理解来估计各预测变量对响应变量的影响的大小。但是，

这是一个主观的方法，如果没有找出有用的预测变量可能会导致信息的显著丢失。

9. 给你一个数据集，这个数据集有缺失值，且这些缺失值分布在离

中值有 1 个标准偏差的范围内。百分之多少的数据不会受到影响？为

什么？

剩余73页未读，继续阅读

评论收藏

内容反馈

ArronPhilipLouis

粉丝: 3
资源: 1

人工智能面试图-问题+答案.docx

人工智能机器学习面试题和答案.docx

人工智能面试题共50题含答案和解析.docx

50道常用人工智能面试题以及答案解析.docx

人工智能-面试题大全-适用于求职者提神自我大厂必备.docx

关于AI产品经理的面试题目.docx

如何面试1.docx 大数据项目+项目介绍+面试辅导

2019年关于AI产品经理的面试题目.docx

项目介绍5.docx大数据项目+项目介绍+面试辅导

PYTHON学习教程-面试题大全-适用于求职者提神自我大厂必备.docx

项目介绍6.docx大数据项目+项目介绍+面试辅导

自我介绍13.docx大数据项目+项目介绍+面试辅导

如何面试2.docx 大数据项目+项目介绍+面试辅导

Matlab学习教程-安装过程-适用于求职者提神自我大厂必备.docx

美赛备赛资料-几道真题-参考价值不大，需要的下.docx

如何面试3.docx

吉大人工智能2020直博复试回忆版.docx

创青春、互联网+商业计划书（50套）.zip

项目介绍2.docx 大数据项目+项目介绍+面试辅导

项目介绍8.docx 大数据项目+项目介绍+面试辅导

《点燃我温暖你》中李峋的同款爱心代码

122版本Chrome最新驱动-122.0.6261.58

Python入门基础教程全套.ppt

Tesseract最新中文语言包chi-sim.traineddata

Stable Diffusion WebUI linux部署问题

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

Microsoft C++ Build Tools

Python学习笔记(干货) 中文PDF完整版.pdf

PUBG罗技宏代码免费

抢购haiwei.rar

最新资源