- 先运行main.py进行文本序列化,再train.py模型训练 dataset.py from torch.utils.data import DataLoader,Dataset import torch import os from utils import tokenlize import config class ImdbDataset(Dataset): def __init__(self,train=True): super(ImdbDataset,self).__init__() data_path = rH:\073-nlp自然语言处理5 4730浏览¥ 9.90
- 01-初心缘由 最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其中包含了很多算法的演变,目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法,其中RNN扮演了非常重要的作用,深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统,从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现,发现语音识别的效果没有写的那么好,其中如果要从零来训练自己的语言模型势必会非常耗时。 因此,就有了一个新的想法,借助一些开源的语音识别SDK来实现语音识别,来看看他们语音识别的效果如何。于是想到了百度和科大讯飞,然后就百度了一5 1691浏览¥ 9.90
- 本章节主要研究内容:基于PyTorch 深度学习工具来完成短文本分类 知识点 业务需求 文本分类应用场景、技术方案以及挑战 技术架构 文本分析 词向量 CNN 原理 tensorboardX 可视化 项目实战: 基于TextCNN短文本分类,主要从数据预处理、构建此表、Embedding、模型训练、tensorboardX可视化以及在线服务几个重要的环境进行学习 文本分类应用场景 文章分类服务对文章内容进行深度分析,输出文章的主题一级分类、主题二级分类及对应的置信度,该技术在个性化推荐、文章聚合、文本内容分析等场景具有广泛的应用价值. 新闻分类 根据文本描述的内容方向,针对新闻媒体的文章做自动4 2133浏览¥ 9.90
- 从2018年中国科学院大学自然语言处理期末考试挑选了一些有含金量的题目进行解答5 429浏览¥ 9.90
- word2vec介绍 word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代表两个词关联度越高。 词向量:用Distributed Representation表示词,通常也被称为“Word Representation”或“Word Embedding5 1798浏览¥ 9.90
- 近十年来,人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用,尽管拥有强大的模拟预测能力,深度学习还面临着超大计算量的问题。在硬件层面上,GPU,ASIC,FPGA都是解决庞大计算量的方案。本文将阐释深度学习和FPGA各自的结构特点以及为什么用FPGA加速深度学习是有效的,并且将介绍一种递归神经网络(RNN)在FPGA平台上的实现方案。 揭开深度学习的面纱 深度学习是机器学习的一个领域,都属于人工智能的范畴。深度学习主要研究的是人工神经网络的算法、理论、应用。自从2006年Hinton等人提出来之后,深度学习高速发展,在自然语言处理、图像处理、语音处理等领域都取得了非0 999浏览¥ 9.90
- 数字化正改变着人类的生产和生活方式,水务行业的数字化变革也正如火如荼。作为水务行业的积极参与者和推动者,国际水协会- -直致力于帮助全球水务行业推进数字化进程,鼓励水务行业采用更加智慧的方式提供更高效的水务服务和管理工作。 国际水协会通过弓|导全球水务机构主动应对气候变化,深入挖掘客户需求,积极响应监管要求,努力提高绩效表现,来保证所提供服务的效率和可靠性,并强调人工智能可为之提供切实可行、效果明显的实用方案。 百度是拥有强大互联网基础的领先Al公司,自主创新研发了Al 芯片和深度学习开源架,以及语音识别、知识图谱、自然语言处理等人工智能技术和产品服务,致力于技术创新与产业革命的深度融合,助力各个行业的数字化升级与智能化改造。 水务与人工智能相结合会碰撞出怎样的火花? 本报告书由国际水协会和百度共同撰写,以人工智能赋能水务行业的国内外案例分析为重点,从水务行业数字化转型的重要趋势和使命着笔,深入探讨人工智能在水务行业价值链.上发挥的重要作用。百度凭借其在专业领域的深厚积累,详细解读人工智能顶层规划和总体架构。国际水协会通过对不同应用场景的分析,以更加通俗易懂的语言为读者提供人工智能赋能水务行业的解决方案思路及案例研究。 水务数字化变革势在必行,人工智能将为这一转型助力赋能,为守护“绿水青山”保驾护航。5 865浏览¥ 9.90
- 投稿Knowledge-Based Systems(KBS)所需文件。将里面的文字复制到word,并使用电子签名放到下方。可私我加微信发。5 758浏览¥ 11.90
- 我们通常用困惑度(perplexity)来评估语言模型的好坏。可以探索一下交叉熵损失函数的定义。困惑度是对交叉熵损失函数做指数运算后得到的值。特别地: 最佳情况下,模型总是把标签类别的概率预测为1,此时困惑度为1; 最坏情况下,模型总是把标签类别的概率预测为0,此时困惑度为正无穷; 基线情况下,模型总是把预测所有类别的概率都相同,此时困惑度为类别个数。 显然,任何一个有效模型的困惑度必须小于类别个数。 假定交叉熵损失函数为:H(y(i),y^(i))=−∑j=1qyj(i)logy^j(i)H(y^{(i)},\hat{y}^{(i)})=-\sum_{j=1}^qy_j^{(i)}log\h0 3718浏览¥ 9.90
- 引言 自从Mikolov在他2013年的论文“Efficient Estimation of Word Representation in Vector Space”提出词向量的概念后,NLP领域仿佛一下子进入了embedding的世界,Sentence2Vec、Doc2Vec、Everything2Vec。词向量基于语言模型的假设——“一个词的含义可以由它的上下文推断得出“,提出了词的Distributed Representation表示方法。相较于传统NLP的高维、稀疏的表示法(One-hot Representation),Word2Vec训练出的词向量是低维、稠密的。 在上一篇文章里5 2840浏览¥ 9.90
- 案例1:利用贝叶斯方法的多项式模型分析新闻数据 数据#1 !wget http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz !ls !tar -xzf 20news-bydate.tar.gz !ls !ls 20news-bydate-test !ls 20news-bydate-train !ls 20news-bydate-test/rec.autos !cat 20news-bydate-test/rec.autos/103744 数据#2 !git clone https://github.com/qiwsir/Data5 914浏览¥ 9.90
- 2023年3月份微软评测:GPT-4已经初具通用人工智能的雏形。通过测试,微软的研究者证实:GPT-4不仅精通语言,还能在数学、编程、视觉、医学、法律、心理学等多样化和高难度的任务中表现出色,且无需特别提示。AGI的智能体现在能够像人类一样思考和推理,并且还能够涵盖广泛的认知技能和能力。 论文中,指出AGI具有推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习能力。 论文地址:https://arxiv.org/pdf/2303.12712.pdf,4 536浏览¥ 1.90
- LLM原理与ChatPDF实现.pdf5 801浏览¥ 11.90
- 面向元数据管理的知识图谱本体模型.pdf5 315浏览¥ 11.90
- 自然语言处理课程教学大纲电子教案.pdf5 255浏览¥ 19.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85221099 【全部课程列表】 第01章 自然语言处理概论 共64页.pptx 第02章 基础知识-数学基础与语言学基础 共75页.ppt 第03章 汉语的分词与频度统计 共88页.pptx 第04章 汉语语料库的多级加工 共82页.pptx 第05章 n-gram语言模型 共78页.ppt 第06章 Markov模型 马尔科夫模型 共57页.ppt 第07章 句法分析技术 共61页.ppt 第08章1 问答系统基础 共24页.ppt 第08章2 问答式信息检索的理论与方法研究进展报告 共31页.ppt 相似的认知心理学模型:系统相似模型 共65页.ppt 一篇论文的诞生 共70页.ppt 自然语言处理大总结 脑图总结.pdf5 1435浏览¥ 11.90
- 自然语言处理期末复习A4纸.pdf5 335浏览¥ 11.90
- 前言 大家都知道,英文的分词由于单词间是以空格进行分隔的,所以分词要相对的容易些,而中文就不同了,中文中一个句子的分隔就是以字为单位的了,而所谓的正向最大匹配和逆向最大匹配便是一种分词匹配的方法,这里以词典匹配说明。 最大匹配算法是自然语言处理中的中文匹配算法中最基础的算法,分为正向和逆向,原理都是一样的。 正向最大匹配算法,故名思意,从左向右扫描寻找词的最大匹配。 首先我们可以规定一个词的最大长度,每次扫描的时候寻找当前开始的这个长度的词来和字典中的词匹配,如果没有找到,就缩短长度继续寻找,直到找到或者成为单字。 下面话不多说了,来一起看看详细的介绍吧。 实例: S1=”计算语言学课程是三个0 423浏览¥ 9.90
- Improving Language Understanding by Generative Pre-Training 提出了半监督的方式来做语言理解,也就是无监督的pre-train,和有监督的fine-tune。该方法首先无监督的pre−trainpre-trainpre−train模型,学习到更加普遍、更适用的表征,然后模型以很小的微调迁移到众多特定的有监督学习任务上。在实验效果上,大幅超过了众多任务的state-of-art。不同于以无监督的方式学习到一些特征,然后利用这些特征喂给一些特定的有监督模型,这里是先无监督的pre−trainpre-trainpre−train模型,然后直接fine-tune预训练后的模型,迁移到一些特定的有监督任务上5 276浏览¥ 11.90
- Attention Is All You Need主要的序列转导模型基于复杂的递归或卷积神经网络,包括编码器和解码器。性能最好的模型还通过注意机制连接编码器和解码器。我们提出了一种新的简单网络结构,即Transformer,它完全基于注意力机制,完全不需要重复和卷积。5 1113浏览¥ 11.90
- 本文主要介绍了语音识别系统的基础知识,包括语音识别系统的应用、结构以及 算法。重点阐述了语音识别系统的原理以及相关算法,通过参考查阅资料,借助 MATLAB工具,设计基于VQ 码本训练程序和识别程序,识别特定人的语音。 系统主要包括训练和识别两个阶段。 实现过程包括对原始语音进行预加重、 分帧、 加窗等处理,提取语音对应的特征参数。在得到了特征参数的基础上,采用模式识别 理论的模板匹配技术进行相似度度量,来进行训练和识别。在进行相似度度量时,采 用 VQ 算法对特征参数序列重新进行时间的对准。 VQ 在孤立词语音识别系统中得到很好的应用,特别是有限状态矢量量化技术, 对于语音识别更为有效。基于 VQ 的孤立词语音识别系统具有分类准确,存储数据少, 实时响应速度快等综合性能好的特点。5 87浏览¥ 11.90
- 可以直接看最下面的例子,再回头看前面的解释 在pytorch中,常见的拼接函数主要是两个,分别是: stack() cat() 实际使用中,这两个函数互相辅助:关于cat()参考这个torch.cat(),但是本文主要说stack()。 前言 函数的意义:使用stack是为了保留–[1. 序列(先后)] 和 [2. 张量矩阵] 信息, 常出现在自然语言处理(NLP)和图像卷积神经网络(CV)中。 1. stack()官方解释 官方解释:沿着一个新维度对输入张量序列进行连接。 序列中所有的张量都应该为相同形状。 浅显说法:把多个2维的张量凑成一个3维的张量;多个3维的凑成一个4维的张量…以此类推0 2154浏览¥ 9.90
- 云小蜜对话机器人背后自然语言处理知识图谱语音图像数据采集的核心算法31页.pdf5 179浏览¥ 79.90
- 本文介绍了人脸图像识别中所应用MATLAB对图像进行预处理, 应用该工具箱对图像进行经典图像处理,通过实例来应用 matlab 图像 处理功能,对某一特定的人脸图像处理,进而应用到人脸识别系统。本 文在总结分析人脸识别系统中几种常用的图像预处理方法基础上,利 用 MATLAB 实现了一个集多种预处理方法于一体的通用的人脸图像3 / 36 预处理仿真系统,将该系统作为图像预处理模块可嵌入在人脸识别系 统中,并利用灰度图像的直方图比对来实现人脸图像的识别判定。5 149浏览¥ 11.90
- 国科大高级人工智能试题以及答案总结.pdf 过去几年高级人工智能考试题及考点详细分析,仅供参考5 144浏览¥ 11.90
- NLP技术分享 深度学习与自然语言处理 舆情分析、智能聊天机器人 【课程列表】 1、自然语言处理 2、深度学习 3、舆情分析 4、智能聊天机器人5 266浏览¥ 20.90
- 面向NLP自然语言处理的深度学习对抗样本综述.pdf 深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击,但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题。针对自然语言处理领域同样面临对抗样本的风险,在阐明对抗样本相关概念的基础上,文中首先对基于深度学习的自然语言处理模型的复杂结构、难以探知的训练过程和朴素的基本原理等脆弱性成因进 行 分析,进一步阐述了文本对抗样本的特点、分类和评价指标,并对该领域对抗技术涉及到的典型任务和数据集进行了阐述;然后按照扰动级别对主流的字、词、句和多级扰动组合的文本对抗样本生成技术进行了梳理,并对相关防御方法进行了归纳总结;最后对目前自然语言处理对抗样本领域攻防双方存在的痛点问题进行了进一步的讨论和展望。5 396浏览¥ 11.90
- 第121课:Rasa对话机器人Debugging项目实战之电商零售对话机器人运行流程调试全程演示-45 138浏览¥ 2.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 23浏览¥ 17.90
- Ai人工智能技术分享 知识图谱技术及应用介绍-面向中文知识图谱构建的知识融合与验证 共49页.pdf5 168浏览¥ 17.90
- 【课程列表】 One hot编码 Word2vec的相关概念 Word2vec的实现方式 Word2vec的训练方式 Word2Vec实战 Fasttext高效的文本分类和表示工具 Glove一种更别致的词向量表示5 99浏览¥ 22.90
- 字母点评2021年中国人工智能产品采购指南知识图谱平台23页.pdf5 60浏览¥ 17.90
- 小样本自然语言处理的元学习 小样本自然语言处理(NLP)是指NLP任务只具有少量标注的样例。这是人工智能系统必须学会处理的现实挑战。通常我们依赖于收集更多的辅助信息或开发一个更有效的学习算法。5 247浏览¥ 11.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 42浏览¥ 11.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 19浏览¥ 17.90
- 面向自然语言处理任务的预训练模型综述.pdf5 410浏览¥ 19.90
- 【大纲】 语义Web与链接数据 跨语言知识链接 跨语言属性值抽取 跨语言本体构建 XLORE-跨语言知识图谱 未来工作5 73浏览¥ 11.90
- 云计算、大数据等技术的飞速发展,加快了人工智能的进步,从而加快了自然语言处理、机器人技术、机器学习、人脸识别等技术的飞速发展。人工智能目前已开始推动各个产业的变革浪潮,为各个产业带来更多的价值。相应地,各行各业也在积极探索人工智能在行业中的应用,本文主要介绍了人工智能在商业银行支付结算领域的应用背景、主要影响及具体应用场景,分析人工智能在商业银行支付结算领域的风险和存在问题及应对措施。5 448浏览¥ 11.90
- 自然语言处理技术分享-深度文本匹配在搜索场景中的应用 【研究成果】 文本匹配演进 研究工作介绍 模型效果评测 【业务落地】 语义搜索 多媒体搜索 需求全面满足 需求预先满足5 77浏览¥ 11.90
- 南京硅基智能自然语言处理知识图谱语音图像数据采集.pdf5 109浏览¥ 54.90
- State of GPT:揭秘OpenAI大模型原理和训练过程(2023).pdf5 88浏览¥ 17.90
- 物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案物联网制式LoRa_的技术特点及测试方案5 59浏览¥ 29.90
- 自然语言处理技术在金融资管领域的落地实践(49页).pdf5 44浏览¥ 19.90
- ChatGPT 中文指令手册5 196浏览¥ 4.90
- 2019年中国自然语言处理行业研究报告精品报告2020.pdf5 88浏览¥ 9.90
- 面向目标检测的对抗样本综述.pdf 目标检测是一种广泛应用于工业控制、航空航天等安全攸关场景的重要技术。近年来,随着深度学习在目标检 测领域的应用,检测的精度得到了较大提升,但由于深度学习固有的脆弱性,使得基于深度学习的目标检测技术的可靠性 和安全性面临新的挑战。本文通过对近几年面向目标检测的对抗样本生成及防御的研究进行分析和总结,致力于为增强目 标检测模型的鲁棒性和提出更好的防御策略提供思路。首先,介绍了对抗样本的概念、产生原因以及目标检测领域对抗样 本生成常用的评价指标和数据集。然后根据对抗样本生成的扰动范围将攻击分为全局扰动攻击和局部扰动攻击。在这个分 类基础上,又分别从攻击的目标检测器类型、损失函数设计等六个方面对目标检测的对抗样本生成方法进行了分析和总结, 并通过实验对比了几种典型目标检测对抗攻击方法的性能,同时比较了这几种方法的跨模型的迁移攻击能力。此外,本文 还对目前目标检测领域常用的对抗防御策略进行了分析和归纳。最后,总结了目标检测领域对抗样本的生成及防御所面临 的挑战,并对未来发展方向做出了展望。5 309浏览¥ 11.90
- 京东智能客服自然语言处理知识图谱语音图像数据采集24页.pdf5 146浏览¥ 54.90
- 人工智能(ArtificialIntelligence)指由人类制造出来的机器所展现出来的智能,试图通过计算机来模拟人的思维过程和行为。目前这一领域主要包括计算机视觉、自然语言处理、跨媒体分析推理、智适应学习、群体智能、自主无人系统、智能芯片和脑机接口等关键技术,将为人类的生产生活带来革命性的转变。5 307浏览¥ 54.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 22浏览¥ 17.90
- 北京交通大学2021-2022(2)《编译原理》期末试卷(A)-0620.pdf5 104浏览¥ 2.90
- NLP基于深度学习的自然语言处理综述.pdf 相比传统的机器学习,深度学习试图模仿人的学习思路,通过计算机自动完成海量数据的特征提取,文中对近三年的相关文献进行了研究,首先从深度学习的基本概念进行说明,然后对深度学习应用于自然语言处理方面的研究进行阐述,最后对深度学习在NLP处理领域之后的发展方向与问题进行了阐述。5 828浏览¥ 11.90
- 【课程列表】 1.自然语言处理是什么? 2.语言模型 3.语料库和语言知识库 4.词法分析 5.句法分析 6.语义分析 7.词向量 8.文本分类 9.机器翻译 10.信息抽取 11.篇章分析 12.问答系统5 506浏览¥ 22.90
- 自然语言处理:TextCNN.pdf5 51浏览¥ 19.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 15浏览¥ 17.90
- 【课程简介】 本课程适合所有需要学习自然语言处理技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85228430 【全部课程列表】 第01章 互联网挖掘概述概要 共40页.pdf 第02章 信息检索基础(一) 文本信息检索 共80页.pdf 第03章 信息检索基础(二) Web检索 共54页.pdf 第04章 自然语言处理基础 共64页.pdf 第05章 数据挖掘基础与关联规则挖掘 共65页.pdf 第06章 分类算法 共56页.pdf 第07章 聚类算法 共53页.pdf 第08章 互联网信息摘要 共62页.pdf 第09章 中文智能问答系统 共7页.pdf 第10章 情感分析与观点挖掘 共59页.pdf 第11章 互联网信息抽取 共58页.pdf 第12章 信息推荐 共46页.pdf 第13章 社交网络分析 共53页.pdf5 22浏览¥ 17.90
- 【精品】淘宝智能客服架构自然语言处理知识图谱语音图像数据采集演进之路.pdf0 64浏览¥ 59.90
- 斯坦福文本分类朴素贝叶斯算法实现课程讲义20210 67浏览¥ 9.90
- 众所周知,自然语言处理是机器学习中的重要环节,而自然语言处理需要大量数据作 为分析基础。一方面,机器学习算法需要高质量的标注数据,句法分析、图像识别等算法 的深入研究对各类标注数据的需求加大;另一方面,不同的研究方向对数据的标注要求各 不相同,因此数据标注就具有了非常广泛的应用价值。 数据标注就是对原始的数据,包括语音、文本、图片、视频等进行加工处理,转换为 机器可识别信息的过程。数据标注系统是指一个针对某一个特定任务,人工标注其正确答 案。以中文分词为例,首先数据标注系统中会显示一个汉语句子,如“我是一个中国人”; 然后标注者通过鼠标点击动作,将句子切分为一个词语序列“我/是/一个/中国/人”。这样的 人工标注数据对于统计机器模型和算法很重要。 本课题基于一个现有的数据标注系统进行改进,利用 jQuery 框架改写网页前端,使它 在不同浏览器、不同平台正常工作,并基于动态依存弧画图对原有的界面进行优化,使其 有更好的视觉效果。0 52浏览¥ 9.90
- Rasa对话机器人连载二十五 第127课:Rasa对话机器人Debugging项目实战之教育领域项目微服务调用全生命周期调试(四).pdf0 99浏览¥ 9.90
- Rasa对话机器人连载二 第121课:Rasa对话机器人Debugging项目实战之电商零售对话机器人运行流程调试全程演示-2.pdf0 107浏览¥ 9.90