2020级-20210522-周宣辰 - 副本1
需积分: 0 178 浏览量
更新于2022-08-08
收藏 128KB DOCX 举报
2020级-20210522-周宣辰 - 副本1
本周报总结小论文进展中,作者分享了关于RNN、LSTM、GRU、One-Hot编码、词嵌入等自然语言处理技术的知识点。
作者优化了手写体的RNN,正确率从0.6提高到0.8以上。这表明作者已经拥有了基础的RNN知识,并且具备了基本的优化能力。
作者介绍了RNN实例LSTM和GRU。LSTM(Long Short-Term Memory)是一种特殊类型的RNN,旨在解决梯度消失和梯度爆炸问题。GRU(Gated Recurrent Unit)是LSTM的一种变体,速度可以快很多,而精度基本不变。作者还提到了jieba分词,jieba是常用的中文分词工具。
然后,作者分享了Python爬虫实例,使用了bs和正则表达式。bs是BeautifulSoup的简称,BeautifulSoup是一个Python的库,用于解析HTML和XML文档。正则表达式是一种强大的字符串匹配工具,常用于文本处理和爬虫。
在本周工作摘要问题一中,作者回答了“什么是LSTM和GRU?”的问题。作者解释了LSTM和GRU是如何解决梯度消失和梯度爆炸问题的,并且解释了GRU相比LSTM的速度优势。
在本周工作摘要问题二中,作者回答了“OneHot编码”的问题。OneHot编码是一种独热编码方式,用于将离散的变量转换为连续的向量。作者还解释了OneHot编码的缺点,例如稀疏矩阵的问题,并且提到了相关性为0的问题。
作者分享了词嵌入的知识点。词嵌入是一种自然语言处理技术,用于将词语转换为向量。作者使用了PyTorch的Embedding层,展示了如何将一个词表转换为向量。作者还解释了词嵌入的优点,例如可以捕捉到词语之间的相关性。
本周报总结小论文进展涵盖了RNN、LSTM、GRU、One-Hot编码、词嵌入等自然语言处理技术。作者分享了这些技术的知识点,并且展示了它们的应用。
张博士-体态康复
- 粉丝: 35
- 资源: 307
最新资源
- (18956428)STM32F103C8T6 小系统原理图 PCB
- (175828796)python全国疫情数据爬虫可视化分析系统(django)源码数据库演示.zip
- 记账本项目市场需求文档(MRD)
- (31687028)PID控制器matlab仿真.zip
- 基于SpringBoot的“在线答疑系统”的设计与实现(源码+数据库+文档+PPT).zip
- (11828838)进销存系统源码
- 记账本项目三大模块原型图
- fed54987-3a28-4a7a-9c89-52d3ac6bc048.vsidx
- (177367038)QT实现教务管理系统.zip
- (178041422)基于springboot网上书城系统.zip