2020级-20210522-周宣辰 - 副本1 本周报总结小论文进展中,作者分享了关于RNN、LSTM、GRU、One-Hot编码、词嵌入等自然语言处理技术的知识点。 作者优化了手写体的RNN,正确率从0.6提高到0.8以上。这表明作者已经拥有了基础的RNN知识,并且具备了基本的优化能力。 作者介绍了RNN实例LSTM和GRU。LSTM(Long Short-Term Memory)是一种特殊类型的RNN,旨在解决梯度消失和梯度爆炸问题。GRU(Gated Recurrent Unit)是LSTM的一种变体,速度可以快很多,而精度基本不变。作者还提到了jieba分词,jieba是常用的中文分词工具。 然后,作者分享了Python爬虫实例,使用了bs和正则表达式。bs是BeautifulSoup的简称,BeautifulSoup是一个Python的库,用于解析HTML和XML文档。正则表达式是一种强大的字符串匹配工具,常用于文本处理和爬虫。 在本周工作摘要问题一中,作者回答了“什么是LSTM和GRU?”的问题。作者解释了LSTM和GRU是如何解决梯度消失和梯度爆炸问题的,并且解释了GRU相比LSTM的速度优势。 在本周工作摘要问题二中,作者回答了“OneHot编码”的问题。OneHot编码是一种独热编码方式,用于将离散的变量转换为连续的向量。作者还解释了OneHot编码的缺点,例如稀疏矩阵的问题,并且提到了相关性为0的问题。 作者分享了词嵌入的知识点。词嵌入是一种自然语言处理技术,用于将词语转换为向量。作者使用了PyTorch的Embedding层,展示了如何将一个词表转换为向量。作者还解释了词嵌入的优点,例如可以捕捉到词语之间的相关性。 本周报总结小论文进展涵盖了RNN、LSTM、GRU、One-Hot编码、词嵌入等自然语言处理技术。作者分享了这些技术的知识点,并且展示了它们的应用。
- 粉丝: 34
- 资源: 307
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
评论0