# NLP基础知识
- [常用数据集简介](常用数据集简介.md)
- [推荐更新源](推荐更新源.md)
- [打造NLP工具箱](打造NLP工具箱.md)
- [如何衡量机器学习分类模型](如何衡量机器学习分类模型.md)
- [词袋模型和TFIDF模型](词袋模型和TFIDF模型.md)
- [Word2Vec模型和Doc2Vec模型](Word2Vec模型和Doc2Vec模型.md)
- [自己动手训练word2vec模型](自己动手训练word2vec模型.md)
- [使用多层感知机进行文档分类](使用多层感知机进行文档分类.md)
- [使用fasttext进行文档分类](使用fasttext进行文档分类.md)
- [使用LDA进行文档主题建模](使用LDA进行文档主题建模.md)
- [使用Jieba进行中文词性标注](使用Jieba进行中文词性标注.md)
- [使用TextRank和TFIDF进行关键字自动提取](使用TextRank和TFIDF进行关键字自动提取.md)
- [文档相似度](文档相似度.md)
# NLP应用案例
- [对美食评语进行情感分析](预测Yelp美食评分.md)
# 让机器理解文字
图像、文字和声音是人类接触、理解外部世界最常见的三种形式,其中文字又是最容易保存和进行交换的形式。大量的人类文明,最终都是以文字的形式保留下来的;大量的信息交换,都是是文字的形式进行。如何能让机器可以与人交流,理解人类的思想,最终能像人类一样理解文字以及文字背后的各种想法、意图呢?自然语言处理,即所谓的NLP是重要的支撑技术。
![人机对话](人家对话.png)
# NLP与安全
在传统的web攻防中,大家与http协议结下了不解之缘。但是在安全领域,web攻防只是很小一个分支。许多明显的与工作和生活无关的垃圾邮件,人一样就可以看出来,但是基于规则的垃圾邮件网关处理起来却总是差强人意。越来越多的电商、论坛甚至是视频网站的弹幕,总是可以看到明显的人身攻击或者违法违规信息,但是基于规则的过滤机制总是被绕过。人类可以很轻松的理解二十四口交换机,知道苹果是水果还是手机,但是机器如何做到呢?答案就是NLP。
# 一本开源的NLP入门书籍
这可能是第一本用开源的思想写的NLP入门书籍,整个写作过程都在我的Github上。
https://github.com/duoergun0729/nlp
之所以想用开源的思路去写,主要是因为NLP技术,尤其是基于机器学习的NLP技术发展非常快,比如目前已经广泛使用的fasttext技术,2016年发布论文,2017年已经进入大量生产领域,但是许多自然语言处理书籍还停留在大学课程的范围,甚至连词向量都很少涉及。相对周期繁琐的纸质书籍编写,在Github上我可以很方便的进行编写和更新,有勘误也可以很快修改。目前我已经完成了其中的三篇,后面我将不断更新内容,大家可以订阅我的Github,或者关注我的微信公众号《**兜哥带你学安全**》
![公众号](公众号.png)
# License
© 2018~2020 兜哥.
本作品采用[知识共享署名-非商业性使用 4.0 国际许可协议](https://creativecommons.org/licenses/by-nc/4.0/)进行许可。没有我许可的任何使用该书进行的商业行为都是违法。
# 打赏
写书不容易,尤其是使用个人休息时间的写作,感谢您的打赏,100不嫌多1块不嫌少。
<img src="打赏.png" width = "200" alt="打赏" align=center />
如果您更喜欢知识星球这种形式,可以加入我的知识星球,NLP相关的问题也可以在星球里面提问。
<img src="知识星球.png" width = "200" alt="知识星球" align=center />
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
NLP基础知识 常用数据集简介 推荐更新源 打造NLP工具箱 如何衡量机器学习分类模型 词袋模型和TFIDF模型 Word2Vec模型和Doc2Vec模型 自己动手训练word2vec模型 使用多层感知机进行文档分类 使用fasttext进行文档分类 使用LDA进行文档主题建模 使用Jieba进行中文词性标注 使用TextRank和TFIDF进行关键字自动提取 文档相似度 NLP应用案例 对美食评语进行情感分析 让机器理解文字 图像、文字和声音是人类接触、理解外部世界最常见的三种形式,其中文字又是最容易保存和进行交换的形式。大量的人类文明,最终都是以文字的形式保留下来的;大量的信息交换,都是是文字的形式进行。如何能让机器可以与人交流,理解人类的思想,最终能像人类一样理解文字以及文字背后的各种想法、意图呢?自然语言处理,即所谓的NLP是重要的支撑技术。
资源推荐
资源详情
资源评论
收起资源包目录
nlp-master.zip (81个子文件)
nlp-master
Word2Vec模型和Doc2Vec模型.md 8KB
picture
预测Yelp美食评分-图4.png 23KB
预测Yelp美食评分-图6.png 51KB
使用LDA进行文档主题建模-图3.png 13KB
使用fasttext进行文档分类-图1.png 227KB
使用多层感知机进行文档分类-图5.png 189KB
使用fasttext进行文档分类-图3.png 61KB
常用数据集简介-图8.png 304KB
预测Yelp美食评分-图1.png 13KB
常用数据集简介-图3.png 90KB
使用TextRank和TFIDF进行文档关键字自动提取-图2.png 16KB
文档相似度-图3.png 1KB
预测Yelp美食评分-图3.png 15KB
常用数据集简介-图5.png 198KB
文档相似度-图1.png 89KB
如何衡量机器学习分类器模型-图2.png 62KB
使用LDA进行文档主题建模-图4.png 161KB
使用LDA进行文档主题建模-图2.png 16KB
使用CNN进行文档分类-图1.png 51KB
NLP之Word2Vec模型和Doc2Vec模型-图2.png 36KB
如何衡量机器学习分类器模型-图1.png 27KB
使用CNN进行文档分类-图2.png 80KB
使用fasttext进行文档分类-图2.png 16KB
使用多层感知机进行文档分类-图2.png 139KB
词袋模型和TFIDF模型-图1.png 74KB
使用TextRank和TFIDF进行文档关键字自动提取-图1.png 52KB
常用数据集简介-图1.png 237KB
使用搜狗新闻预料生成word2vec-图1.png 131KB
使用多层感知机进行文档分类-图4.png 61KB
使用CNN进行文档分类-图4.png 148KB
预测Yelp美食评分-图2.png 32KB
常用数据集-图4.png 300KB
Word2Vec模型和Doc2Vec模型-图1.png 34KB
使用CNN进行文档分类-图3.png 158KB
使用多层感知机进行文档分类-图1.png 627KB
使用LDA进行文档主题建模-图1.png 27KB
使用多层感知机进行文档分类-图3.png 40KB
文档相似度-图2.png 1KB
使用fasttext进行文档分类.md 13KB
使用TextRank和TFIDF进行关键字自动提取.md 5KB
推荐更新源.md 1KB
打赏.png 69KB
公众号.png 26KB
预测Yelp美食评分.md 24KB
文档聚类.md 2KB
使用CNN进行文档分类.md 23KB
paper
Convolutional Neural Networks for Sentence Classification.pdf 236KB
自己动手训练word2vec模型.md 6KB
词袋模型和TFIDF模型.md 7KB
使用Jieba进行中文词性标注.md 4KB
知识星球.png 63KB
文档相似度.md 11KB
使用多层感知机进行文档分类.md 6KB
人家对话.png 38KB
.gitignore 7B
如何衡量机器学习分类模型.md 4KB
使用LDA进行文档主题建模.md 10KB
README.md 4KB
常用数据集简介.md 15KB
code
clustering.py 6KB
ner.py 1KB
yelp-cnn-model-mlp.png 148KB
lda.py 5KB
yelp-cnn-model.png 52KB
cnn.py 16KB
yelp.py 15KB
yelp-cnn-model-textcnn.png 148KB
yelp-mlp-model.png 32KB
预测yelp评分-图6.png 51KB
similarities.py 4KB
itchat.pkl 1.73MB
yelp_sentiment_stars.png 15KB
progressive-tweet-sentiment.csv 626KB
yelp_stars.png 13KB
mlp.py 4KB
keywords.py 1KB
stopwords.txt 17KB
fasttext.py 4KB
weixin.py 3KB
打造NLP工具箱.md 9KB
说明.pdf 22KB
共 81 条
- 1
资源评论
AaronWang94
- 粉丝: 1716
- 资源: 245
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功