# NLP基础知识
- [常用数据集简介](常用数据集简介.md)
- [推荐更新源](推荐更新源.md)
- [打造NLP工具箱](打造NLP工具箱.md)
- [如何衡量机器学习分类模型](如何衡量机器学习分类模型.md)
- [词袋模型和TFIDF模型](词袋模型和TFIDF模型.md)
- [Word2Vec模型和Doc2Vec模型](Word2Vec模型和Doc2Vec模型.md)
- [自己动手训练word2vec模型](自己动手训练word2vec模型.md)
- [使用多层感知机进行文档分类](使用多层感知机进行文档分类.md)
- [使用fasttext进行文档分类](使用fasttext进行文档分类.md)
- [使用LDA进行文档主题建模](使用LDA进行文档主题建模.md)
- [使用Jieba进行中文词性标注](使用Jieba进行中文词性标注.md)
- [使用TextRank和TFIDF进行关键字自动提取](使用TextRank和TFIDF进行关键字自动提取.md)
- [文档相似度](文档相似度.md)
# NLP应用案例
- [对美食评语进行情感分析](预测Yelp美食评分.md)
# 让机器理解文字
图像、文字和声音是人类接触、理解外部世界最常见的三种形式,其中文字又是最容易保存和进行交换的形式。大量的人类文明,最终都是以文字的形式保留下来的;大量的信息交换,都是是文字的形式进行。如何能让机器可以与人交流,理解人类的思想,最终能像人类一样理解文字以及文字背后的各种想法、意图呢?自然语言处理,即所谓的NLP是重要的支撑技术。
![人机对话](人家对话.png)
# NLP与安全
在传统的web攻防中,大家与http协议结下了不解之缘。但是在安全领域,web攻防只是很小一个分支。许多明显的与工作和生活无关的垃圾邮件,人一样就可以看出来,但是基于规则的垃圾邮件网关处理起来却总是差强人意。越来越多的电商、论坛甚至是视频网站的弹幕,总是可以看到明显的人身攻击或者违法违规信息,但是基于规则的过滤机制总是被绕过。人类可以很轻松的理解二十四口交换机,知道苹果是水果还是手机,但是机器如何做到呢?答案就是NLP。
# 一本开源的NLP入门书籍
这可能是第一本用开源的思想写的NLP入门书籍,整个写作过程都在我的Github上。
https://github.com/duoergun0729/nlp
之所以想用开源的思路去写,主要是因为NLP技术,尤其是基于机器学习的NLP技术发展非常快,比如目前已经广泛使用的fasttext技术,2016年发布论文,2017年已经进入大量生产领域,但是许多自然语言处理书籍还停留在大学课程的范围,甚至连词向量都很少涉及。相对周期繁琐的纸质书籍编写,在Github上我可以很方便的进行编写和更新,有勘误也可以很快修改。目前我已经完成了其中的三篇,后面我将不断更新内容,大家可以订阅我的Github,或者关注我的微信公众号《**兜哥带你学安全**》
![公众号](公众号.png)
# License
© 2018~2020 兜哥.
本作品采用[知识共享署名-非商业性使用 4.0 国际许可协议](https://creativecommons.org/licenses/by-nc/4.0/)进行许可。没有我许可的任何使用该书进行的商业行为都是违法。
# 打赏
写书不容易,尤其是使用个人休息时间的写作,感谢您的打赏,100不嫌多1块不嫌少。
<img src="打赏.png" width = "200" alt="打赏" align=center />
如果您更喜欢知识星球这种形式,可以加入我的知识星球,NLP相关的问题也可以在星球里面提问。
<img src="知识星球.png" width = "200" alt="知识星球" align=center />
没有合适的资源?快使用搜索试试~ 我知道了~
使用MLP(多层感知机)进行情感分析,使用fasttext进行文档分类
共68个文件
png:41个
md:16个
py:8个
需积分: 50 37 下载量 82 浏览量
2018-05-14
19:11:34
上传
评论 3
收藏 3.44MB ZIP 举报
温馨提示
Python语言,word2vec模型,词袋模型和TFIDF模型,使用MLP(多层感知机)进行情感分析,使用fasttext进行文档分类
资源推荐
资源详情
资源评论
收起资源包目录
nlp-master.zip (68个子文件)
nlp-master
常用数据集简介.md 14KB
打造NLP工具箱.md 6KB
打赏.png 69KB
如何衡量机器学习分类模型.md 4KB
Word2Vec模型和Doc2Vec模型.md 8KB
自己动手训练word2vec模型.md 6KB
使用多层感知机进行文档分类.md 6KB
人家对话.png 38KB
code
ner.py 1KB
similarities.py 4KB
lda.py 3KB
yelp_sentiment_stars.png 15KB
progressive-tweet-sentiment.csv 626KB
yelp.py 15KB
fasttext.py 4KB
stopwords.txt 17KB
yelp-mlp-model.png 32KB
mlp.py 4KB
预测yelp评分-图6.png 51KB
yelp-cnn-model.png 52KB
yelp_stars.png 13KB
keywords.py 1KB
clustering.py 3KB
使用TextRank和TFIDF进行关键字自动提取.md 5KB
公众号.png 26KB
预测Yelp美食评分.md 24KB
README.md 4KB
使用fasttext进行文档分类.md 13KB
文档聚类.md 489B
使用LDA进行文档主题建模.md 6KB
picture
使用搜狗新闻预料生成word2vec-图1.png 131KB
使用多层感知机进行文档分类-图5.png 189KB
词袋模型和TFIDF模型-图1.png 74KB
使用TextRank和TFIDF进行文档关键字自动提取-图2.png 16KB
预测Yelp美食评分-图2.png 32KB
使用fasttext进行文档分类-图3.png 61KB
使用LDA进行文档主题建模-图1.png 27KB
使用TextRank和TFIDF进行文档关键字自动提取-图1.png 52KB
使用多层感知机进行文档分类-图3.png 40KB
使用fasttext进行文档分类-图2.png 16KB
使用多层感知机进行文档分类-图2.png 139KB
预测Yelp美食评分-图4.png 23KB
常用数据集简介-图3.png 90KB
如何衡量机器学习分类器模型-图2.png 62KB
使用多层感知机进行文档分类-图1.png 627KB
常用数据集-图4.png 300KB
如何衡量机器学习分类器模型-图1.png 27KB
使用LDA进行文档主题建模-图2.png 16KB
使用fasttext进行文档分类-图1.png 227KB
预测Yelp美食评分-图1.png 13KB
文档相似度-图3.png 1KB
常用数据集简介-图1.png 237KB
NLP之Word2Vec模型和Doc2Vec模型-图2.png 36KB
预测Yelp美食评分-图6.png 51KB
常用数据集简介-图5.png 198KB
预测Yelp美食评分-图3.png 15KB
使用LDA进行文档主题建模-图3.png 13KB
常用数据集简介-图8.png 304KB
Word2Vec模型和Doc2Vec模型-图1.png 34KB
文档相似度-图2.png 1KB
文档相似度-图1.png 89KB
使用多层感知机进行文档分类-图4.png 61KB
文档相似度.md 11KB
词袋模型和TFIDF模型.md 7KB
使用Jieba进行中文词性标注.md 4KB
.gitignore 7B
推荐更新源.md 1005B
知识星球.png 63KB
共 68 条
- 1
资源评论
Tank_wick
- 粉丝: 1
- 资源: 7
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功