没有合适的资源?快使用搜索试试~ 我知道了~
Linkedin:在数据分析师职位信息上进行文本挖掘
共13个文件
png:3个
js:2个
py:2个
需积分: 0 1 下载量 102 浏览量
2021-05-14
14:51:05
上传
评论
收藏 470KB ZIP 举报
温馨提示
在数据分析师职位信息上进行文本挖掘 概述 为了获得与数据分析师职位相关的必要详细信息,我计划从linkedin中抓取职位信息,并实施文本挖掘以了解雇主的一般性要求或可取性要求。 Web抓取所有数据分析师职位-Python 通常,在此过程中存在两个问题。 登录问题: 使用请求会话登录(我使用过)b。 Selenium(慢/需要保留登录历史记录) Ajax问题:如何识别和查找我们想要覆盖的数据。 职位信息的文本挖掘 预处理:Nan值删除停用词列表创建将所有字母都以小写字母删除标点符号删除停用词删除其他空格 词频和共现分析 选择城市图形制图工作分布技能集频率索引重要性关键词云图主题分析 结果 频率分析 为了充分了解频率,我删除了无意义的单词以及过于频繁的单词(例如数据)。 基于云这个词,我们可以看作是一个数据分析师,它主要需要分析,报告,可能实现的工作。 雇主希望您具有业务意识,管理和团队
资源推荐
资源详情
资源评论
收起资源包目录
Linkedin-master.zip (13个子文件)
Linkedin-master
1_linkedin_scapping.py 4KB
graph
Rplot01.png 55KB
WordCloud.png 274KB
Rplot02.png 43KB
textminig.R 11KB
README.md 2KB
vis
lda.json 74KB
ldavis.js 52KB
lda.css 291B
index.html 405B
d3.v3.js 302KB
topic_analysis.htm 421B
1_job_position.py 2KB
共 13 条
- 1
资源评论
以网为生
- 粉丝: 28
- 资源: 4595
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 上市公司-股票性质数据-工具变量(民企、国企、央企)2003-2022年.dta
- 上市公司-股票性质数据-工具变量(民企、国企、央企)2003-2022年.xlsx
- Reeds+Shepp曲线算法讲解和实现.pdf
- 毕业设计基于SpringBoot+MyBatisPlus+MySQL+Vue的外卖配送信息系统源代码+数据库
- 词向量(Word Embeddings)是自然语言处理(NLP)领域的一种重要技术.txt
- Surfer,线性函数
- MyBatis 的动态 SQL 是其核心特性之一.txt
- 时代的sdddsddsddsd
- 基于哈希链表的简单人员信息管理系统
- 其他类别JdonFramework开源框架 v5.1 Build20071025-jdonframework-5.1.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功