数据建模
数据分析
神经网络
机器学习
深度学习
大数据
分布式计算
预测模型
数据挖掘
自然语言处理
SASR语言
商业分析师
数据运营
数据挖掘
数据标准化
Python
SQL
Hadoop
Spark
Hive
hive
sql
python
大数据开发
redis
rabbitmq
hadoop
spark
springcloud
vue
java
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
第一阶段:数据收集和预处理 1.数据获取:从某招聘网站抓取招聘岗位数据 搜索关键词“数据科学”爬取职位描述数据→形成职位信息语料库(实验数据集) 2.数据预处理→形成结构化职位信息语料库 第二阶段:职位聚类与分析 3.得到top X 职位名称(如:10个最常见的职位;或按照阈值:所有至少有50条信息发布的职位)(需要根据数据情况调整)(可视化图表) 4.每个top职位下形成一个整合该职位信息发布的语料库 5.比较不同top职位间的相似度→得到相似度矩阵(可视化图表) 6.聚类→top职位层次聚类(可视化图表) 第三阶段:技能抽取与分析 7.识别2中不同名词短语(职业技能) 8.计算短语频次→最高频短语(top X技能) 9.按照top职位分别计算高频技能→各职位对应top X技能 10.聚类→top技能聚类(功能分组)
资源推荐
资源详情
资源评论
收起资源包目录
基于文本挖掘的数据科学职业技能抽取及可视分析.zip (16个子文件)
数据科学相关岗位信息-原始数据.json 767KB
数据科学家_职位语料库.json 68KB
基于文本挖掘的数据科学职业技能抽取及可视分析.ipynb 1.65MB
数据分析经理_职位语料库.json 28KB
生物工程_职位语料库.json 20KB
Java开发工程师_职位语料库.json 10KB
数据科学相关岗位信息-清洗后.json 748KB
算法工程师_职位语料库.json 43KB
科研人员_职位语料库.json 22KB
SimSun.ttf 10.03MB
数据建模工程师_职位语料库.json 21KB
数据分析师_职位语料库.json 98KB
大数据开发工程师_职位语料库.json 56KB
【结果导出】基于文本挖掘的数据科学职业技能抽取及可视分析.html 1.98MB
软件工程师_职位语料库.json 22KB
user_dict.txt 315B
共 16 条
- 1
资源评论
Python极客之家
- 粉丝: 1w+
- 资源: 79
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Java开发的日程管理FlexTime应用设计源码
- SM2258XT-BGA144-4BGA180-6L-R1019 三星KLUCG4J1CB B0B1颗粒开盘工具 , EC, 3A, 94, 43, A4, CA 七彩虹SL300这个固件有用
- GJB 5236-2004 军用软件质量度量
- 30天开发操作系统 第 8 天 - 鼠标控制与切换32模式
- spice vd interface接口
- 安装Git时遇到找不到`/dev/null`的问题
- 标量(scalar)、向量(vector)、矩阵(matrix)、数组(array)等概念的深入理解与运用
- 数值计算复习内容,涵盖多种方法,内容为gpt生成
- 标量(scalar)、向量(vector)、矩阵(matrix)、数组(array)等概念的深入理解与运用
- 网络综合项目实验12.19
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功