没有合适的资源?快使用搜索试试~ 我知道了~
项目背景大数据和“云计算”像是一枚硬币的正反面一样慢慢勾勒出当今世界的财富价值风向。大数据的出现得益于互联网行业的快速发展、计算机硬件和软件能力的不断提升。大数
资源详情
资源评论
资源推荐
全国云计算应用创新大赛
职位智能分析系统
系统简介概述
参赛团队:EFISH
项目开发者:刘港
liu920848992@163.com
2018-3-10
项目背景
大数据和“云计算”像是一枚硬币的正反面一样慢慢勾勒出当今世界的财
富价值风向。大数据的出现得益于互联网行业的快速发展、计算机硬件和软件
能力的不断提升。大数据技术现已被应用到各行各业,而在招聘求职领域,我
们希望通过爬虫技术、机器学习、文本挖掘、统计分析等手段帮助求职者更好
的了解市场需求,从而有一个清晰、明确的求职方向。
系统需求分析
通过对信息的挖掘分析,可以更加精准、清晰的指导求职者所在行业的待遇
水平、自身可能的待遇、以及对公司、行业的选择。
需求一:网络爬虫
网络爬虫根据选定的网站列表(如智联招聘,51job 等)进行爬取,爬取网
站公布的招聘信息。并将爬取到的信息进行整理后存储在数据库中。
需求二:数据存储转换
解决爬取下来的数据抽取、转换、加载到大数据平台的问题。即把 MySQL 的
数据通过 sqoop 工具加载到 Hadoop 平台中的 HBase 数据库。
需求三:数据分析处理
解析爬取的数据,进行行业招聘态势的分析。通过文本信息提取、分词、关
键词提取、词频统计等数据分析算法,得到有价值的结论,同时为求职者的职位
智能推荐及网页展示功能做准备。
需求四:智能检索和推荐
分析选手的求职信息,设计数据分析算法为求职者推荐多元化的信息和匹配
的职位。
需求五:应用开发和部署
开发可与用户进行交互的推荐系统,有快速和精准的推荐和良好的用户体验效果。
系统创新点
目前国内的大多数招聘网站在职位推荐上都采用协同过滤算法和基于内容的推荐
算法。所用到的基于用户进行过滤和基于职位进行过滤虽然极大地提高了推荐的质量,
但用户往往受限于职位的具体要求,或者对行业、所处的环境没有清晰的认识,无法更
好地进行职位的选择。本系统根据这些需求作了以下创新:
一、利用大数据与云计算技术,通过海量的数据分析,利用数据分析算法,将职位
的行业分布情况,城市分布情况,薪酬分布情况、企业信息等进行数据分析。用户可以
更加清晰地了解到各地区、各行业、各企业的薪酬分布情况,使用户能更加清晰地认识
到自身所处环境,有利于求职者职业的选择。
二、利用 jieba 分词系统分词、提取关键字等技术,将职位的具体要求进行
关键词提取,将提取到的关键词和其他要求与薪酬结合,形成一个 list,使用
欧氏距离或者均方根误差来计算出职位的符合程度,进而为求职者更加智能地
推荐。
剩余14页未读,继续阅读
士多霹雳酱
- 粉丝: 21
- 资源: 299
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0