没有合适的资源?快使用搜索试试~ 我知道了~
matlabhill代码-data_engineer_challenge_h1b_stats_optimized:完整和优化的解...
共20个文件
ds_store:5个
md:4个
txt:4个
需积分: 5 0 下载量 29 浏览量
2021-05-24
04:08:08
上传
评论
收藏 26KB ZIP 举报
温馨提示
Matlab Hill代码问题 一家报纸编辑正在研究过去几年中有关H1B(H-1B,H-1B1,E-3)签证申请处理的移民数据趋势,试图确定获得批准的H1B签证数量最多的职业和州。 她从美国劳工部及其部门获得了统计数据。 但是,尽管有针对和的现成报告,但该网站过去几年都没有这些报告。 作为数据工程师,您需要创建一种机制来分析过去几年的数据,具体计算两个指标:经认证的签证申请的前十名职业和前十名国家。 您的代码应该是模块化的,并可以在将来重用。 如果报纸获取了2019年的数据(假设可以使用必要的数据来计算指标)并将其放在input目录中,则运行run.sh脚本应在output文件夹中生成结果,而无需进行更改编码。 输入数据集 原始数据可以在“披露数据”选项卡下找到(即,披露文件列中列出的文件,扩展名为“ .xlsx”)。 为方便起见,我们将Excel文件转换为以分号分隔(“;”)的格式,并将其放入此Google驱动器中。 但是,不要只对我们在Google云端硬盘上提供的文件上的代码进行测试 注意:每年的数据可以有不同的列。 在开发之前,请检查“文件结构”文档。 指示 我们设计了此编码挑战
资源推荐
资源详情
资源评论
收起资源包目录
data_engineer_challenge_h1b_stats_optimized-master.zip (20个子文件)
data_engineer_challenge_h1b_stats_optimized-master
README.md 17KB
run.sh 302B
LICENSE 1KB
.gitattributes 66B
src
README.md 1B
h1b_counting.py 2KB
.DS_Store 6KB
insight_testsuite
tests
test_1
output
top_10_states.txt 151B
top_10_occupations.txt 238B
input
h1b_input.csv 5KB
.DS_Store 8KB
.DS_Store 8KB
run_tests.sh 3KB
.DS_Store 8KB
output
README.md 1B
top_10_states.txt 151B
top_10_occupations.txt 237B
input
README.md 1B
h1b_input.csv 5KB
.DS_Store 12KB
共 20 条
- 1
资源评论
weixin_38501363
- 粉丝: 2
- 资源: 901
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功