没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
用到的数据共 4 张表(cvs 格式),为 2003-2019 年美国纽
约市房地产交易数据。
� NYC_HISTORICAL 包含:交易 ID,社区 ID,地址,建
筑类型,时间,价格,面积等;
� BOROUGH 包含:BOROUGH_ID 和 BOROUG 名称;
� BUILDING_CLASS 包含:建筑 ID 和建筑类型等;
� NEIGHBORHOOD 包含:街道 ID 和 BOROUGH_ID 等;
本案例需要根据 ID 整合数据,从中提取目标信息。
场景模拟:
雇主是一家房地产中介企业,现有在纽约市拓展业务的计划,
但是不知道选择纽约市的哪个地区。故请来了数据分析师
(你),给了上述 4 张表的数据,请你分析一下。
“数据就这些,帮我用回归什么的分析一下吧,帮我选几个能
赚的多的地方”。雇主说道。
你有些紧张,雇主的说法模糊,让你不知如何下手。
开始分析前:
1. 快速的浏览数据。巧妇难为无米之炊,数据的内容和范围
决定了你能做到的事情,也决定了你如何与雇主展开询问
【不懂的地方(如变量含义)在一开始问清楚,中途再问只
会暴露自己的不专业】。例如:
‘数据中有大量交易价格和面积为零的数据,请问这是?’
‘哦,经常会有房产转移这样的,比如父母给子女。你不用管
就行’
2. 挖掘雇主的需求。很多时候,雇主自己都不知道一次分析
能带来什么,也许就是随便看看。你需要帮助雇主找到他的
需求,进而解决。不然很可能花费大力气分析了一堆,在雇
主眼里不知所云毫无价值。
‘贵公司是想要在纽约市开设房产中介,故想选择一个区域,
该区域最好交易多,是吗?’
‘对对,最好价格也高,因为中介费和交易价格挂钩。要单子
多,且价格高’
......
经过严谨的询问,你知道了:这是一家房产中介公司,业务
集中于住宅类型中介服务,包括买卖和租赁。【但是该数据
没有租赁的数据,经过询问,你确定这次分析集中在买卖上,
无需考虑租赁】因此,你的目标是,帮助雇主在纽约市选择
一个,交易多,且价格高的地区。
3. 了解雇主的想法。很少有雇主两眼一抹黑就来找数据分析
师,大部分都会带着心里有的方案,希望在分析师这得到确
认。你需要了解雇主的想法,将其纳入你分析的考虑因素中。
例如:雇主在找你前,心中已经选定了几个合适的地区
你可以:‘纽约市很大,请问您现在有意向的几个地区吗’
回答 A:‘我觉得...和...几个地方就不错,你帮我着重看一下’
(那你在分析的时候,千万不能漏了)
回答 B:‘现在还没有,你就帮我排一排最好的几个吧’(你可
以放心的继续了)
开始筛选
导入,合并数据(在第一章节中讲过,不多赘述)
library(lubridate)
library(tidyverse)
剩余57页未读,继续阅读
资源评论
xiaoshun007~
- 粉丝: 3851
- 资源: 3130
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功