没有合适的资源?快使用搜索试试~ 我知道了~
B201710061009_张新君_李奕彤_李梦琪1
需积分: 0 0 下载量 21 浏览量
2022-08-04
14:46:39
上传
评论
收藏 505KB PDF 举报
温馨提示
试读
28页
摘要本文针对“拍照赚钱”的任务定价问题,建立基于回归性分析和聚类分析的任务定价模型,解决了任务定价规律的问题并确定了任务未完成原因;建立基于邻接矩阵的效益-成本
资源详情
资源评论
资源推荐
1
“拍照赚钱”的任务定价
摘要
本文针对
“
拍照赚钱
”
的任务定价问题,建立基于回归性分析和聚类分析的任
务定价模型,解决了任务定价规律的问题并确定了任务未完成原因;建立基于邻
接矩阵的效益
-
成本增量模型,解决了确定新的任务定价方案并且和原方案做对
比的问题;建立任务密度影响下的效益
-
成本增量模型,解决了考虑任务位置来
修改定价模型,并且分析对任务完成率影响的问题;运用修正系数下的蒙特卡罗
模拟法,解决了对新项目给出任务定价方案并评价该方案实施效果的问题。
针对问题一,建立基于回归性分析和聚类分析的任务定价模型,解决了分析
附件一任务定价规律并确定任务未完成原因的问题。首先采用回归性分析方法,
分析任务完成状况与任务位置等参数的相关性。其次考虑到不同城区的定价规律
不同,再通过聚类分析得到三个城区任务价格的完成度阈值,从而确定任务价格
与地区差异之间的联系,得到附件一中的任务定价规律,再通过对模型进行泊松
分布检验确保模型的稳定性和合理性。最后得到任务未完成的原因是:地区会员
的心理预期过高。
针对问题二,建立基于邻接矩阵的效益
-
成本增量模型,解决了确定新的任
务定价方案并且和原方案做对比的问题。假设所有工作者和任务发布者都是个体
理性,确定影响工作者是否接受任务的条件,确定接单的概率,同时考虑信誉值
对于优先级的影响,运用蒙特卡洛模拟法解决项目分配的效益最优化问题。将新
的定价方案结果和真实数据对比,以检验模型的合理性和稳定性,最后得到合理
的定价方案使得各个地区的接单工作成功率均有所提高,增益指数分别为
2.9844exp(-7)
、
2.2859exp(-7)
、
2.5690exp(-7)
。
针对问题三,建立任务密度影响下的效益
-
成本增量模型,解决了考虑任务
位置来修改定价模型,并且分析对任务完成率影响的问题。在问题二定价模型基
础上增加任务密度参数和打包后多个任务的价格变化参数,计算在减少任务数
量,提高任务价格后的任务完成率变化情况,改变打包网格的范围大小检验网格
选取的合理性,得到结果与问题二的情况形成对比,最终确定相比问题二任务完
成率有显著提高:广州达到
0.8714
;东莞总价格减少而效益基本不变;深圳上升
到
0.4937
。增益指数分别为
3.9844exp(-6)
、
4.42905exp(-6)
、
3.5613exp(-5)
。
针对问题四,运用修正系数下的蒙特卡罗模拟法,解决了对新项目给出任务
定价方案并评价该方案实施效果的问题。考虑到问题四的实际打包情况,将任务
聚集的三块区域进行划分,并对区域内部进行打包。运用修正系数下的蒙特卡洛
模拟算得最优解,与问题三的增益系数计算结果
2.1158exp(-6)
对比检验,修正系
数下的蒙特卡洛模拟结果更符合分包情况,且相应增益系数为
3.3034exp(-5)
,比
问题三的大,所以得到更加优化的新任务定价方案。
关键词: 回归性分析 聚类分析 邻接矩阵 蒙特卡罗模拟 效益
-
成本增量
2
一、 问题重述
“
拍照赚钱
”
是移动互联网下的一种自助式服务模式。用户下载
APP
,注册成
为
APP
的会员,然后从
APP
上领取需要拍照的任务(比如上超市去检查某种商
品的上架情况),赚取
APP
对任务所标定的酬金。这种基于移动互联网的自助
式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方
式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周
期。因此
APP
成为该平台运行的核心,而
APP
中的任务定价又是其核心要素。
如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。
附件一是一个已结束项目的任务数据,包含了每个任务的位置、定价和完成
情况(
“1”
表示完成,
“0”
表示未完成);附件二是会员信息数据,包含了会员的
位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信
誉越高,越优先开始挑选任务,其配额也就越大(任务分配时实际上是根据预订
限额所占比例进行配发);附件三是一个新的检查项目任务数据,只有任务的位
置信息。请完成下面的问题:
1.
研究附件一中项目的任务定价规律,分析任务未完成的原因。
2.
为附件一中的项目设计新的任务定价方案,并和原方案进行比较。
3.
实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,
一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改
前面的定价模型,对最终的任务完成情况又有什么影响?
4.
对附件三中的新项目给出你的任务定价方案,并评价该方案的实施效果。
附件一:已结束项目任务数据
附件二:会员信息数据
附件三:新项目任务数据
二、 问题分析
2.1
问题一的分析
问题一要求:研究附件一中项目的任务定价规律,分析任务未完成的原因。
问题一通过对附件一给出数据进行分析任务定价规律,是问题二的基础;问
题一属于数据相关性分析问题,通常采用聚类分析
[1]
、回归性分析、主成分分析
等方法进行求解,考虑到不同城区的定价规律不同,可以聚类分析和回归性分析
方法对附件一的数据分析,分析任务完成状况与任务位置等参数的相关性,再通
过聚类分析得到分成三个城区后任务价格的完成度阈值,分析任务价格与地区差
异之间的联系,从而确定任务未完成的原因;可以再通过计算机对模型进行泊松
分布检验确保模型的稳定性以及结果的合理性。
2.2
问题二的分析
问题二要求:为附件一中的项目设计新的任务定价方案,并和原方案进行比
较。
问题二以问题一为基础,提出新的任务定价方案并且和原方案对比,同时问
题二又是问题三、问题四的前提;问题二属于项目分配的效益最优化问题,解决
这类问题通常采用差分方程模型、统计回归模型、效益
-
成本增量
[2]
模型等方法解
决,假设所有工作者和任务发布者都是个体理性的,考虑到激励相容
[3]
的必要性
3
以及结果的直观性,选择建立效益
-
成本增量模型,求解本问题可以采用神经网
络算法、遗传算法、贪心算法
[4]
、蒙特卡罗模拟法
[5]
等方法解决,为了得到更优
化更贴近真实情况的确定结果,选择采用蒙特卡罗模拟法进行求解。
假设所有工作者和任务发布者都是个体理性的,需要确定影响工作者是否接
受任务的条件,确定接单的概率,同时还应该考虑信誉值对于优先级的影响
[6]
,
从而解决项目分配的效益最优化问题。在确定新的定价方案后,可以将结果和真
实数据对比来检验模型的合理性以及稳定性,最后才能得到合理的定价方案。
2.3
问题三的分析
问题三要求:实际情况下,多个任务可能因为位置比较集中,导致用户会争
相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改
前面的定价模型,对最终的任务完成情况又有什么影响?
问题三以问题二为基础,针对问题三将位置集中的任务联合打包发布的情
况,需要对问题二的定价模型增加任务的参数和打包后多个任务的价格变化参
数。计算出在减少任务数量,提高任务价格后的任务完成率变化情况,可以改变
打包网格的范围大小检验网格选取的合理性,最后得到结果与问题二的情况形成
对比,得到打包举措的优劣分析。
2.4
问题四的分析
问题四要求:对附件三中的新项目给出你的任务定价方案,并评价该方案的
实施效果。
问题四在问题三的分析基础上,确定附件三的新任务的定价方案,需要基于
问题三的分析过程对问题二的模型进行修改,从而得到更可信有效的方法,最好
可以提高方案的效益值。对于问题四,可以将任务聚集的三块区域进行区块划分,
将任务距离集中的小区域内部进行打包,再对蒙特卡洛模拟进行系数修正算得最
优解。得到结果后与问题三方法的对比检验基于修正系数的蒙特卡洛模拟的优越
性,从而得到更加有效的任务定价方案。
三、 基本假设
1.
在相同范围的距离内,假设花费在距离上的成本相同;
2.
假设本文讨论的区域内的工作者数量不随时间变化;
3.
假设所有工作者和任务发布者都是个体理性的,即都期望能最大化
自己的收益;
4.
工作者的信誉值越高,完成任务的可能性越大;
5.
假设任务的影响区域为任务所在区域,不能跨区域影响其他区域的
会员;
四、 符号说明
i
F
:
准阈值线之上的任务完成率
4
i
F
:
准阈值线之下的任务未完成率
i
D
:
第
i
个地区的总任务完成数
i
G
:
第
i
个地区的总任务未完成数
i
T
:
第
i
个地区的总任务数
i
M
:
每个工作者最大接单数量
d
:
准阈值线之上的任务完成数
d
:
准阈值线之上的任务未完成数
g
:
准阈值线之下的任务未完成数
g
:
准阈值线之下的任务完成数
1
:
附件一的任务完成率
i
b
:
第
i
个任务的定价
:
成本效益参数
:
会员的密度
:
任务的密度
五、 模型建立与求解
5.1
问题一的建立和求解
针对问题一研究附件一中项目的任务定价规律并分析任务未完成的原因的
问题,本文建立基于回归性分析和聚类分析的任务定价模型,分析任务完成状况
与任务位置等参数的相关性,再通过聚类分析得到分成三个城区后任务价格的完
成度阈值,分析任务价格与地区差异之间的联系。通过两种分析方式得到附件一
中项目的任务定价规律,并结合数据图像进行任务未完成原因的分析。
5.1.1
模型建立
(
1
)对附件一数据进行预处理
附件一包含完成任务和未完成任务的经纬位置和价格参数,通过对数据的预
处理,可以得到总任务的经纬位置热力图如下:
5
图
5.1.1
总任务的经纬位置热力图
在问题的假设中,本文将同一城市的会员看成一个整体,不存在与其他城市
的流通情况,这就表明可将总区域分成多个任务区域进行研究。同时通过热力图
也可发现任务密度有多个核心区域,即任务发布会聚集于城市中央区。
从任务经纬位置分布图上可以看出,可以将数据划分为三个区域,即广州区
域、东莞区域、深圳区域。由于行政边界的不规则,本文将北纬 22.8 度,东经
113.6 作为三大区域的划分标准,与实际边界线参考比对,差距不大。
按照行政地区划分,有 15 个任务点远离这三个城市区域,可以视为离群点,
相对于样本总量 835 个样本来说为极小量,不显著影响定价方案的制定。
同样的,会员的经纬位置图像如下:
图
5.1.2
会员的经纬位置图像
由会员的经纬位置分布也可同样可以得出将任务区域划分为三大区域以及
划分标准的合理性。通过对任务和会员的经纬位置图的对比,可以看出任务密度
和会员密度呈现正相关的特性,符合实际情况。
由于会员的流动,1877 个样本总量中有 22 个离群点,如安徽、重庆、海南
等地也有人做任务,在制定定价方案时,外来会员数量相对较小,影响并不显著,
剩余27页未读,继续阅读
顾露
- 粉丝: 16
- 资源: 315
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0