没有合适的资源?快使用搜索试试~ 我知道了~
2023年全国大学生数学建模大赛c题
需积分: 0 1 下载量 22 浏览量
2024-03-02
20:11:34
上传
评论 1
收藏 2.53MB PDF 举报
温馨提示
试读
29页
自用资源,请勿转载
资源推荐
资源详情
资源评论
1
商超蔬菜类商品销售预测与优化
摘 要
本文主要利用皮尔逊相关性分析、岭回归分析、时间序列模型—
ARIMA
时间预测
模型、目标规划—遗传算法,基于
“
成本加成定价
”
的原则对生鲜商超蔬菜类商品的补
货决策与定价进行分析。
首先,对附件数据进行预处理,将
4
个附件整合成一个数据集。同时,剔除对结
果分析没有正面影响的无效数据,并使用
3
σ准则识别并移除异常值。
对于问题一,我们可以通过图表、分析描述性统计、
K
均值聚类算法、分类汇总
求和以及频数分析来分析蔬菜各品类和单品的销售量分布规律和相互关系。根据分析
结果,节日对蔬菜销量有重大影响。同时蔬菜被分为三类。第一类是日常生活中常用
的主要蔬菜。第二类用作配菜的辅助蔬菜。第三类具有时令性质的蔬菜。我们发现花
叶类、辣椒类和食用菌是销售量较大且销售频次较高的蔬菜品类,而菊花油菜和鲜粽
叶的销量不稳定。此外,我们还可以进行
JB
检验,检验蔬菜单品销量与品类是否符
合正态分布。然后,通过皮尔逊相关系数分析,我们可以得出辣椒类蔬菜与其他五类
蔬菜之间存在较强的相关性。这样的分析可以帮助我们深入了解不同蔬菜品类和单品
之间的销售规律和相关性。例如,叶类、水生根茎类、食用菌和花菜类这四类蔬菜之
间存在较大的相关性,而茄类蔬菜与生根茎类和食用菌之间的相关性较小。
对于问题二,首先,我们剔除非打折退货仍然导致亏损的蔬菜数据,以减少不必
要的成本损失和补货。其次,我们可以利用岭回归分析来解得蔬菜销售总量以及各品
类销量的预测值与批发价格和销售单价呈负相关,即当批发价格或销售单价增加时,
预测的销售总量会相应下降。接下来,基于
“
成本加成定价
”
的原则,我们利用各品类
蔬菜往年的平均定价和平均批发价,计算出各品类蔬菜的加成率,从而确定合理的定
价范围。然后,我们可以使用时间序列模型通过分析历史数据的趋势对
2023
年
7
月
1
日至
7
月
7
日期间各类蔬菜的销售量和批发价进行预测。最后,结合预测结果和品类
的平均损耗率,我们可以计算出所需的最优补货量和定价。
对于问题三,我们首先提取了
2023
年
6
月
24
日至
30
日期间的销售的
48
种蔬菜
单品数据。然后,运用
ARIMA
模型对这些单品在
7
月
1
日的销售情况进行预测,并
选择了销售量较大的
30
个单品作为补货候选单品。为了避免过量补货导致蔬菜滞销
的情况,我们将预测得到的销售量作为当天的补货量。在确定补货单品和补货量之后,
我们应用目标规划—遗传算法来预测所选择
30
种单品在
7
月
1
日当天的最优定价,
并提供最佳的定价策略。这样,我们能够更好地决策补货量和提高盈利能力。通过目
标规划—遗传算法的迭代优化,我们可以找到
30
种单品在
7
月
1
日的最佳定价,从
而实现销售收入的最大化。
对于问题四,我们需要综合考虑供应和消费两个方面的因素。在供应方面,商超
可以收集蔬菜产地数据和时令数据,并了解蔬菜产地的气候规律。商超可以通过拓宽
进货渠道、响应政策以及与政府部门和农产品生产企业合作来制定合理的补货和定价
策略。在消费方面,商超可以根据消费主体的特点和需求进行调整。商超可以收集多
样化的蔬菜烹饪方式,并通过网络销售数据了解消费者的偏好和需求。这样可以帮助
商超制定合理的补货和定价策略,满足消费者需求,提高收益,并在市场竞争中取得
更好的发展。
关键词:
ARIMA
时间预测 岭回归分析 皮尔逊相关性分析 目标规划
2
一、 问题重述
1.1 问题背景
随着脱贫攻坚取得胜利,我国全党各族人民正迈向全面建设社会主义现代化国家
的新征程。人民对美好生活的需求日益增长,这给传统的生鲜商超带来了巨大挑战。
蔬菜类商品的保鲜期较短,品相也会随销售时间的增加而变差,大部分品种如果当日
未售出,隔日就无法再售。在满足顾客需求和合理利用销售空间方面,商超在不确切
知道具体单品和进货价格的情况下,需要做出合理的补货决策。
商超销售的蔬菜品种众多,产地也不尽相同,进货交易时间通常在凌晨 3:00-4:00
之间。因此,商家需要根据市场需求情况,在限定的时间内进行推算和决策。蔬菜的
定价一般采用“成本加成定价”方法,商超对运输损耗和品相变差的商品通常进行打
折销售,以保证消费者的购买欲望。
为了做出准确的补货和定价决策,可靠的市场需求分析变得尤为重要。从供给侧
来看,蔬菜的供应品种在 4 月至 10 月较为丰富;从需求侧来看,蔬菜类商品的销售
量与时间存在一定的关联关系。因此,在商超销售空间有限的情况下,合理的销售组
合策略变得非常重要。
综上所述,商超需要结合市场需求分析,准确把握蔬菜的补货和定价时机。同时,
根据不同品种的特点和销售状况,科学地设计销售组合,以满足顾客需求,提高销售
额和顾客满意度。
1.2 问题重述
本文将对某超市经销的 6 个蔬菜品类进行分析建模。附件 1 给出了该商超经销的
6 个蔬菜品类的商品信息;附件 2 和附件 3 分别给出了该商超 2020 年 7 月 1 日至 2023
年 6 月 30 日各商品的销售流水明细与批发价格的相关数据;附件 4 给出了各商品近
期的损耗率数据。根据附件数据相关信息建立模型,解决以下四个问题:
针对问题一:蔬菜类商品在销售中可能存在一定的关联性,包括不同品类或不同
单品之间的关系。通过分析附件 1、附件 2 以及附件 3 得出蔬菜销售量的分布规律和
彼此之间的相互关系。
针对问题二:商超一般以品类为单位做补货计划,通过附件 2、附件 3 以及附件
4 分析各蔬菜品类的销售总量与成本加成定价的关系。同时为了使商超收益最大,请
给出各蔬菜品类未来一周(2023 年 7 月 1-7 日)的日补货总量和定价策略。
针对问题三:为了使商超在满足市场需求的情况下,利用有限的蔬菜销售空间内
使其收益最大化,商超需要进一步制定单品的补货计划。要求可售单品总数控制在
27-33 个,且各单品订购量满足最小陈列量 2.5 千克的要求。根据 2023 年 6 月 24-30
日的可售品种,给出 7 月 1 日的单品补货量和定价策略。
针对问题四:通过上述三个问题的分析,试提出合理的意见和理由,指明商超还
需采集哪些相关数据,从而更好地完善蔬菜商品的补货和定价决策。
二、 问题分析
2.1 问题一的分析
根据问题一分析蔬菜各品类及单品销售量的分布规律和相互关系。我们可以通过
3
折线图分析、描述性统计、
K
均值聚类算法、分类汇总求和分析及频数分析对蔬菜各
品类及单品销售量的分布规律进行分析;同时先对数据进行
JB
检验,检验其是否符
合正态分布,之后通过皮尔逊相关性检验等方法,我们可以深入了解不同蔬菜品类和
单品之间的销售规律和相关性,得出蔬菜各品类及单品销售量的相互关系。
2.2 问题二的分析
根据问题二,我们可以按照以下步骤进行分析和预测:首先,我们需要剔除那些
非打折退货仍然导致亏损的蔬菜数据,以减少不必要的成本损失和补货。其次,我们
可以利用岭回归分析来解决各品类销量与成本加成定价之间的相关性问题。接下来,
基于
“
成本加成定价
”
的原则,我们可以利用各品类蔬菜往年的平均定价和平均批发价,
计算出各品类蔬菜的加成率,这将帮助我们确定合理的定价范围。然后,我们可以使
用时间序列模型(
ARIMA
模型)对
2023
年
7
月
1
日至
7
月
7
日期间各类蔬菜的销售
量和批发价进行预测。最后,结合预测结果和品类的平均损耗率,我们可以计算出所
需的最优补货量和定价。
2.3 问题三的分析
根据问题三,我们首先提取了
2023
年
6
月
24
日至
30
日期间的销售的蔬菜单品数
据。然后,我们运用
ARIMA
模型对这些单品在
7
月
1
日的销售情况进行预测,并选
择了销售量较大的
30
个单品作为补货候选单品。接下来,为了确定补货数量,我们
将预测得到的销售量作为当天的补货量。这样可以确保我们根据预测结果来合理地控
制库存,避免过量或不足的情况。在确定补货单品和补货量之后,我们应用目标规划
—遗传算法来预测当天的最优定价。
2.4 问题四的分析
根据问题四商超在制定蔬菜的补货和定价决策时,需要综合考虑供应和消费两个
方面的因素。首先,商超可以分析蔬菜的产地和季节性因素对销售量和价格的影响。
不同产地的蔬菜可能具有不同的品质和口感,影响消费者的购买意愿。蔬菜的季节性
供应会导致供需关系的变动,从而影响价格波动。商超可以根据不同时段和地区的供
应情况,调整补货量和定价策略,以满足消费者需求并提高销售效益。其次,商超需
要关注消费主体的变化、生活节奏的变化以及消费观念的变化对蔬菜销售量和价格的
影响。随着年轻人比例的增加,消费者倾向于选择便捷和多样化的蔬菜烹饪方式。消
费者对蔬菜的健康价值和品质要求也在提高,对有机蔬菜和新鲜度有更高的关注度。
商超可以根据这些变化,调整补货量,并通过提供高品质、便捷的蔬菜选择来吸引消
费者并设定相应的价格策略。通过综合考虑供应和消费两个方面的因素,商超可以科
学、有针对性地制定补货和定价策略,提高销售效益,并满足消费者对蔬菜的需求
三、 模型假设
1.
假设数据中盒装、份装蔬菜每份为
1
千克。
2.
假设所有退货蔬菜原因不可控。
3.
假设
2023
年
7
月
1-7
日不存在不可抗力影响蔬菜正常批发价及销量。
4.
假设所有蔬菜销售数据真实可靠。
5.
假设该商超存在单笔亏损情况,而非异常记录。
4
四、 符号说明
符号
说明
JB
JB 统计定义量
S
JB
统计偏度
K
JB 统计峰度
r
皮尔逊相关系数
z
i
商超单品收益
x
i
销售总量
y
i
单品定价
k
i
单品批发及
d
i
预测最大销售量
五、 数据预处理
对于本题所给出的数据,在进行分析和建模时,需要将不同附件中的数据进行整
合,以便进行全面的数据分析,同时可能存在无效数据其体量较小,对分析过程无法
造成任何影响,甚至会有负面效果,并且其数据量巨大,收集到的数据中可能存在异
常值等问题,需要进行数据清洗,以保证后续分析和建模的准确性。。
通过对数据进行预处理,不仅可以减小误差,提高模型的准确性,还能更好地理
解数据本身,从而为商超制定决策提供更加精确的信息。
图 1.数据处理流程图
5.1 数据整合
数据整合是指将来自不同来源或格式的数据合并到一个单一的数据集中,以便更
方便地进行分析和处理。
数据整合对数据分析非常重要,原因如下:
提供全局视角:通过将多个数据源的信息整合到一个数据集中,可以获得更全面
的数据视图。这有助于我们更好地理解数据之间的关联关系和趋势。
精确分析结果:数据分散在多个附件,进行准确的分析变得困难。数据整合可以
减少数据片段的存在,并确保数据的一致性和准确性,从而提高分析结果的可信度。
发现隐藏模式和见解:整合数据集可以帮助识别潜藏在数据中的模式和见解。
提高决策效果:通过整合多个数据,分析时可以基于更全面的信息进行决策。这
5
有助于降低决策的风险,并促使更明智和有根据的决策。
综上所述,数据整合是为了更好地理解数据、提高分析结果准确性和发现隐藏见
解的关键步骤。它帮助我们从多个角度分析数据,以做出更明智的商业决策和战略规
划。通过
wps
将附件
1
、附件
2
、附件
3
以及附件
4
进行数据整合,将销售日期、单
品编码、扫码销售时间、销量、销售单价、销售类型、是否打折销售、单品名称、分
类名称、批发价格、单品损耗率损耗率在同一表格呈现,以便更直观全面的对数据进
行分析。
5.2 无效数据处理
无效数据处理是指在数据分析过程中对无效数据进行清理、纠正或删除的过程。
它是为了确保数据集的准确性、一致性和完整性,以便进行可靠的数据分析。
无效数据处理对数据分析非常重要,原因如下:
提高数据质量:无效数据可能会导致分析结果不准确或误导性。通过处理无效数
据,可以提高数据质量,确保分析结果更加可信和准确。
保持数据一致性:无效数据的存在可能导致数据集内部的不一致性,例如不一致
的格式、单位或数据类型。处理无效数据可以消除这种不一致性,使数据分析更加准
确和可靠。
优化分析效率:对庞大数据集中进行分析时,存在无效数据可能会增加计算和处
理的时间和成本。通过处理无效数据,可以减少不必要的计算和分析过程,提高分析
效率。
综上所述,对整合后的数据进行筛选,剔除出现蔬菜售卖频次低于
6
次以及批发
价低于
0.1
的无效数据,同时售卖之后退货现象大部分因为不可控因素导致,因此再
剔除退货数据。端正整个数据集的分布特征,避免其导致误导性的结果,使数据分析
者得出错误的结论,从而提高结果的准确性和可靠性。
5.3 3σ准则异常值处理
3
σ准则处理是一种常用的统计方法,用于识别和处理异常值的方法。该方法基
于正态分布假设,将异常值定义为与平均值相差超过
3
个标准差的观测值。
具体步骤如下:
计算数据集的平均值μ和标准差σ;确定上下限阈值:将上限设定为 μ
+ 3
σ,
下限设定为 μ
- 3
σ;检查数据集中的每个观测值,如果某个观测值超过上限或低于
下限,则将其标记为异常值;根据需要,可以选择删除、替换或进行其他处理来处理
检测到的异常值。
3
σ准则处理对数据分析很重要的原因如下:
异常值的影响:异常值可能会显著影响数据的统计指标和分析结果。它们可能会
导致偏差、不准确的模型拟合以及误导性的结论。通过使用
3
σ准则处理,可以有效
地识别和处理这些异常值,从而提高分析结果的可靠性。
数据的可靠性和一致性:异常值可能是数据采集或录入错误的结果,也可能是真
实的极端观测值。通过将异常值识别出来,并根据需要进行处理,可以提高数据的质
量、一致性和可靠性。
预测和决策的准确性:异常值可能会对预测模型和决策制定产生不良影响。通过
3
σ准则处理异常值,可以提高模型的准确性和可靠性,帮助更准确地进行预测和做
出有效的决策。
剩余28页未读,继续阅读
资源评论
deepxxx
- 粉丝: 0
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功