2024-04-18 佚名
卷烟市场的价格波动一直是行业关注的焦点。为了更好地理解市场状态并做出合适的决策,本文将通过上下两期文章去介绍如何通过随机森林算法进行卷烟市场价格预测及策略研究。
在“十三五”时期,我国经济发展进入新常态,宏观经济转型和产业结构调整加速,卷烟消费需求及环境发生显著变化。“十四五”以来,行业全面应用互联网+、云平台、大数据、AI等技术,积极探索新一代信息技术在烟草“农工商政”领域的融合应用。根据市场价格指数、社会库存等信息,去把握市场供需关系的微妙平衡,合理调配卷烟供应、销售结构、投放策略,以确保高水平、高质量的市场稳定。
作为卷烟市场状态的重要评判依据的市场价格,在任何市场状态的评价中都属于最核心的数据指标,为此工商公司通过多种途径,以获得市场价格的数据来源,从而保障在货源投放数字化的基础。
评价体系往往是通过已知的价格数值构建价格指数,另加其他终端指标对市场进行综合评价。评价的方法基本都是通过多项指标之间的权重进行加权打分,如层次分析法、熵权法、变异系数法等,再通过阈值判断其定性状态。
这样的判定方法有两个缺陷,一是指标较多,太多弱影响的指标分去了评价的权重,导致评价的结果无法反映真实的结果,二是数据以静态为主,缺乏预知性,对于调控而言存在一定的滞后性。
虽然预测是一个适应性、准确性难以把握的工作,但是它又有很高的必要性,尤其是当前我们处于数字时代,面临数字化转型,由数字化向智慧化转化,一定是通过机器学习的不断迭代、更优质的数据采集以及市场的细分等,达到预测更精确、应用更广泛、场景转化和适应更灵活的目的。
针对以上两个问题,首先要优选指标,指标的数量控制在合理范围之内,既能保障评价的全面性,又能突出重点指标的贡献作用。二是通过已知有限的指标集合,通过机器学习的方式对卷烟市场价格进行预测,形成动态的价格参数,用来弥补价格静态的不足,对市场评价体系的综合应用具有重要的应用价值。
考虑到烟草工业企业获取数据的维度有限,选定进货户数、上柜率、重购率、动销率、商业库存、订足面、断货率、订单满足率、竞品销量9个指标作为研究指标(见表1),以某卷烟品牌规格在2019年10月-2023年6月的月度数据作为样本。
表1指标解释
随机森林算法可以用于分类和回归,其中随机森林分类是基于原始样本集通过Bootstrap抽样法抽取样本子集构建多棵决策树,最终通过众数投票的方式来决定最优分类决策结果。核心思想是对训练集进行自助采样,组成多个训练集,每个训练集生成一棵决策树,所有决策树组成随机森林,从而对样本进行训练并预测的机器学习算法。
某卷烟品牌自2019年上市以来,2023年上半年销量为1370箱,市场份额达到13.82%。但是市场价格从上市之初的270元/条,呈规律性的滑落(每年的5月以后价格小幅回升,到下半年7月左右又开始下滑,且屡创新低)。如图2所示:
图2某卷烟品牌自上市以来的价格波动情况
通过对随机森林模型的参数设置,其中内部节点分裂的最小样本数为2,叶子节点的最小样本数为2,树的最大深度为10,叶子节点的最大数量为50,决策树数量为100,得到运行结果,其特征重要性如图3:可以发现订足面重要性最高,其次是竞品销量和库存。
图3随机森林模型下的特征重要性排序
我们可以看到,随机森林模型在卷烟市场价格预测中表现出了良好的效果,通过随机森林模型,可以分析出影响品牌价格波动的因素,及其重要性排序,为行业提供了重要的决策参考。
随着技术的进一步发展,我们可以期待更多智能化的解决方案,从而促进烟草行业的持续健康发展。