产品需求预测
作者:互联网
产品需求预测
机器学习中的需求预测- 机器学习技术允许预测在定义的未来期间要购买的产品/服务的数量。在这种情况下,软件系统可以从数据中学习以改进分析。与传统的需求预测方法相比,机器学习
- 加快数据处理速度
- 提供更准确的预测
- 根据最新数据自动更新预测
- 分析更多数据
- 识别数据中的隐藏模式
- 创建一个强大的系统
- 提高对变化的适应性
随着人工智能和机器学习的到来,大多数企业都在寻求流程自动化并使用大数据来实施人工智能。 Research and Markets 的 2019 年报告 报告 说,2018 年零售业的人工智能为 7.2 亿美元,预计 2019-2024 年的复合年增长率将达到 35.4%。
- 供应商关系管理 .通过对客户需求的数量进行预测,可以计算要订购多少产品,让您轻松决定是否需要新的供应链或减少供应商的数量。
- 客户关系管理 .计划购买东西的客户期望他们想要的产品立即可用。需求预测使您可以预测下一个时期需要从特定商店位置购买哪些类别的产品。这可以提高客户满意度和对您品牌的承诺。
- 订单履行和物流 .需求预测功能优化了供应链。这意味着在订购时,产品更有可能有库存,未售出的商品不会占据主要零售空间。
- 营销活动 .预测通常用于调整广告和营销活动,并且可以影响销售数量。复杂的机器学习预测模型也可以考虑营销数据。
基于机器学习的需求预测解决方案的设计算法
在启动需求预测功能开发时,建议了解 ML 建模的工作流程。这为如何优化开发过程提供了一个数据驱动的路线图。
步骤 1. 简要数据审查
启动需求预测项目时的首要任务是为客户提供有意义的见解。该过程包括以下步骤:
- 收集可用数据
- 简要回顾数据结构、准确性和一致性
- 运行一些数据测试和试点
根据我的经验,几天就足以了解当前情况并概述可能的解决方案。
第 2 步:设定业务目标和成功指标
**大体时间
** 需求预测的时间长度是多少?
短期 预测时间通常少于 12 个月——1 周/1 个月/6 个月。这些预测可能有以下目的:
- 产品/服务的不间断供应
- 销售目标设定及销售业绩评估
- 根据市场波动和通货膨胀优化价格
- 财务维护
- 聘请所需的专家
长期 预测完成时间超过一年。长期预测的目的可能包括以下内容:
- 长期财务规划和资金获取
- 关于扩大业务的决策
- 年度战略规划
**准确性
** 做出明智决策所需的需求预测准确度最低百分比是多少?通过实施零售软件开发项目,我们能够在有足够数据的情况下达到 95.96% 的平均准确率水平。根据您的业务目标设置所需的最低预测准确度级别。
步骤 3. 数据准备和理解
无论我们想要预测什么,数据质量都是准确需求预测的关键组成部分。以下数据可用于构建预测模型:
**数据质量参数
** 在构建预测模型时,根据以下参数评估数据:
- 一致性
- 准确性
- 有效性
- 关联
- 可访问性
- 完整性
- 去离子化
实际上,公司收集的数据往往并不理想。这些数据通常需要清理、分析差距
一旦数据被清理、生成并检查相关性,我们将其构建成一个综合形式。 下面,您可以看到需求预测所需的最低处理数据集的示例:
一旦准备和结构化完成,数据理解是下一个任务。它还不是建模,而是通过可视化来理解数据的绝佳方式。 上面你可以看到我们是如何可视化数据理解过程的。
步骤 4. 机器学习模型开发
没有“一刀切”的预测算法。通常,需求预测功能由几种机器学习方法组成。机器学习模型的选择取决于几个因素,例如业务目标、数据类型、数据量和质量、预测周期等。
这里我描述那些 机器学习方法 当应用于我们的零售客户时。但是,如果您已经阅读了一些关于需求预测的文章,您可能会发现这些方法适用于大多数需求预测案例。
- 时间序列
- 线性回归
- 特征工程
- 随机森林
**时间序列方法
** 这涉及在特定时间发生的用于预测未来的已处理数据点。时间序列是在连续的、等距的时间点采集的数据点序列。要分析的主要成分是:趋势、季节性、不规则性、周期性。
分析算法涉及使用历史数据来预测未来需求。该历史数据包括趋势、周期性波动、季节性和行为模式。
在零售领域,最适用的时间序列模型如下 :
1. ARIMA(自回归综合移动平均)模型旨在描述时间序列数据中的自相关。在规划短期预测时,ARIMA 可以做出准确的预测。通过提供用户指定期间的预测值,它清楚地显示了需求、销售、计划和生产的结果。
2. SARIMA (Seasonal Autoregressive Integrated Moving Average) 模型是 ARIMA 模型的扩展,支持单变量时间序列数据,包括季节性周期的回移。
3. 指数平滑模型通过使用过去观察的加权平均值来预测新值来生成预测。这些模型的本质是将误差、趋势和季节性分量组合成一个平滑的计算。
假设您要预测下个月的蔬菜需求。对于时间序列方法,您需要至少前三个月的历史销售交易数据。如果你有季节性产品的历史数据——在我们的例子中是蔬菜——最好的选择是 SARIMA 模型。在这种情况下,预测误差可能在 10-15% 左右。
**线性回归法
** 线性回归是一种用于根据过去值预测未来值的统计方法。它可以帮助确定潜在趋势并处理涉及夸大价格的案例。
这种回归类型允许您:
- 通过数据点估计预测趋势和未来值。
- 通过分析因变量和自变量来预测变化的影响并确定影响的强度。
假设您想根据成本计算西红柿的需求量。假设西红柿在夏季生长并且由于西红柿数量多而价格较低,则需求指标将在 7 月份增加,到 12 月份减少。
这种类型预测所需的信息是历史交易数据、特定产品的附加信息(在我们的例子中是西红柿)、折扣、平均市场成本、库存量等。预测误差可能为 5-15%。
**特征工程
** 特征工程是使用领域知识数据和创建使机器学习模型预测更准确的特征。它可以更深入地理解数据和更有价值的见解。
由于特征工程是根据业务目标创建新特征,因此这种方法适用于标准方法无法增加价值的任何情况。在 机器学习建模 ,数据科学家从现有特征构建新特征,以实现更高的预测准确性或获取新数据。
**随机森林
** 随机森林模型背后的基本思想是决策树。决策树方法是一种用于数据预测和分类的数据挖掘技术。决策树方法本身对问题没有任何概念性的理解。它从我们提供的数据中学习。
随机森林是一种更高级的方法,它可以制作多个决策树并将它们合并在一起。通过取所有单个决策树估计的平均值,随机森林模型可以产生更可靠的预测。
随机森林可用于分类和回归任务,但也有局限性。在分析大量树木时,该模型对于实时预测可能太慢了。
如果您除了产品销售的数量数据之外没有其他信息,则此方法可能没有那么有价值。在这种情况下,时间序列方法更胜一筹。
第 5 步。培训和部署
**训练
** 一旦开发了预测模型,就该开始训练过程了。在训练预测模型时,数据科学家通常使用历史数据。通过处理这些数据,算法提供了现成的训练模型。
**验证
** 此步骤需要优化预测模型参数以实现高性能。通过使用交叉验证调优方法,将训练数据集分成十等份,数据科学家使用不同的超参数集训练预测模型。该方法的目标是找出哪个模型具有最准确的预测。
**改进
** 在研究最佳业务解决方案时,数据科学家通常会开发几种机器学习模型。由于模型显示出不同程度的准确性,因此科学家们会选择最能满足其业务需求的模型。
改进步骤涉及分析结果的优化。例如,使用模型集成技术,可以获得更准确的预测。在这种情况下,通过组合多个预测模型的结果来计算准确性。
**部署
** 此阶段假设预测模型集成到生产使用中。我们还建议设置一个 聚合新数据的管道 用于您的下一个 AI 功能。这可以为您在以后的项目中节省大量的数据准备工作。这样做还可以提高您可以预测的准确性和多样性。
需求预测系统异常
在集成需求预测系统时,重要的是要了解它们容易受到异常的影响。这种异常的真实例子是冠状病毒。
由于需求预测模型处理历史数据,它无法知道需求发生了根本性的变化。例如,如果去年我们对医用口罩和抗病毒药物有一个需求指标,那么今年就完全不同了。
在这种情况下,可能有几种方法可以获得准确的预测:
1. 等待一段时间,直到收集有关新市场行为的数据,然后才能从头开始开发需求预测模型。
2. 通过添加新闻、当前市场状态、价格指数、汇率和其他经济因素等数据来应用特征工程方法。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/29394/24131200
标签:预测,需求预测,模型,方法,学习,产品,数据 来源: https://www.cnblogs.com/amboke/p/16685232.html