公司经常制定计划和业务策略,以围绕财务,运营,供应链和其他领域来推动决策和行动。他们是根据不确定性和未知数的条件下对未来的看法来做到的。评估未来并制定这些策略,以便在当前可以采取行动以更好地为未来做准备。为此,公司可以收集和分析过去的数据和其他类型的数据,以生成对未来的预测。就未来的不准确或过度销售,时间和资源(如时间和资本,错过的机会等)而言,未能为未来计划或创建高率的预测可能是昂贵的。准确的预测的好处包括亚搏娱乐电子示例 - 减少浪费,削减成本,最大程度地减少存储费用,最大化资源利用率,并确保由于库存不足而不会浪费销售机会。

在本文中,我们将回顾使用Planiq的现代时间序列预测的算法。这些算法范围从传统的统计算法(例如自回归综合运动平均值(ARIMA))到基于复杂的神经网络算法(如Deepar+)的传统统计算法。

在详细描述算法之前,重要的是要了解这些算法可以接受的数据集类型。除了历史值外,数据集还可以包括相关的时间序列数据和项目属性。相关时间序列是时间依赖性数据,它与目标值有一定的相关性,并可能有助于提高预测的准确性。示例包括价格,促销和天气等功能。项目属性是分类功能,可为历史数据中的项目提供宝贵的背景。与相关的时间序列数据集不同,项目属性数据集提供静态。也就是说,随着时间的推移,数据值保持恒定,例如项目类别或类型。

基线时间序列算法

基线时间序列预测算法包括Arima和ET(指数平滑)。它们是时间序列预测的通常使用的统计算法,对于100个不同时期以下的简单数据集特别有用。这些算法通过尝试根据其过去的价值“解释”给定时间序列来起作用,以便可以使用结果方程式来预测未来值。这些基线算法的优点是它们相对较快,可以建立性能基线。当简单的趋势和季节性概念可能解释时间序列数据中的大多数差异时,它们很重要。由于这些模型在基于项目的级别上起作用,因此它们不支持相关数据或属性的使用;其他缺点是它们不适用于冷启动场景(预测没有历史数据),并且不执行超参数优化。

灵活的本地算法

另一类算法是灵活的本地算法,其中包括预言家。它基于一个加性建模程序,非线性趋势适合年度,每周和每日季节性。它与具有强烈季节性效果和几个季节历史数据的时间序列最有效,并且与假期或其他以前已知的重要但不规则的事件兼容。它的优点是它适用于什么IF分析,并且计算便宜。虽然先知支持一些丢失的观察结果或离群值,但它不适合稀疏数据集。

神经网络算法

时间序列预测算法的最后类别是基于人工神经网络的算法,包括Deepar+CNN-QR。它们通过使用深度学习体系结构(例如RNN(经常性神经网络)或CNN(卷积神经网络))来识别历史数据集中的模式并预测未来。它们与更大的历史数据集合作,其中包含数百个时间序列。Deepar+接受前瞻性相关时间序列和项目属性。CNN-QR接受项目属性,是唯一接受没有未来值的相关时间序列数据的预测算法。该算法的优点包括预测时相似时间序列的数据,并使用相关数据集以及项目属性来识别和学习基础结构。此外,这些算法适用于高级预测方案,例如稀疏数据集,何种分析和冷启动场景。但是,这些算法的缺点是它们需要更大的历史数据集,并且可能需要更长的时间来训练和预测。

概括

时间序列的预测领域最近引起了许多技术公司的开发和开源算法。就像最近在计算机视觉或自然语言处理等领域的性能方面的显着改善一样,我们看到时间序列预测算法的性能已经大大改善,并且可以应用于各种各样的现实世界业务应用程序。

Planiq采用开源和专有算法,使客户能够产生准确的预测。用户可以为其用例选择特定的算法或使用Anaplan Automl,该算法会自动比较所有算法的性能,并为大多数项目选择最佳性能算法。

应该注意的是,算法性能取决于特定的用例,数据集,上下文和历史模式 - 因此,没有单个算法比其他算法更好。因此,我们比较并找到适用于特定客户的数据集,用例和项目的最佳选择。

收到有关此内容的反馈?在下面的评论中让我们知道。

本文中的内容尚未针对所有ANAPLAN实施进行评估,也可能不建议您针对您的具体情况进行评估。
在应用本文中的任何想法或步骤之前,请咨询您的内部管理员。
注释

这是一个很好的信息!谢谢你。是否可以包括描述Amazon Automl和Anaplan Automl及其差异的部分?