跳转到主要内容

这篇文章由胡晨辉,VanjaPaunic,洪,吴涛,周贤德合著。

时间序列预测是数据科学中最重要的课题之一。假设你是一名企业主,你可能想预测未来不同类型的事件,以做出更好的决策并优化资源分配。时间序列预测用例的典型示例包括零售销售预测、包裹发货延迟预测、能源需求预测和财务预测。正如你所看到的,预测无处不在!

鉴于其无处不在的性质和广泛的业务应用,我们开发了一个开源预测回购,将世界级的模型和预测最佳实践交给数据科学家和行业专家,即您!

Figure 1: Visualization of training and testing iterations of a sales forecasting scenario using LightGBM model

该存储库提供了构建预测解决方案的示例,这些解决方案以Python Jupyter笔记本、R markdown文件和实用程序函数库的形式呈现。我们的目标是帮助您作为一名数据科学家或机器学习工程师,掌握不同水平的预测知识:

  • 学习用多种语言开发预测解决方案的最佳实践。
  • 利用预测算法的最新进展来构建高性能解决方案并将其付诸实施。
  • 加快现实世界预测问题的解决方案开发过程。通过提供的示例,您将能够通过按数量级简化从定义业务问题到开发解决方案的体验,从而显著缩短“上市时间”。

在存储库中,您将发现使用传统机器学习和深度学习方法的最先进(SOAT)预测模型。本版本中SOTA模型的实现以零售销售预测为中心,并使用Python和R这两种预测领域最流行的编程语言编写。为了实现高吞吐量预测场景,我们提供了使用分布式训练技术预测多个时间序列的笔记本电脑,如Python中的Ray、R中的并行包和LightGBM中的多线程。以下是此存储库中包含的预测模型的快速摘要。

forecasting

该存储库还配有Azure机器学习(Azure ML)主题笔记本和最佳实践配方,以加速在Azure上开发可扩展的生产级预测解决方案。您将找到以下使用Azure AutoML进行预测以及在Azure上调整和部署预测模型的示例。

forecasting

开发准确的预测解决方案可能是一个复杂而耗时的过程。我们希望预测回购将有助于缩短您在Azure上的开发周期。

了解更多信息并做出贡献

欲了解更多信息,请访问:https://github.com/microsoft/forecasting

欢迎来自开源社区的贡献!如果您想为内容做出贡献并引入最新的SOTA算法,请随时查看我们的贡献指南。

其他Azure资源以了解更多信息

要了解更多信息,您可以阅读以下文章和笔记本:

文章链接