下面的示例显示如何对现有的时序模型执行预测:
-
第一个示例显示如何根据当前模型执行指定次数的预测。
-
第二个示例显示如何使用 REPLACE_MODEL_CASES 参数将指定模型中的模式应用到新的数据集。
-
第三个示例显示如何使用 EXTEND_MODEL_CASES 参数用最新数据更新挖掘模型。
若要了解使用时序模型的详细信息,请参阅数据挖掘教程第 2 课:生成预测方案(数据挖掘中级教程)和时序预测 DMX 教程。
注意: |
|---|
|
您可能会从模型中获取不同的结果;下面提供的示例结果仅用于说明结果格式。
|
示例 1:预测时间段数
以下示例使用 PredictTimeSeries 函数返回后三个时间步长的预测,并将返回结果限定为欧洲和太平洋地区中的 M200 序列。在此特定模型中,可预测属性为 Quantity,因此您必须将 [Quantity] 用作 PredictTimeSeries 函数的第一个参数。
|
SELECT FLATTENED
[Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity],3)AS t
FROM
[Forecasting]
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific' |
预期的结果:
|
Model Region
|
t.$TIME
|
t.Quantity
|
|---|
|
M200 Europe
|
7/25/2004 12:00:00 AM
|
121
|
|
M200 Europe
|
8/25/2004 12:00:00 AM
|
142
|
|
M200 Europe
|
9/25/2004 12:00:00 AM
|
152
|
|
M200 Pacific
|
7/25/2004 12:00:00 AM
|
46
|
|
M200 Pacific
|
8/25/2004 12:00:00 AM
|
44
|
|
M200 Pacific
|
9/25/2004 12:00:00 AM
|
42
|
在此示例中使用了 FLATTENED 关键字,目的是使结果更易于读取。如果不使用 FLATTENED 关键字,而返回一个分层行集,则此查询将返回两列。第一列包含 [ModelRegion] 的值,第二列包含具有两个列的嵌套表:$TIME,显示要预测的时间段;Quantity,包含预测的值。
示例 2:添加新数据和使用 REPLACE_MODEL_CASES
假定您发现某一特定地区的数据不正确,并且您希望使用模型中的模式,但是又想调整预测,以便与新数据匹配。或者您可能发现另一地区的趋势更可靠,并且希望向不同地区中的数据应用最可靠的模型。
在这些方案中,您可以使用 REPLACE_MODEL_CASES 参数,并指定一组新的数据以用作历史数据。这样,预测将基于指定模型中的模式,但将从新数据点末尾继续平滑地进行。有关此方案的完整演练,请参阅添加聚合预测模型(数据挖掘中级教程)。
以下 PREDICTION JOIN 查询说明替换数据和进行新预测的语法。对于替换数据,本示例检索 Amount 和 Quantity 列的值,并将每个值乘以 2:
|
SELECT [Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity], 3, REPLACE_MODEL_CASES)
FROM
[Forecasting]
PREDICTION JOIN
OPENQUERY([Adventure Works DW2008],
'SELECT [ModelRegion],
([Quantity] * 2) as Quantity,
([Amount] * 2) as Amount,
[ReportingDate]
FROM [dbo].vTimeSeries
WHERE ModelRegion = N''M200 Pacific''
') AS t
ON
[Forecasting].[Model Region] = t.[ Model Region] AND
[Forecasting].[Reporting Date] = t.[ReportingDate] AND
[Forecasting].[Quantity] = t.[Quantity] AND
[Forecasting].[Amount] = t.[Amount] |
下表比较预测结果。
|
原始预测
|
更新后的预测
|
|---|
M200 Pacific
7/25/2004 12:00:00 AM
46
M200 Pacific
8/25/2004 12:00:00 AM
44
M200 Pacific
9/25/2004 12:00:00 AM
42
|
M200 Pacific
7/25/2004 12:00:00 AM
91
M200 Pacific
8/25/2004 12:00:00 AM
89
M200 Pacific
9/25/2004 12:00:00 AM
84
|
示例 3:添加新数据和使用 EXTEND_MODEL_CASES
示例 3 说明如何使用 EXTEND_MODEL_CASES 选项提供新数据,此数据添加到现有数据序列的末尾。新数据将添加到模型中,而不是替换现有数据点。
在下面的示例中,新数据是在 NATURAL PREDICTION JOIN 后的 SELECT 语句中提供的。您可以使用此语法提供多个新输入行,但每个新输入行必须具有唯一的时间戳:
|
SELECT [Model Region],
PredictTimeSeries([Forecasting].[Quantity], 5, EXTEND_MODEL_CASES)
FROM
[Forecasting]
NATURAL PREDICTION JOIN
(SELECT
1 as [Reporting Date],
10 as [Quantity],
'M200 Europe' AS [Model Region]
UNION SELECT
2 as [Reporting Date],
15 as [Quantity],
'M200 Europe' AS [Model Region]
) AS T
WHERE ([Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific') |
由于查询使用 EXTEND_MODEL_CASES 选项,因此 Analysis Services 采用以下操作执行预测:
-
向模型中添加两个月的新数据,从而增加了定型事例的总大小。
-
在上一个事例数据的末尾启动预测。因此,前两个预测表示刚添加到模型中的实际新销售数据。
-
根据新扩展的模型返回其余三个时间段的新预测。
下表列出示例 2 查询的结果。请注意,针对 M200 Europe 返回的前两个值与您提供的新值完全相同。此行为是默认设置;如果您希望在新数据末尾启动预测,则必须指定开始和结束时间步长。有关如何执行此操作的示例,请参阅第 5 课:扩展时序模型。
另请注意,由于没有向太平洋地区提供新数据,因此,Analysis Services 返回所有(五个)时间段的新预测。
|
Quantity
|
EXTEND_MODEL_CASES
|
|---|
|
M200 Europe
|
$TIME
Quantity
7/25/2004 0:00
10
8/25/2004 0:00
15
9/25/2004 0:00
72
10/25/2004 0:00
69
11/25/2004 0:00
68
|
|
M200 Pacific
|
$TIME
Quantity
7/25/2004 0:00
46
8/25/2004 0:00
44
9/25/2004 0:00
42
10/25/2004 0:00
42
11/25/2004 0:00
38
|