提升图

在数据挖掘设计器的**“挖掘准确性图表”选项卡的“提升图”**选项卡中,可以查看两种类型的图表:提升图表和利润图表。 提升图比较每个模型预测的准确性,而利润图则显示与使用每个模型相关联的理论上的利润增长。

使用**“图表类型”列表选择所需的图表类型。 在从该列表中选择“利润图”时,会自动打开“利润图设置”对话框。 (单击“设置”**时也会打开此对话框。) 使用此对话框,可以设置定义利润图的参数。

在提升图中只能对包含可预测离散属性的挖掘模型进行比较。 **“挖掘准确性图表”**选项卡不能用于时序模型或具有可预测连续属性的模型。

有关详细信息,请参阅:“挖掘准确性图表”选项卡的操作指南主题列映射(提升图)验证数据挖掘模型

图表类型

以下各部分对每个图表类型进行了更详细的说明:

  • 提升图类型
  • 利润图类型

提升图类型

**“提升图”**选项卡显示挖掘模型所引起的“提升”**变化的图形表示形式。 例如,请考虑下面的事例,即 Adventure Works Cycles 的市场部要搞一个发送邮件的活动。 从以往的活动中,他们推算应有 10% 的答复率。 在数据库的一个表中,存储了一个包含 10,000 名潜在客户的列表。 按照正常答复率计算,预计将有 1,000 名客户答复。

此外,还考虑到该计划的预算低于向数据库中所有 10,000 名客户发送邮件所需的费用。 根据预算,他们只能承担向 5,000 名客户发送邮件广告的费用。 市场部有下列两种选择:

  • 随机选择 5,000 名目标客户
  • 使用挖掘模型确定最有可能答复的 5,000 名目标客户

如果该公司随机选择 5,000 名客户,则在估计给予积极答复的 1,000 名客户中,只能有 500 名客户做出答复,因为正常情况下只有 10% 的客户答复。 这正是提升图中的随机线所表示的情况。 但如果市场部使用挖掘模型来确定发送邮件的目标,则预计可以获得更高的答复率,因为他们锁定了最有可能答复的客户。 如果该模型精确无误,则意味着它可以形成完全准确的预测,即该公司通过向该模型推荐的 1,000 名潜在客户发送电子邮件广告,预计可以得到全部 1,000 个答复。 这正是提升图中的理想线所表示的情况。 事实是挖掘模型最可能位于这两种极限情况之间,即介于随机推测模型和理想或精确无误的预测模型之间。 与随机推测相比,答复率的任何提高均被视为提升。

可以创建两种类型的图表,在一种图表中可以指定可预测列的状态,另一种则不指定该状态。

如果指定可预测列的状态,则将创建下图所示的图表类型。

目标与总体的提升图

该图表的 X 轴表示用于比较预测的测试数据集的百分比。 该图表的 Y 轴表示预测为指定状态的值的百分比。 在该图表中,红线表示随机线,黄线表示理想模型。

如果未指定可预测列的状态,则将创建下图所示的图表类型。

显示正确预测的提升图

X 轴与指定了可预测列的图表中的 X 轴相同,但 Y 轴现在表示正确预测的百分比。 在该图表中,红线表示理想模型。

当在**“列映射”选项卡和“提升图”**选项卡之间切换时,该图表将被更新以反映在列映射中所做的任何更改。

返回页首

利润图类型

利润图显示与使用挖掘模型相关联的预计利润增长,以确定公司应在业务方案中联系哪些客户。 图表的 Y 轴表示利润,而 X 轴表示公司所联系总体的百分比。 典型的利润图显示一个利润增长的最高点,达到该点后利润将随着所联系总体的增多而减少。

使用**“图表类型”列表显示利润图。 在选择“利润图”后,随即会打开“利润图设置”**对话框。 使用此对话框,可以设置定义利润图的参数。 以下列表对可设置的参数进行了说明。

  • Population
    数据集中用于创建提升图的事例数。 例如,潜在客户数。
  • Fixed Cost
    与业务问题关联的固定成本。 如果此参数用于目标邮件解决方案,则该成本不依赖于所拨打的销售电话数或所发送的促销邮件数等变量。
  • Individual Cost
    除固定成本之外的成本,可以与每个客户联系相关联。 例如,促销邮件或销售电话。
  • Revenue Per Individual
    与每个成功销售相关联的收入金额。

通过单击**“提升图”选项卡中的“设置”,也可以打开“提升图设置”**对话框。

提升图包含一条灰色竖线,通过单击图表中的某一位置可以移动该竖线。 **“挖掘图例”**会显示一个分数,即与图表上的灰线位置相关联的相应总体和预测概率。 如果通过使用灰线选择了图表中的最大利润点,可以使用预测概率值确定联系客户的概率阈值。

例如,如果利润曲线的峰值位于总体的 55% 处,并且相关联的预测概率为 20%,则指示若要获取最大利润,应只联系其答复率被预测为 20% 或更大几率的客户。

返回页首

请参阅

概念

列映射(提升图)
数据挖掘概念
使用数据挖掘
验证数据挖掘模型

其他资源

“挖掘准确性图表”选项卡的操作指南主题

帮助和信息

获取 SQL Server 2005 帮助