挖掘结构 (Analysis Services)

在 Microsoft SQL Server 2005 Analysis Services (SSAS) 中,有若干与数据挖掘有关的对象。以下是在数据挖掘中使用的两个主要对象:

  • 数据挖掘结构
  • 数据挖掘模型

数据挖掘中涉及的其他对象是挖掘结构列和挖掘模型列。有关这些对象的详细信息,请参阅挖掘结构列挖掘模型列

数据挖掘结构

挖掘结构是一种数据结构,它定义生成挖掘模型的数据域。单个挖掘结构可包含多个共享相同域的挖掘模型。

挖掘结构的生成块是挖掘结构列,它对数据源包含的数据进行说明。这些列包含诸如数据类型、内容类型以及数据分发方式等信息。

挖掘结构也可包含嵌套表。嵌套表表示事例实体与其相关属性之间的一对多关系。例如,如果客户说明信息位于一个表中,而客户采购信息位于另一个表中,则可使用嵌套表将这些信息组合到一个事例中。客户标识符是实体,采购信息是相关属性。有关何时使用嵌套表的详细信息,请参阅嵌套表

挖掘结构不包含在特定挖掘模型中使用列的方法的信息,也不包含生成模型所用算法类型的信息;该信息在挖掘模型自身中进行定义。

数据挖掘模型

数据挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。如挖掘结构一样,挖掘模型也包含列。挖掘模型包含在挖掘结构之内,继承由挖掘结构定义的所有属性值。该模型可以使用挖掘结构包含的所有列,或使用其中一部分列。

除了在挖掘结构中定义的参数外,挖掘模型还包含下列两个属性:算法和用法。algorithm 参数在挖掘模型中定义,usage 参数在挖掘模型列中定义。下表对这些参数进行了说明。

  • algorithm
    定义创建模型所用算法的模型属性。
  • usage
    定义模型使用列的方法的模型列属性。可以将列定义为输入列、键列或可预测列。

数据挖掘模型在处理之前只是一个空对象。在处理模型时,通过算法传递由结构定义的数据。算法确定数据中的规则和模式,然后使用这些规则和模式填充模型。有关如何使用算法创建挖掘模型的详细信息,请参阅数据挖掘算法

在处理模型之后,可以使用 Business Intelligence Development Studio 和 SQL Server Management Studio 中提供的自定义查看器来浏览该模型,或通过查询来执行预测。有关 Analysis Services 中的自定义查看器的详细信息,请参阅查看数据挖掘模型

基于同一结构可以创建多个模型。基于同一结构生成的所有模型必须都来自同一数据源。但是,各个模型在以下方面可以有所不同,如使用结构中的哪些列、使用这些列的方法、创建每个模型使用的算法类型,以及每一算法的参数设置。例如,可以建立单独的决策树和聚类分析模型,它们中的每一个都包含结构中的不同列,并用于完成不同的业务任务。

请参阅

任务

如何在现有挖掘结构中添加挖掘模型
如何创建新的关系挖掘结构
如何处理挖掘模型

概念

Analysis Services 对象
数据挖掘概念
挖掘模型列

其他资源

Building Data Mining Models
挖掘结构列

帮助和信息

获取 SQL Server 2005 帮助