Поделиться через


Алгоритм линейной регрессии (Microsoft)

Алгоритм линейной регрессии (Microsoft) представляет собой разновидность алгоритма дерева принятия решений (Microsoft), где параметр MINIMUM_LEAF_CASES больше или равен общему количеству вариантов в наборе данных, который алгоритм использует для обучения модели интеллектуального анализа данных. Если параметр задан таким способом, то алгоритм не будет выполнять разбиение, то есть не будет выполнять линейную регрессию.

Линейную регрессию можно использовать для определения связи между двумя непрерывными столбцами. Связь принимает вид формулы линии, представляющей ряд данных. Например, линия на следующей диаграмме является наилучшим линейным представлением данных.

Линия, моделирующая набор данных

Формула, представляющая линию на диаграмме, принимает вид y = ax + b и известна как уравнение регрессии. Переменная Y представляет выходную переменную, X — входную переменную, a и b — изменяемые коэффициенты. Каждой точке на диаграмме соответствует ошибка, связанная с ее расстоянием от линии регрессии. Коэффициенты a и b в уравнении регрессии регулируют угол и положение линии регрессии. Можно получать уравнение регрессии с помощью подбора коэффициентов a и b до тех пор, пока сумма ошибок, связанных с этими точками, не будет минимальной.

Использование алгоритма

Для просмотра модели интеллектуального анализа с линейной регрессией используйте средство просмотра дерева (Microsoft).

Модель линейной регрессии должна содержать ключевой столбец, входные столбцы и хотя бы один прогнозируемый столбец.

Алгоритм линейной регрессии (Microsoft) поддерживает типы содержимого входных столбцов, прогнозируемых столбцов и флагов моделирования, перечисленных в следующей таблице.

Типы содержимого входных столбцов

Continuous, Cyclical, Key, Table и Ordered

Типы содержимого прогнозируемых столбцов

Continuous, Cyclical и Ordered

Флаги моделирования

NOT NULL и REGRESSOR

Все алгоритмы Microsoft поддерживают общий набор функций. Однако алгоритм линейной регрессии (Microsoft) поддерживает дополнительные функции, список которых приведен в следующей таблице.

IsDescendant

PredictStdev

IsInNode

PredictSupport

PredictHistogram

PredictVariance

PredictNodeId

   

Список функций, общих для всех алгоритмов Microsoft, см. в разделе Алгоритмы интеллектуального анализа данных. Дополнительные сведения об использовании этих функций см. в разделе Ссылка на функцию расширений интеллектуального анализа данных.

Алгоритм линейной регрессии (Microsoft) поддерживает несколько параметров, которые влияют на производительность и точность итоговой модели интеллектуального анализа данных. В следующей таблице содержатся описания всех параметров.

Параметр Описание

MAXIMUM_INPUT_ATTRIBUTES

Определяет количество входных атрибутов, которые алгоритм может обработать перед вызовом выбора компонентов. Установите значение 0, чтобы отключить выбор компонентов.

Значение по умолчанию равно 255.

MAXIMUM_OUTPUT_ATTRIBUTES

Определяет количество выходных атрибутов, которые алгоритм может обработать перед вызовом выбора компонентов. Установите значение 0, чтобы отключить выбор компонентов.

Значение по умолчанию равно 255.

FORCED_REGRESSOR

Приводит алгоритм к использованию указанных столбцов в качестве регрессоров, не обращая внимания на важность столбцов, вычисленную алгоритмом.

См. также

Основные понятия

Алгоритмы интеллектуального анализа данных
Мастер интеллектуального анализа данных
Выбор компонентов в интеллектуальном анализе данных
Просмотр модели интеллектуального анализа данных с помощью средства просмотра деревьев (Microsoft)

Другие ресурсы

CREATE MINING MODEL (расширения интеллектуального анализа данных)

Справка и поддержка

Получение помощи по SQL Server 2005