Поделиться через


Архитектура компонента Full-Text Search

Изменения: 14 апреля 2006 г.

Компонент Full-Text Search в Microsoft SQL Server 2005 работает на основе средства полнотекстового поиска (Microsoft) для SQL Server (MSFTESQL). Служба MSFTESQL выполняет две задачи: обеспечивает поддержку индексирования и выполнения запросов.

Архитектура компонента Full-Text Search в SQL Server проиллюстрирована далее.

Диаграмма архитектуры компонента Full-Text Search

Эта архитектура состоит из следующих процессов:

  • Процесс SQL Server (Sqlservr.exe)
  • Процесс компонента Microsoft Full-Text Engine для SQL Server (Msftesql.exe)
  • Процесс управляющей программы фильтрации для компонента Microsoft Full-Text Engine (Msftesql.exe)

Каждый из этих процессов содержит в себе несколько компонентов, описание которых приведено в следующих разделах.

Процесс SQL Server

Процесс SQL Server состоит из следующих компонентов:

  • Пользовательские таблицы.
    В этих таблицах содержатся данные, по которым осуществляется полнотекстовое индексирование.
  • Сопоставление ключей.
    В этом компоненте содержится сопоставление значений данных между столбцами полнотекстового ключа и внутренними идентификаторами документа.
  • Обработчик запросов SQL Server.
  • Средство сбора полнотекстовых данных Microsoft.
    Этот компонент отвечает за планирование и реализацию заполнения полнотекстовых индексов, а также за мониторинг полнотекстовых каталогов.

Процесс компонента Microsoft Full-Text Engine для SQL Server (MSFTESQL)

Служба MSFTESQL отвечает за следующие действия:

  • Заполнение и управление полнотекстовыми каталогами.
  • Упрощение полнотекстового поиска в базах данных SQL Server.

Процесс MSFTESQL содержит компоненты, перечисленные в следующей таблице.

Компонент Описание

Диспетчер управляющей программы фильтрации

Отвечает за мониторинг состояния процесса управляющей программы фильтрации для полнотекстового поиска Microsoft (MSFTEFD).

Индексатор

Создает структуру инвертированного индекса, используемого для хранения индексированных лексем. Дополнительные сведения см. в разделе Структура полнотекстового индекса.

Файлы тезауруса

Содержат синонимы искомых термов. Дополнительные сведения см. в разделе Тезаурус.

Файлы неучитываемых слов

Содержат списки часто встречающихся слов, бесполезных при поиске. Дополнительные сведения см. в разделе Неучитываемые слова.

Средства разбиения по словам и парадигматические модули

Осуществляют лингвистический анализ всех полнотекстово-индексированных данных. Средство разбиения по словам — это компонент, определяющий местонахождение границ слова в потоке текста в строке, включаемой в полнотекстовый индекс. Парадигматические модули определяют основную форму слова. Например, слова «бежит», «бежал» и «бегут» являются формами слова «бежать». Парадигматические модули используются службой MSFTESQL при выполнении запросов FREETEXT либо в случае, когда запрос требует флективного расширения.

Дополнительные сведения см. в разделе Средства разбиения по словам и парадигматические модули.

Дополнительные сведения о службе MSFTESQL см. в разделе Средство полнотекстового поиска (Майкрософт) для SQL Server.

Процесс управляющей программы фильтрации для компонента Full-Text Search Microsoft (MSFTEFD)

Процесс MSFTEFD запускается службой MSFTESQL в процессе полнотекстового индексирования. Процесс MSFTEFD содержит компоненты, отвечающие за доступ к данным в таблицах и их фильтрацию, а также за разбиение на слова и выделение основы:

  • Обработчик протоколов.
    В SQL Server 2005 этот компонент осуществляет доступ к данным в таблице, находящейся в указанной базе данных.
  • Фильтры.
    Выделение потока текстовых данных из документа с отбрасыванием всех нетекстовых данных и данных о форматировании. Дополнительные сведения см. в разделе Фильтры полнотекстового поиска.
  • Средства разбиения по словам и парадигматические модули.

Внутренние таблицы

Компонент Full-Text Search использует следующие внутренние таблицы:

  • fulltext_index_map — содержит сопоставление значений данных в столбцах полнотекстового ключа с внутренними идентификаторами, уникально определяющими документ.
  • fulltext_catalog_freelist — содержит неиспользуемые идентификаторы документов.
ms142541.note(ru-ru,SQL.90).gifПримечание.
Эти таблицы предназначены исключительно для внутреннего использования. Их нельзя изменить, и к ним нельзя обращаться с запросами. Обратная совместимость, а также наличие этих таблиц в следующих версиях SQL Server не гарантируются.

См. также

Основные понятия

Средство полнотекстового поиска (Майкрософт) для SQL Server
Процесс полнотекстового индексирования и обработки запросов

Другие ресурсы

Внутренние таблицы

Справка и поддержка

Получение помощи по SQL Server 2005

Журнал изменений

Версия Журнал

14 апреля 2006 г.

Новое содержимое
  • Добавлены сведения о внутренних таблицах.