Приложение 5. (Общее описание)ТАБЛИЦЫ ВЫБОРА ПОЛЕЙ (ТВП) |
Таблица выбора полей (ТВП) определяет критерий выбора одного или более элементов из записей базы данных.
В зависимости от конкретного использования ТВП создаваемые элементы могут затем использоваться либо для создания терминов инвертированного файла (словаря), либо для переформатирования записей во время операций импорта/экспорта или копирования.
Таблица выбора полей как отдельная структура сохраняется в текстовом файле с расширением FST. (Примеры ТВП см. в директориях БД системы ИРБИС.)
ТВП состоит из набора строк, |
каждая из которых содержит следующие три параметра, разделенные знаком пробел:
формат выборки данных, представленный на языке форматирования системы*,
идентификатор поля (ИП),
метод индексирования (МИ).
Предлагается новая конструкция для ТВП ПЕРЕФОРМАТИРОВАНИЯ :
0 0 <формат>
БЕЗ преобразования ВСЕХ полей записи, кроме тех, что определены в других строках ТВП (т.е. тех, чьи метки указаны в первом элементе всех остальных строк ТВП)
Такая строка может содержаться в ТВП переформатирования, предназначенном для импорта/экспорта/копирования (но ни в коем случае не в ТВП инвертирования) (Здесь стоит напомнить, что в общем случае порядок строк в ТВП не имеет значения) |
Выборка элементов |
Когда появляется необходимость в выборке элементов с использованием ТВП, система производит чтение требуемых записей (документов) файла документов и выполняет следующие действия по каждой записи и каждой строке ТВП:
1.Отрабатывает формат выборки применительно к текущему документу;
2.К данным, извлеченным форматом, применяет указанный метод индексирования ;
3.Присваивает каждому созданному таким образом элементу соответствующий идентификатор поля.
Этот процесс является чисто механическим и подразумевает только то, что описано в этих трех пунктах. Шаги связаны только лишь данными, которые создаются при их выполнении. Например, тот факт, что на шаге 1 произошла выборка данных из конкретного поля, является несущественным на шаге 2. На шаге 1 могут использоваться все возможности языка форматирования для создания строки символов, которая затем поступает в распоряжение шага 2. На шаге 2 поступившие строки символов обрабатываются в соответствии с указанным методом индексирования. Методы индексирования представляют собой некоторый процесс, определяемый на строках символов, а не на записях или полях.
Именно благодаря такому универсальному пониманию сути ТВП, предоставляется возможность использовать их для таких, на первый взгляд совершенно независимых целей, как определение содержимого инвертированного файла и способ преобразования данных при импорте документов.
« В самом общем смысле ТВП может восприниматься как некоторый механизм порождения элементов данных на основе имеющихся в документе с целью последующего выполнения некоторой определенной задачи. |
См. также:
*язык форматирования системы (Приложение 4).
ТВП для инвертированного файла
ТВП БЕЗ преобразования ВСЕХ полей записи