<<
>>

Индексирование

Индексирование — одно из важнейших понятий информационного поиска. Процесс выбора и присвоения документам и запросам или их частям индексов — лексических единиц ИПЯ — называется индексированием.

В соответствии со стандартами (ГОСТ 14.407-75, 14.409 «Требования к ИПЯ, требования к ИПС технологического назначения») под индексированием понимают процесс описания их смыслового содержания средствами ИПЯ с целью обеспечения высоких показателей их поиска. Процесс индексирования, т.е. выбор дескрипторов для включения в ПОД и ПОЗ, определяется специальными инструкциями, называемыми методиками индексирования. Процесс индексирования в отечественных разработках базируется на разработках ВИНИТИ (Всесоюзного института научной и технической информации), в соответствии с которыми процесс индексирования включает в себя шесть основных операций:

1) анализ содержания документа и выбор из текста номинативных лексических единиц, существенных с точки зрения его содержания;

2) формирование перечня ключевых слов, используемых в процессе свободного координатного индексирования;

3) нормализация ключевых слов по форме и содержанию при помощи словарей ИПЯ, используемых при контролируемом индексировании;

4) избыточное индексирование — введение в под дополнительных лексических единиц, связанных по смыслу с исходными ключевыми словами и выбираемых из словаря ИПЯ;

5) введение в под грамматических средств (указателей роли и связи);

6) заполнение рабочего листа предмашинного формуляра под или его ввод в компьютер.

Практически с самого начала развития ИПС предпринимались попытки автоматизации процедур индексирования. В этой области накоплен достаточно большой теоретический и практический опыт. Существуют и практически работают системы (Скобки, Yandex, АИДОС, CAS).

4.12.

<< | >>
Источник: Н.В.Абрамов и др.. Информационные системы в медицине: Учебное пособие— Нижневартовск: Изд-во Нижневарт. гуманит. ун-та,2008. — 171 с.. 2008

Еще по теме Индексирование: