Индексирование
Индексирование — одно из важнейших понятий информационного поиска. Процесс выбора и присвоения документам и запросам или их частям индексов — лексических единиц ИПЯ — называется индексированием.
В соответствии со стандартами (ГОСТ 14.407-75, 14.409 «Требования к ИПЯ, требования к ИПС технологического назначения») под индексированием понимают процесс описания их смыслового содержания средствами ИПЯ с целью обеспечения высоких показателей их поиска. Процесс индексирования, т.е. выбор дескрипторов для включения в ПОД и ПОЗ, определяется специальными инструкциями, называемыми методиками индексирования. Процесс индексирования в отечественных разработках базируется на разработках ВИНИТИ (Всесоюзного института научной и технической информации), в соответствии с которыми процесс индексирования включает в себя шесть основных операций:1) анализ содержания документа и выбор из текста номинативных лексических единиц, существенных с точки зрения его содержания;
2) формирование перечня ключевых слов, используемых в процессе свободного координатного индексирования;
3) нормализация ключевых слов по форме и содержанию при помощи словарей ИПЯ, используемых при контролируемом индексировании;
4) избыточное индексирование — введение в под дополнительных лексических единиц, связанных по смыслу с исходными ключевыми словами и выбираемых из словаря ИПЯ;
5) введение в под грамматических средств (указателей роли и связи);
6) заполнение рабочего листа предмашинного формуляра под или его ввод в компьютер.
Практически с самого начала развития ИПС предпринимались попытки автоматизации процедур индексирования. В этой области накоплен достаточно большой теоретический и практический опыт. Существуют и практически работают системы (Скобки, Yandex, АИДОС, CAS).
4.12.