Информационный поиск в сети Интернет
Интернет — это огромная компьютерная сеть (далее — Сеть), состоящая из тысяч меньших сетей, разбросанных по всему миру. Интернет возник из ARPANET сети Министерства обороны США.
Для размещения информации до конца 1980-х годов использовался (используется) сервис, получивший название FTP по имени механизма обмена информацией (протокол FTP).
В настоящее время FTP-архивы превратились в огромные многопрофильные хранилища данных.Значительное влияние на развитие сети оказали протоколы транспортного и межсетевого обмена TCP (Transfer Control Protocol) и IP (Internet Protocol).
Важной вехой в распространении информации в сети стало рождение системы телеконференций Usenet (зародилась из электронной доски объявлений и обзавелась собственным протоколом NNTP — News Network Transfer Protocol). В настоящее время это огромная электронная система оперативных сообщений, разделенная на части по интересам ее пользователей. Каждая группа новостей имеет свое название с иерархической структурой, например:
1) наука (sci);
2) группа новостей посвященных биологии (sci.biology) и т.д.
Другим важным средством обмена информацией в Интернет
является электронная почта. С появлением стандарта MIME электронная почта получила возможность посылать не только простые текстовые сообщения, но и текст с вложениями от программных до аудио, видео и графических файлов.
До появления компьютерных сетей существовали информационные системы и центры (SNT International, ВИНИТИ, ВНТИЦ, ВНИИТПЭ), накапливающие научную, техническую, юридическую информацию. Эти ресурсы стали доступны в Интернет после появления механизма доступа Telnet (удаленный терминал).
Основные протоколы, используемые в Интернет, не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в ней. Протоколы HTTP и более простой FTP, используемые в Интернет, хороши лишь в отношении навигации, которая рассматривается как средство просмотра страниц, но не их поиска. Из-за быстрого роста информации, доступной в Сети, навигационные методы просмотра достигли предела эффективности и функциональных возможностей.
Нужную информацию невозможно получить сразу, т.к. в Сети сейчас находятся миллиарды документов, их количество возрастает согласно экспоненциальной зависимости. Количество изменений (преобразований, кодировок, индексаций), которым эта информация подвергается при хранении в Сети, огромно и, самое главное, они происходят за очень короткий промежуток времени.
Основная проблема заключается в том, что единой, полной функциональной системы обновления и занесения подобного объема информации с обеспечением одновременного доступа всех пользователей Интернет никогда не было. Для обеспечения пользователей удобными средствами поиска были созданы информационные поисковые системы, структурирующие накопленную в Сети информацию.
4.15.