Основы поиска
Так исторически сложилось, что протоколы, используемые в Internet, не имеют встроенных функций поиска. В начале развития в WWW еще можно было эффективно использовать так называемые "Желтые страницы" — каталог серверов Internet.
Теперь такая книга эффективна только для описания каких-либо узкоспециальных серверов.Чаще всего поиск документов производится по ключевому слову (словам). Существует еще поиск изображений, он также в своей основной массе проводится по словесному описанию или имени файла.
При поиске в Internet важна релевантность или соответствие ответа вопросу. Она базируется на двух составляющих — полноте (ничего не потеряно) и точности (не найдено ничего лишнего).
Не последнее место отводится скорости поиска. Время, потраченное на поиск, не может превышать некоторой величины. Прежде всего, необходимо грамотное планирование поисковой процедуры и умение работать с выбранным ресурсом. План поисковых работ включает выбор поисковых сервисов и инструментов, последовательность их использования в зависимости от предыдущего результата.
Необходимо знать, что как бы не велика была база данных в поисковой машине, она не в состоянии индексировать всю информацию, представленную в Internet. Так, при запросе к некоторой поисковой машине базой данных MEDLINE выдаются тысячи ссылок, с сайтов которых можно попасть в эту базу. Но ни одна поисковая система не индексирует непосредственно информацию из базы. Поэтому необходимо использовать поиск непосредственно в самой базе.
Чтобы как-то структуризировать лавинообразно возрастающие объемы информации в Internet, начали создавать поисковые системы.
Использовать их очень просто — в окне вводим запрос (слово или словосочетание, построенное по определенным правилам) и нажимаем рядом расположенную кнопку для запуска поиска. Через небольшой промежуток времени получаем страницу со ссылками на интересующие страницы.
Существуют два принципиально разных подхода к построению таких систем. Разница между ними заключается в объеме работы, выполняемой человеком.