Поисковые системы Интернета


Поисковые системы Интернета - блог Guland

Поисковая система — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.

Существует множество поисковых систем, каждая из которых использует собственные алгоритмы построения списка сайтов, содержащих по мнению поисковика ответ на запрос пользователя. Помимо алгоритмов поисковая система использует в работе роботов, которые индексируют сайты, изображения, проверяют доступность сайтов и пр.

История

На раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН. Сайтов становилось всё больше, и поддерживать вручную такой список становилось всё сложнее. На сайте NCSA был специальный раздел «Что нового!», где публиковали ссылки на новые сайты.

К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс (Oscar Nierstrasz) в Женевском университете написал ряд сценариев на Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для W3Catalog[en], первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. Поисковая система Google занимает видное положение с начала 2000-х. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Алгоритм был представлен общественности в статье «The Anatomy of Search Engine», написанной Сергеем Брином и Ларри Пейджем, основателями Google. Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие.


История Рунета

  • В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт.

  • 23 сентября 1997 года была открыта поисковая машина Яндекс.

  • В 2005 году в России при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию.

  • В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов.

  • 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник, которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.

Виды поисковых систем

Поисковые системы делятся на следующие виды:

  • Национальные поисковые системы. Поисковые системы разрабатываемые изначально для поиска сайтов внутри конкретной страны, т.е. для внутреннего рынка. Большинство из них постепенно вышли за рамки свого государства, но при этом не перешли в разряд транснациональных.

    Пример национальных поисковых систем: Yandex (rus), Mail.ru (rus), Спутник, Cade (br), Alcanseek (cn), Alexa (us), Anzwers (au).

  • Транснациональные поисковые системы. Поисковые системы, осуществляющие поиск ответа на запрос пользователя по сайтам всех стран, независимо от их доменной зоны и страны нахождения.

    Пример транснациональных поисковых систем: Google, Baidu, Yahoo!, Bing.


Как работает поисковая система

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.

Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов или вследствие человеческого фактора. По состоянию на 2015 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам.

Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик.

Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно.


Понравилась статья? Пожалуйста, оцените и поделитесь:


1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд
Загрузка...

Вам также будет интересно


Добавьте комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *