Поисковые системы — история развития

Давным-давно, в середине 20-го века, когда интернет только зарождался и пользователей было мало, проблемой глобального поиска информации никто не заморачивался. Сейчас же эта проблема актуальна как никогда. В этой статье рассматриваются основные этапы развития поисковых систем.

Давным-давно, в середине 20-го века, когда интернет только зарождался и пользователей было мало, проблемой глобального поиска информации никто не заморачивался. Сейчас же эта проблема актуальна как никогда. В этой статье рассматриваются основные этапы развития поисковых систем.

Одним из первых методов систематизации информации в Интернете стал создание каталогов веб-сайтов, где гиперссылки на сайты рассортировывались согласно тематике. Первым подобным проектом стал интернет-сайт Yahoo, который открылся в начале апреля 1994 г. Однако после того, как количество веб-сайтов в каталоге Yahoo существенно выросло, была сделана возможность поиска интересующей информации по каталогу. Это, конечно, не являлось поисковой системой в совершенном смысле этого понятия, потому что круг поиска ограничивался исключительно ресурсами, находящимися в каталоге.

В настоящее время каталоги играют гораздо меньшую роль и популярность, чем раньше. Причина этого элементарна – даже сегодняшние каталоги, хранящие огромное число ресурсов, представляют сведения лишь о чрезвычайно маленькой части Интернета. Крупнейший каталог в интернете DMOZ хранит информацию о 5 млн ресурсов, тогда как база поисковой машины Гугл состоит из более 8 млрд ресурсов.

Первой настоящей поисковой машиной можно назвать проект WebCrawler который открылся в 1994 г..

Уже в 1995 г. появились поисковые машины Lycos и AltaVista, которая до недавнего времени была фаворитом в сфере поиска информации в Инете.

В 1997 г. Сергей Брин и Ларри Пейдж создали Google в рамках экспериментальной программы в Стэнфордском университете. На данный момент Google наиболее знаменитая поисковая машина во всем мире.

А 23 сентября 1997 г была представлена поисковая машина Yandex, наиболее известная в русской части Интернета.

Сейчас есть 3 главных международных поисковых системы – Гугл, Яху и MSN Search, которые имеют в своем распоряжении собственные базы и алгоритмы поиска. Большая часть других поисковых машин применяет в различном виде плоды работы трех упомянутых систем. В частности поиск AOL и Mail.ru применяют базу Гугл, а AltaVista, Lycos и AllTheWeb – базу Яху.

В Рунете основной поисковой машиной является Yandex, за ним следуют Google.ru, Rambler,Aport, Mail.ru и KM.ru. Именно на эти поисковые системы ориентируются грамотный оптимизатор, делая поисковое продвижение сайта своего клиента.

Основы работы поисковых машин

Различные поисковые системы различаться между собой (например группа Spider+Crawler+Indexer может быть сделана в виде одной программы), но всем ПС присущи перечисленные схожие признаки.

Spider. Паук — это специальная программа, которая скачивает интернет-страницы так же, как и интернет-браузер пользователя. Отличие заключается в том, что паут работает только с html-текстом веб-страницы, игнорируя изображения, флеш-объекты и т.д.

Crawler. Отделяет все гиперссылки, находящиеся на веб-странице. Его задача — установить, куда затем должен перейти паук. Краулер, переходя по найденным гиперссылкам, производит поиск ранее не известных документов, до сих пор неизвестных поисковой системе.

Indexer. Индексатор раскладывает страничку на составные части и подвергает их анализу. Отделяются и анализируются разные компоненты веб-страницы, в том числе текст, заголовки, html-теги и т.д.

Database. Информационная база — это база всех материалов, которые поисковая машина скачивает и анализирует. Еще информационную базу называют индексом поисковой машины.

Search Engine Results Engine. Система выдачи результата отвечает за ранжирование страниц. Она принимать решение, какие странички удовлетворяют запросу пользователя, и в каком порядке они обязаны быть отсортированы. Это делается на основе алгоритма ранжирования поисковой машины. Эта информация является самой значимой и интересной для оптимизатора–ведь именно с ней он взаимодействует, стараясь поднять позицию сайта в выдаче.

Web server. Обычно, на сервере есть html-страница с формой ввода поискового запроса. Web server также отвечает за отображение результатов поиска пользователю.

Наверх

Понравилась статья? Поделиться с друзьями:

Отправить ответ

Оставьте первый комментарий!

Уведомить
avatar
wpDiscuz