Что такое поисковая система?
Поисковая сиcтема (поисковик, поисковая машина) – постоянно обновляющийся и интерактивный ресурс, проводящий сбор и добавление в свой индекс всей информации, которая расположена в открытом доступе в сети Интернет. Поисковик на главной странице своего сайта имеет интерфейс, позволяющий пользователю введя некий запрос получить список соответствующих ему веб-страниц.
Структура поисковой системы:
- поисковый робот (также их называют пауками), который занимается поиском и добавлением сайтов в индекс;
- база данных (собственно индекс), содержащая все добавленные в систему сайты и в некоторых случаях специальную присваемую им информацию от самого поисковика (рейтинги, индексы и прочее);
- интерфейс пользователя (зачастую просто главная страница с логотипом и полем для ввода запроса).
Также поисковый робот занимается проверкой уже проиндексированных сайтов, что бы исключить выдачу неактуальных результатов. К сайтам, часто уходящим в оффлайн или использующим запрещенные приемы продвижения, применяются штрафные санкции, такие как понижение позиций сайта в выдаче или полное исключение из индекса поисковой машины (бан).
Самыми популярными поисковыми системами являются:
- Google;
- Яндекс;
- Yahoo;
- Bing;
- Рамблер.
Характеристики поисковых систем
Самые основные критерии качества для поисковых машин это: полнота индекса, релевантность выдачи и учет морфологии и других языковых особенностей в запросах.
Полнота индекса ограничивается алгоритмом работы поискового робота (например в больших сайтах могут индексироваться не все страницы или не полный объем больших текстов на них).
Релевантность – термин означающий уместность выдачи (результатов поиска) относительно запроса, введенного пользователем.
С морфологичные и прочие языковые особенности также крайне важны для правильного “понимания” запроса поисковиком.
Поисковые алгоритмы
Так как релевантными для поискового запроса могут быть сотни, а иногда и тысячи страниц поисковикам необходимо как-то определять порядок их отображения, для этого разработчики создают алгоритмы выдачи.
В них при формировании ответа на запрос все релевантные сайты сортируются по некоторым критериям, таким как посещаемость, возраст, авторитетность, достоверность и репутация ресурса.
Критерии оценивания сайтов
Самые популярные поисковые системы (такие как Google и Яндекс) имеют свои критерии оцениваниясайтов, так или иначе влияющие на их позиции в выдаче.
Для Google это PR (Page Rank) – являющийся “авторитетом” сайта для поисковика. Колеблется он от 0 до 10 и является немаловажным аргументом для поисковой машины при выдаче результатов поиска.
Что касается Яндекса, им введен ТИЦ (Тематический Индекс Цитирования) – числовая величина, характеризующая “авторитетность” сайта для Яндекса. Отличается исключительной сложностью алгоритма расчета и непредсказуемостью в плане присвоения. Бытует мнение, что ТИЦ не влияет на позицию сайта в выдаче результатов поиска.
Эти характеристики больше влияют на цену вебсайтов и цену размещения ссылок и других рекламных материалов для них.