Алгоритм поисковых систем



Алгоритм поисковых систем это математическое «правило» выраженное специальной формулой, согласно которой обрабатывается запрос пользователя и выдается ответ, на основе выбора из нескольких вариантов.

Алгоритм поисковой системы сначала «получает задачу», оценивает все возможные варианты и возвращает готовое решение в виде поисковой выдачи.

Алгоритм поисковой системы анализирует ключевые слова, которые определяются роботом поисковика, после чего сортирует данные и формирует релевантный поисковый результат, который мы, собственно, и видим на странице выдачи.

Алгоритм поисковых систем состоит, таким образом, в анализе содержания страниц и релевантности ключевиков на основе специальной математической формулы, которая и составляет алгоритм. Каждая поисковая система имеет свой уникальный алгоритм, поэтому. В разных поисковых системах, по одним и тем же запросам разная поисковая выдача.

Формула алгоритма поисковой системы обрабатывает и анализирует следующие данные:

  1. Возраст сайта, то есть время прошедшее с первого появления сайта в данной поисковой системе;
  2. Имя домена – уникальный URL сайта, а так же его название;
  3. Язык, или языки используемые на сайте;
  4. Количество страниц сайта;
  5. Степень популярности основной темы сайта;
  6. Суммарный объём ( или же вес) сайта, а так же физический объем каждой из страниц сайта;
  7. Общий объём текста сайта, а также объем каждой конкретной страницы данного сайта;
  8. Использование стиля в страницах сайта;
  9. Суммарное количество ключевиков как всего сайте, так и отдельных его страниц;
  10. Математическое соотношение суммарного числа всех слов на сайте или странице к общему количеству ключевиков слов на сайте странице соответственно;
  11. Google Page Rank или тематический Индекс цитирования Яндекса (в случае с этими двумя самыми значимыми поисковиками, у других поисковых систем существуют свои аналогичные параметры);
  12. Общее количество запросов, поданных пользователями по данному конкретному ключевику с за определенное время;
  13. Период, за который происходит обновление информации сайта и конкретная дата последнего обновления как сайта, так и каждой из его страниц;
  14. Общее количество графических и мультимедийных файлов, содержащихся в сайте;
  15. Наличие и использование фреймов;
  16. Шрифтовое оформление ключевых слов (жирный шрифт, курсив, заглавные буквы и др.) Особенности стиля заголовков и ключевиков;
  17. «Реальность» использования ключевых слов на странице. То есть, распределены ли они гармонично в тексте, или «свалены в кучу»;
  18. Удаление ключевых слов от начала странице ( есть мнение, что в основных поисковиках значимость этого фактора теперь минимальна);
  19. Наличие в коде сайта мета-тегов и их соотношение с текстом сайта;
  20. Присутствие и конкретное содержание описания и «свойств» страниц сайта;
  21. Наличие легендарного файла «robots.txt»;
  22. Географическая и региональная привязка сайта;
  23. Наличие, количество и содержание комментарии в коде страниц сайта;
  24. Тип кода (html или asp) каждой из страниц данного сайта;
  25. Наличие flash модулей на сайте и его отдельных страницах;
  26. Наличие страниц-дублей (клонов), или незначительно отличающихся по контенту;
  27. Соответствие ключевиков сайта конкретному разделу каталога поисковика, в случае, если он в нем зарегистрирован (например DMOZ для Google и Яндекс Каталог для Яндекса);
  28. Наличие на сайте «стоп слов» (в основном, служебных частей речи и местоимений), которые поисковая система автоматически исключает из алгоритма;
  29. Алгоритм поисковых систем учитывает суммарное количество гиперссылок сайта, число внутренних ссылок (со страниц сайта на другие страницы этого же сайта), число внешних ссылок сайта (ссылок ведущих с других сайтов);
  30. Глубина сайта, сиречь количество структурных уровней, содержащих внутренние страницы сайта, начиная с главной страницы, и далее по «дереву» сайта;

А также еще немалое количество параметров, которые включаются в алгоритм поисковых систем.

Всех их знать не может никто, так как алгоритмы поисковых систем составляют главную коммерческую и техническую тайну. Так же неизвестно, какие из факторов оказывают большее или меньшее влияние на выдачу, а какие уже не оказывают вовсе.

Так же с алгоритмом поисковой системы взаимодействуют специальные фильтры поискового спама, фильтры уникальности, трастовости и.т.д. (например один из фильтров — знаменитая «песочница» Google, применяемая к вновь созданным сайтам не протяжении нескольких первых месяцев).

Powered by сristal-dev