Какую информацию называют релевантной. Релевантность - что это простыми словами на конкретных примерах

Релевантность (образовано от английского relevant – относящийся к делу) – в общем смысле это соответствие документа ожиданиям пользователя. Таким образом, релевантность поиска - это степень удовлетворения пользователя показанными в ответ на его запрос поисковыми результатами. В идеале, страница выдачи должна полностью удовлетворять информационную потребность пользователя в независимости ее полноты и точности.

Высчитывается релевантность с помощью алгоритмов поисковых систем. Каждая поисковая машина работает по своему алгоритму. В ранжирование строится за счет технологии Матрикснет.

Виды релевантности поиска

  • Формальная – именно на этом виде строится ранжирование поисковиков. Алгоритмическим путем сравнивается образ поискового запроса с образом документа в индексе поисковой машины. Это означает, что релевантность рассчитывается без непосредственного участия человека - по определенной формуле на основе данных, собранным поисковым роботом.
  • Содержательная – релевантность определяется неформальным путем. Данный вид также применяется поисковыми системами, но уже для оценки качества поиска. Специальные сотрудники оценивают поисковые результаты, исходя из их предположения о соответствии данного документа запросу. Этих специалистов называют асессорами.
  • Пертинентность – полное удовлетворение информационной потребности пользователя. Это именно то, к чему стремятся все поисковые системы.

В поисковой выдаче показываются наиболее релевантные с точки зрения поисковика страницы сайтов. Перед началом продвижения всегда необходимо определять наиболее подходящую для раскрутки страницу. Здесь можно руководствоваться такими факторами как возраст, ссылочный вес, уровень и уже имеющаяся релевантность страницы.

Чтобы определить наиболее релевантную страницу из уже существующих достаточно воспользоваться языком запросов или расширенным поиском.

Страница расширенного поиска для Яндекса http://yandex.ru/search/advanced

Страница расширенного поиска для Google https://www.google.com/advanced_search


Составляющие релевантности страницы

В подавляющем большинстве случаев SEO-оптимизаторы работают над сайтом в следующих направлениях:

  • Техническая составляющая релевантности страниц сайта – общие ошибки, затрудняющие корректную индексацию роботами поисковых систем:
    • доступность сайта;
    • скорость загрузки страниц;
    • выдача кодировки ресурса;
    • настройка кодов ответа сервера (редиректы, страницы с ошибками);
    • зеркала сайта;
    • файл robots.txt и мета-тег robots;
    • файл sitemap.xml;
    • фреймы;
    • скрытые от пользователя элементы;
    • структура URL;
    • дубликаты страниц;
    • битые ссылки;
    • дата последнего изменения страниц;
    • спам;
    • другие помехи для индексации.
  • Текстовая составляющая релевантности страниц сайта – соответствие контента запросу пользователя:
    • мета-теги;
    • заголовки текста;
    • вхождения ключевых фраз в текст;
    • атрибуты тега img.
  • Ссылочная составляющая релевантности – факторы, связанные со :
    • внешняя перелинковка;
    • анкоры ссылок;
    • характеристики доноров;
    • динамика роста ссылочной массы.
  • Поведенческая составляющая релевантности – факторы, связанные с поведение пользователей:
    • количество посетителей;
    • источники посетителей;
    • время пребывания;
    • показатель отказов;
    • глубина просмотра;
    • конверсия;
    • удобство навигации;
  • Иные факторы:
    • региональность;
    • аффилиаты.

Доброго времени суток, дорогие читатели! Думаете, выбиться в топ поисковой выдачи и увеличить трафик минимум на 30 % нереально? Тогда вам надо узнать, что такое релевантность и научиться ею пользоваться. О том, как это сделать и отличить нерелевантный контент от релевантного, вы узнаете далее.

Релевантность (англ. relevant – уместный, подходящий по смыслу) – это соответствие содержимого страницы поисковому запросу. Это означает, что она влияет на позицию сайта в результатах выдачи.

Значение слова в общих чертах – совпадение результата и ожиданий.

Теория релевантности: “Полезный контент удовлетворяет потребность в информации”.

Пример. Я ввожу в поиск “Как клеить обои самостоятельно”. Через секунду открывается список ссылок, которые должны отвечать запросу. Релевантным материалом считается мастер-класс поклейки обоев, а нерелевантным – выбор настенного покрытия, услуги разнорабочих.

Если искать в интернете “наполеон торт”, то правильным ответом будет кулинарная страница с рецептами, а биография французского полководца – неуместным.

Нерелевантный трафик – это посетители, которые не совершают целевые действия. Они попали на сайт случайно.

Как поисковая система проверяет релевантность?

Раньше поисковая система проверяла качество страницы по тексту – высчитывала . Метод был не защищен от накрутки. Хитрые сеошники спамили нужными словами, в итоге результаты поиска засорялись, а пользователи оставались недовольными.

Технологию определения релевантности я делю на два этапа.

Первый этап. Сотрудники поисковой системы – асессоры, проверяют страницы вручную по руководству. Хорошие сайты они вносят в список индексации поисковыми роботами. Их алгоритмы отличаются для разных категорий сайтов. Например, если у интернет-магазина есть раздел “Доставка”, “Оплата”, ему ставят плюсик.

Какую оценку могут дать сайту асессоры:

  • отвечает всем критериям,
  • релевантная страница с техническими недочетами,
  • материал частично совпадает с запросом,
  • нерелевантный контент или спам.

Второй этап. Машинное обучение – создание алгоритмов на основе примеров.

Допустим, 1 млн. человек отправили список любимых фильмов системе. Это примеры. Искусственный интеллект находит то, что их объединяет. Выясняет, что люди обожают кино со знакомыми актерами. В итоге, если вам нравится “Терминатор” с Арнольдом Шварценеггером, вам предложат посмотреть “Бегущего человека” с этим же актером.

Алгоритмы загружаются в компьютеры, которые занимаются индексацией.

Для автоматической проверки Яндекс использует технологию машинного обучения – Матрикснет. В него можно вносить новые алгоритмы, сложные формулы индексации без снижения скорости поиска.

Упрощенная формула: Relevant = PageRank или тИЦ * (релевантность текста + уровень ссылочного ранжирования).

Перечислим внутренние показатели, влияющие на релевантность:

  1. Частотность ключей. Плотность слова более 4 % считается переспамом.
  2. Наличие синонимов.
  3. Тег title. Должен выглядеть естественно и содержать главный ключ.
  4. Заголовок и подзаголовки. Важно наличие ключей, отсутствие ошибок и удобочитаемость.
  5. Вхождение ключей. Их нельзя вписывать криво, сохраняйте читабельность. Например, плохо: “сшить легкая юбка трикотаж”. Хорошо: “как сшить легкую юбку из трикотажа”.
  6. Атрибуты тега img. Не повторяются, естественная словоформа.
  7. Внутренняя и тематические ссылки.
  8. Наличие .
  9. Юзабилити. Страницы быстро загружаются, удобная навигация на сайте.
  10. Строение URL.
  11. Дата последнего изменения страницы.
  12. Файлы robots.txt и sitemap.xml.
  13. Структура статьи. Читатель сразу находит нужную информацию.

49 % посетителей закрывают сайт, если он не загрузился за 5 секунд. А поведенческие факторы здорово сказываются на качестве продвижения.

Уровень релевантности зависит и от внешних факторов:

  • внешней перелинковки,
  • рейтинга сайтов-доноров,
  • авторитетности ссылочной массы – PageRank или тИЦ,
  • количества посетителей,
  • источников трафика,
  • длительности просмотра страницы (не менее 40 секунд),
  • показателя отказов,
  • конверсии,
  • региональности,
  • прокрутки страницы.

Объем статьи – условный фактор. Если вам удалось ответить на вопрос пользователя, используя всего лишь 400 символов, зачем лить воду?

Классификация

Стадии релевантности:

  • формальная – проверка проведена с помощью машинных алгоритмов;
  • содержательная – асессоры читают, просматривают содержимое и решают, соответствует ли оно потребности пользователя;
  • пертинентная – контент полностью решает проблему, отвечает на вопрос пользователя.

Последний уровень – предел мечтаний вебмастера и SEO-специалиста.

Что происходит с нерелевантным материалом?

Когда появляется годный контент по запросу, поисковик избавляется от мусора. Сайт с нерелевантным материалом сначала понижают в результатах поиска, а при обнаружении черных, серых методов оптимизации – перестают индексировать. Говоря простыми словами, вашу страницу удаляют из поиска.

3 лучших инструмента для анализа релевантности

Не нужно гадать на ромашке, чтобы знать, как оценит ваш материал поисковик. Популярные онлайн-сервисы проверяют текст или страницу на релевантность за 10 секунд. Подробная статистика показывает сильные и слабые стороны вашего контента.

Я привыкла пользоваться Istio и Megaindex. Они ни разу не подводили меня.

Istio

Istio бесплатно и без регистрации показывает релевантность по отдельным словам. Вдобавок вы узнаете тошноту, водность, орфографические ошибки, объем текста.

Хотите проверить материал до публикации? Копируйте текст, вставляйте в рабочую область. И кликните на кнопку “Анализ текста”.

Загружайте статью прямо со страницы сайта, кликнув “Расширенная форма”.

Вставляете URL и выбираете “Добавить весь текст”.

Хотите знать, насколько ваш контент релевантен? Нажмите “Выделение ключей”, чтобы узнать результаты.

По умолчанию мы видим процент релевантности без стоп-слов. Советую посмотреть результаты с их учетом. Они не должны перекрывать ключи.

Вот такие результаты анализа показал сервис. А что получилось у вас? Пишите в комментариях.

MegaIndex – это 12 инструментов, которые глубоко анализируют сайт, делая его лучше. Чтобы начать пользоваться благами сервиса, нужно зарегистрироваться. Авторизации через соцсети нет, придется регистрироваться по старинке через e-mail.

Заходите на главную страницу , кликаете “Регистрация” в правом верхнем углу.

Вводите продвигаемый запрос и адрес страницы. Нажимаете “Проверить” и ожидаете результатов.

Нам не хватило 25 %. То, что мы упустили, можно посмотреть, кликнув на любой из критериев в правом списке или внизу страницы.

Мы видим, что наш контент соответствует большинству требований.

А теперь попробуйте узнать релевантность страниц своего сайта. Результатами делитесь в комментариях.

PR-CY

PR-CY уступает МегаИндексу. Нет подробного разбора ошибок. Новичок не поймет, что исправлять. Зато релевантность оценивается по трем частям текста отдельно: тайтлу, заголовку, подзаголовкам.

Регистрация не нужна. Просто выбираете раздел “Анализ контента”, вводите ключевые слова и ссылку.

Почему в результаты поиска попадают нерелевантные страницы?

Эффективность черных и серых методов SEO снижается с каждым обновлением поисковых алгоритмов. Но пока они дают результат, ими продолжают пользоваться. Иногда, перерыв кучу ссылок в надежде найти нужную информацию, сталкиваешься с дорвеями, которые переадресовывают непонятно куда.

Когда я искала отзывы о роддоме в моем районе, часто сталкивалась с подозрительными сайтами. Описание и заголовок содержали нужную информацию, но после перехода открывались страницы с акциями, онлайн-казино. Так ведь можно и вирус подхватить.

Проблема нехватки информации

В сети еще остались низкочастотные запросы без релевантного контента. Поисковик стремится отвечать на любой вопрос. Показать: “По вашему запросу ничего не найдено” – позор для него. Нехватка качественного контента заставит выдавать информацию хоть на 1 % совпадающую с запросом.

Попробуйте ввести в поисковую строку любую ерунду. Вам откроется список ссылок. Правда, вы не всегда найдете то, что запрашивали.

Накрутка посетителей

Поисковые алгоритмы еще далеки от совершенства, поэтому черная оптимизация до сих пор работает в некоторых нишах. Плохие SEO-специалисты: спамят, закупают ссылки, создают страницы для автоматической переадресации. Такие методы чаще прокатывают в развлекательной тематике, где нет жесткого контроля.

Как повысить релевантность: улучшаем контент и сайт

Будем честными, всем хочется попасть в топ поисковой выдачи, и релевантность – главный способ пробиться туда.

Как повысить релевантность?

  1. Правильно составить title. В первой части – главный ключ. Сохраняйте естественную словоформу. Например, “Дерматит у кошек лечение” лучше вписать как “Лечение дерматита у кошек: 10 проверенных способов”.
  2. Структурировать статью. Разбейте материал на подзаголовки

    . Чем выше уровень подзаголовка, тем больше он влияет на релевантность.
  3. Следить за уникальностью. Не менее 95 % по Etxt Антиплагиат , Advego , или Text.ru .
  4. Не увлекаться ключами, разбавлять текст по смыслу. Нормальный уровень академической тошноты – 7,5 % по тексту и 2,5 % – по слову.
  5. Прописывать латиницей в URL основной ключ. Например, “Как придумать заголовок” в адресе http://…kak-pridumat-zagolovok/.
  6. Добавлять синонимы и тематические слова. вытесняет SEO. Пишете статью о похудении народными средствами? Не забудьте слова, задающие направление тексту: потеря веса, лишние килограммы, народная медицина, в домашних условиях – они придутся очень кстати.
  7. Не выделять жирным все подряд. Поисковый робот подумает, что вы спамите.
  8. Вставлять 3 – 4 ссылки на другие статьи сайта, близкие по смыслу.
  9. Следить за оформлением. Статья с изображениями, таблицами, списками легче читается, чем непробиваемая стена из слов. Это положительно скажется на поведенческих факторах.
  10. Добавлять ключи в атрибут картинки .
  11. В мета-теге keywords указать 3 – 5 ключевых фраз, по которым продвигаетесь.
  12. Равномерно распределять дополнительные ключи по тексту, склонять и разбавлять их. На 1 000 символов не более 5 ключевых фраз.
  13. Избегать грамматических, смысловых ошибок.
  14. Следить, чтобы в первом абзаце присутствовал главный ключ.

Технические моменты, над которыми стоит поработать:

  1. Выбор доноров для внешней перелинковки с высоким рейтингом.
  2. Качество, скорость загрузки хостинга.
  3. Наличие зеркал у сайта, если возникнет перегрузка сервера.

Без соблюдения этих критериев контент не станет популярным.

Заключение

Релевантность – это талант копирайтера раскрывать смысл поискового запроса в статье. Посетитель заходит на сайт и понимает: “Вот оно!” Научитесь лаконично излагать свои мысли и читатели за вами потянутся, а вместе с ними и заказчики. Ускорить обучение и повысить его качество помогут наши . Записывайтесь, пока цена не выросла.

А у вас получается писать релевантные статьи? Жду ваших ответов в комментариях.

Приветствую, мои уважаемые читатели и подписчики блога. В данной статье подробно расскажу вам, в чем смысл этого понятия без использования заумных фраз и научной стилистики. На данный момент интернет заполнен значительным объемом бесполезной и искаженной информации. Масса безграмотных авторов наполняют свои работы большим количеством ключевых фраз, чтобы поисковая система нашла их творения на страницах сайтов. Но загвоздка заключается в том, что полезного контента, который бы раскрывал смысл ключевого слова, являющегося поисковым запросом, просто нет. Чтобы уменьшить число сайтов с таким бесполезным содержанием, было введено понятие релевантности.

Релевантность что это такое

Релевантность в целом – это характеристика, которая выражает соответствие чего-либо, желаемого полученному. Данное понятие в интернете является показателем, который характеризует полезность информации, относительно запроса, отправляемого в систему. Существует еще характеристика релевантности статьи, она описывает соответствие заголовка тексту, который располагается под ним. Одним словом, это то что наиболее подходит по запросу пользователя среди всей той информации что будет ему выдана.

Данный тезис станет куда прозрачнее и яснее, если посмотреть на несколько примеров, приведенных ниже.

Релевантность что это простыми словами на примерах

Допустим, Вы не знаете, как приготовить греческий салат. Очевидно, что в эру компьютерных технологий вы прибегнете за помощью к всемирной паутине, а именно, к какому-либо онлайн сервису для поиска. Вы вводите запрос, например, в Яндекс: «рецепт греческого салата», после чего вам предлагается огромный список ссылок с различной информацией, связанной с приготовлением этого блюда. После чего, Вы переходите по одной из них, и там четко и ясно описан рецепт приготовления греческого салата. Перед Вами релевантная страница, где текст полностью соответствует указанному запросу.

Для того чтобы окончательно разобраться что это такое, можно рассмотреть еще один пример:

Вам потребовалось починить свой автомобиль, Вы уже знаете, что сломалось, но как произвести ремонт остается загадкой. Как и в прошлом примере, Вам приходиться обратиться за помощью к поисковику. Вы рассматриваете предоставленные ссылки по указанному запросу и останавливаете свой выбор на самой привлекательной по Вашему мнению. Но перейдя по ней, открывается сайт, на котором предлагают купить запчасти, совершить техобслуживание, и множество других услуг, которые Вам совсем не интересны. Такая целевая страница не является релевантной.

Как поисковые системы вычисляют релевантность страницы

Раньше, для того чтобы определить этот показатель, поисковые системы анализировали число ключевых фраз на предоставленной странице. Многие люди, чтобы поднять свою статью в списке выданных поисковиком материалов, старались занести в нее как можно больше ключей в той форме, которая указана в запросе. В результате предоставленная информация зачастую не являлась релевантной, а текст был настолько изуродован, что даже читать его пропадало желание.

Через некоторое время поисковые системы кардинально изменили подход к определению релевантности. За чрезмерное употребление ключей теперь предусмотрен блок. На сегодняшний день Google, Yandex, Ramblerи другие подобные сервисы используют множество сложных алгоритмов для вычисления такой полезной характеристики.

Самым действенным и одновременно простым способом для вычисления этого показателя использует Гугл. Особые программы анализируют действия человека, а в частности время, на которое он остановился на открытой странице. Если перейдя по ссылке, пользователь не увидел ничего соответствующего его запросу, то он сразу же ее закрывает. Соответственно, время, на которое он там задержался, составит всего пару секунд, но если на этом сайте находится исключительно полезная и интересная ему информация, то, скорее всего, потребуется больше времени на ее изучение.

Чтобы узнать релевантную страницу нужному поисковому запросу, к примеру «релевантная страница» следует в сроке поиска Яндекса прописать следующее:

site: www.сайт релевантная страница

После этого вы получите список страниц, наиболее подходящих (релевантных) вашему запросу и самая точная будет первая, остальные менее подходящие, но их можно использовать как доноры ссылок .

Но время посещения – это не единственный критерий, используемый для определения релевантности. Бесчисленное множество программ и сервисов анализируют выданную по запросу информацию относительно:

  • Объема символов и ключевых фраз. Программа анализирует общий объем символов текста и количество ключевых слов в нем. Если количество превышает допустимое, то сайт блокируют. Нормальным содержанием ключей в тексте считается от 3% до 7%.
  • Числа посещений. Программа считает, сколько пользователей посетило страницу за определенный промежуток времени. Если в дальнейшем число посещений уменьшается, то это означает, что она не является релевантной.
  • Вхождение заголовка в смысл текста. Программа проверяет каждое слово в тексте и определяет, насколько оно соответствует указанному заголовку. Если слова даже близко не относятся к содержанию заголовка, то статья удаляется или дорабатывается.

И это только самые распространенные и популярные характеристики.

Заключение

Итак, релевантность, что это простыми словами? Это залог успеха в поисковых сетях. Помимо этого она может способствовать значительному увеличению прибыли от сайта. Так как если размещенная статья действительно полезна для читателя, то он точно не будет единственным. Качественные тексты до сих пор достаточно сложно найти на просторах всемирной паутины. Если в данной статье Вы нашли ответ на вопрос: «Что такое релевантность», то уже можно предположить, что она будет находиться на первых страницах выдачи.

Хорошая релевантность значительно увеличивает приток пользователей. Для блога или информационного сайта, который постоянно обновляется, это очень важно. Сейчас блоги ведут в основном профессионалы, исключительные мастера своего дела, убивая на него очень много времени. Но иногда создатели предпочитают заказывать статьи для своих творений у других людей. Временами это приводит к тому, что загружаемый контент написан в поверхностном изложении и совсем не интересен для читателя. Чтобы избежать таких ситуаций, необходимо грамотно подходить к вопросу о выборе писателя, нужно узнать, имеет ли он определенные знания в области, соответствующей тематике вашего блога.

Надеюсь материал был полезен и не забываем подписаться на рассылку новостей блога. До скорых встреч, а за репост статьи +100 к вашей карме -))).

С уважением, Галиулин Руслан.

Релевантность параметр, указывающий на то, насколько результат выдачи поисковой системы соответствует требованиям пользователя, который ввел запрос.

Релевантность высчитывается алгоритмами поисковых систем и представляет собой отношение количества ключевых слов на странице ресурса к общему числу слов. Каждой странице присваивается свой процент вхождений ключевых слов в тексте. Следует придерживаться золотой середины: небольшое количество пройдет незамеченным для поисковиков, а большое количество будет расценено как спам с последующим наложением фильтра.

Характеристика

С активным развитием Интернета и стремительным увеличением сайтов возник вопрос о качестве результатов выдачи. В ответ на это поисковые системы внедрили принцип релевантности запроса, обрабатывающий сайты и предоставляющий пользователям их наиболее приемлемые варианты.

На первом этапе релевантность страниц строилась на основе мета-тегов, плотности ключевых слов, частотности ключевиков в заголовках, способах оформления контента и т.д. С появлением дорвеев, соответствующих этим критериям, необходимо было внедрить и внешние факторы релевантности.

Ниже представлена формула, характеризующая критерии релевантности: R=PR*(T+L).

R - релевантность запроса,

T - уровень текстовой релевантности, насколько внутренние критерии соответствуют требованиям поисковиков,

L - уровень ссылочной релевантности, насколько тексты входящих ссылок соответствуют поисковому запросу,

PR - ранг ресурса, не зависит от запроса.

Эта формула - лишь условное обоснование эффективности алгоритмов ранжирования, которое демонстрирует полную картину критериев релевантности.

Внешние критерии релевантности

Внешние критерии релевантности представлены степенью цитируемости (ссылочная популярность). Релевантность сайта зависит от того, сколько сайтов на него ссылается. Чем больше ссылающихся сайтов, тем выше авторитет сайта, и тем качественней его контент.

Поисковые системы имеют свои собственные алгоритмы релевантности, но все они работают по одним и тем же принципам, по сути, это обработанная и усовершенствованная версия самого первого алгоритма (PR), разработанного основателями Google, которая характеризовала только количество внешних ссылок.

Самым первым алгоритмом релевантности считается ИЦ (показатель авторитетности страниц) Апорта, разработанный в 1999 г. ИЦ определял только самую весомую внешнюю ссылку.

В Яндексе есть свой собственный индекс цитирования, ВИЦ, релиз которого состоялся весной 2001г. ВИЦ присваивается каждой странице. После 2002г. из-за манипуляций вебмастеров с ВИЦ индекс цитирования был закрыт для общего доступа. Раньше такая услуга предоставлялась в Яндекс. Баре. На сегодняшний день можно просматривать только тИЦ, индекс цитирования для сайтов в каталоге Яндекса.

Осенью 2002г. индекс популярности появился у Рамблера, помимо ссылок, он определял и частоту посещаемости страниц сайта, которую можно было узнать из счетчика Top 100.

Внутренние критерии ранжирования

Самым весомым критерием считается частота ключевого слова на странице. Поисковики способны выделить ключевое слово в тексте. Сайт является релевантным при условии того, что запрос пользователя совпадает с ключевым словом и его формой на сайте.

Положение ключевика также влияет на релевантность сайта, особенно если ключевое слово находится в заголовке. А если запрос окажется идентичным заголовку текста, то поисковая система непременно поставит эту страницу выше других.

К внутренним критериям релевантности относят:

  1. Положение ключевого слова на странице, например, в мета-тегах.
  2. Близость ключевых слов. Не последнюю роль может играть ситуация, когда запрос приравнивается к устойчивой фразе.
  3. Положение в начале страницы. Чем выше находится ключевое слово, тем большим весом оно обладает.
  4. Синонимы ключевиков. Чем больше в тексте форм и синонимов ключевых слов, тем лучше: это свидетельствует о том, что тематика сайта соответствует изначально заданной тематике.

Релевантность – степень соответствия выдачи поисковых результатов ожиданиям пользователя, обратившегося с данным поисковым запросом . По степени релевантности выдачи судят об эффективности работы поисковой системы . Насколько релевантна та или иная информация запросу, определяется поисковым алгоритмом . В самом простом приближении релевантность страницы определяется соотношением количества употребления ключевых слов, входящих в поисковый запрос, на странице сайта к общему объёму текста. Для каждой системы существует свой процент вхождения поисковой фразы в текст, говорящий о высокой релевантности страницы. В среднем это 5%. Меньшее количество поисковых фраз может быть проигнорировано поисковиком. Большее – может попасть под ограничения спам -фильтра поисковой системы со всеми вытекающими последствиями.

Описание

С развитием сети Интернет поисковым системам стала отводиться главенствующая роль. Благодаря их алгоритмам пользователи могли получить быстрый доступ к любой информации. Однако стремительное увеличение количества сайтов также начало порождать и проблему выбора. Так как на один пользовательский запрос могло быть выдано до нескольких тысяч сайтов, среди которых присутствовали как качественные, так и некачественные, поисковые системы были вынуждены разработать принцип релевантности, позволяющий им отбирать для пользователей наиболее подходящие под их условия документы.

Изначально релевантность страниц определялась внутренними критериями: плотностью ключевых слов в тексте, встречаемостью ключевых слов в заголовке, мета-тегах, элементах оформления текста и многими другими. Однако после появления дорвеев , оптимизированных под данные требования, появилась необходимость в разработке и внешних параметров, определяющих соответствие сайта введённому запросу. В качестве примера, описывающего этот процесс, можно рассмотреть следующую формулу:

R=PR*(T+L); где: R – значение релевантности; T – степень соответствия внутренних критериев заданным поисковыми системами требованиям (текстовая релевантность); L – уровень ссылочного ранжирования - степень соответствия текстов входящих ссылок на документ поисковому запросу (ссылочная релевантность); PR – показатель внешних критериев документа, не зависящих от запроса (авторитетность ресурса).

Данная формула не является точным отображением работы современных алгоритмов ранжирования поисковых систем, однако даёт представление о значимости и видах критериев, из которых и складывается релевантность страниц.

Внутренние критерии релевантности

Наиболее значимым внутренним критерием релевантности являются ключевые слова, а именно их частота в тексте. Поисковые системы способны высчитывать этот параметр и при частом повторении какого-либо словосочетания считать его за ключевую фразу. Если при пользовательском запросе найденные фразы на странице соответствуют его форме и являются ключевыми, то есть часто употребляемыми, сайт будет считаться релевантным.

На ключевые слова большое значение оказывает и их месторасположение. Прежде всего это их наличие в различных заголовках. Если запрос пользователя совпадает с названием документа, вероятность того, что поисковая система оценит эту страницу больше других, станет выше. В качестве дополнительных факторов, влияющих на вес ключевых слов, также выступают:

  • Близость к началу страницы. Чем ближе к началу страницы находится ключевое слово, тем оно значимее.
  • Наличие ключевых слов в некоторых местах страницы. К примеру, в заголовках, мета-тегах , тегах оформления текста.
  • Близость ключевых слов друг к другу. Имеет значение, когда в роли поискового запроса выступает какая-либо фраза, особенно устойчивое словосочетание.
  • Наличие синонимов ключевых слов. Поисковые системы часто обращают внимание на присутствие в текстах других форм ключевых слов, свидетельствующих о том, что в документах действительно идёт речь по данной тематике.

Внешние критерии релевантности

В основе внешних критериев релевантности лежит принцип цитируемости или ссылочной популярности. Данный фактор подразумевает то, что релевантность сайта может определяться его популярностью в сети Интернет, то есть количеством других ресурсов, ссылающихся на рассматриваемую страницу. Чем выше их число, тем больше авторитетный вес сайта, а, следовательно, изложенная на нём информация является более качественной.

Каждая из поисковых систем использует свой алгоритм определения уровня цитируемости, однако все они имеют сходный механизм действия и по сути выступают модификацией первого в мире алгоритма, учитывающего количество

Статьи по теме: