Анализаторы поисковых машин. Краткий обзор сервиса.

Уже 2-й год работает в сети сервис .
Что это за зверь такой и для чего он нужен?
Качество поиска касается каждого. Если поисковики ищут хорошо, то мы значительно экономим время и быстро находим нужную информацию.
Существует множество объективных и субъективных способов как оценить качество поиска. Оценка качества по опросам пользователей, популярности не дают должного эффекта.
Для объективного и независимого тест качества основных поисковиков, в 2007 году стартовал сервис .
На сегодняшний день - это единственный независимый тест поисковиков в Рунете.
Как он работает?
Для анализа используются "запросы-маркеры" и "сайты-маркеры". Например, для оценки качество навигационного поиска, используется более 5000 запросов, ответ на которые заранее задан лингвистами. Например, по слову <Сбербанк> серфер ожидает найти сайт Сбербанка в топе выдачи. Здесь запрос <Сбербанк> и сайт Сбербанка - маркеры. Для защиты от "накрутки анализаторов" со стороны разработчиков поисковиков, маркеры меняются ежедневно. Замеры производятся каждую ночь.
Анализатор качества навигационного поиска
Навигационным называется запрос, с помощью которого пользователь ищет конкретный сайт.
Лучшим результатом считается тот, когда искомый сайт (маркер) появляется на первой позиции поисковой выдачи. Поиска производится 200 случайным запросам, из общего массива навигационных запросов. Каждому запросу соответствует один или несколько сайтов-маркеров.
На основании этих запросов формируется сводный показатель.
Лучшим считается поисковик с наибольшим сводным показателем по заданному анализатору. Информер данного анализатора отсортировывает поисковики в соответствии со сводным показателем.
Анализатор качества тематического поиска
Анализ производится по похожему на описанный выше алгоритм, но человеком.
В качестве экспертного мнения применяется результат выдачи экспертной системы Нейрон. Сводным показателем данного анализатора является доля результатов поисковой выдачи, совпавших с мнением экспертов. Позиции сайта при совпадении результатов не учитываются.
Количество запросов постоянно увеличиваться, сейчас производится отбор по 100 запросам.
Лучшим считается поисковик с наибольшим сводным показателем по заданному анализатору. Информер данного анализатора отсортировывает поисковики в соответствии со сводным показателем.
Анализатор качества подсказок
Если пользователь допускает ошибку в написании запроса, большинство поисковиков предлагают правильное (по мнению машины) написание запроса. Качество предлагаемых поисковой системой подсказок - важное дополнение к качеству поиска.
Поисковой системе предлагается запрос с заведомой опечаткой и подсчитывается количество случаев, когда подсказка является "правильной". Чем больше правильных подсказок, тем выше показатель этого анализатора для конкретного поисковика.
Анализатор устойчивости к опечаткам
Человеку свойственно шибаться. Он может допустить опечатку, например введя соседний символ (и тогда вместо "запрос" получится "звпрос"), он может по ошибке продублировать символ или пропустить вовсе (и тогда вместо "запрос" получится "зпрос" или "заппрос"), наконец, он может не знать как слово пишется правильно и ввести его "как слышится" (и тогда вместо "яндекс" получится "яндыкс").
Поисковик в этом случае может отреагировать так:
- искать строго то что ввел пользователь
- найти то что введено и предложить правильную по мнению поисковой машины форму - "возможно, вы имели ввиду [правильное написание запроса]"
- не искать ошибочное написание, а сразу искать правильную форму
В зависимости от выбранной стратегии, пользователь либо не увидит что он ошибся при написании, либо увидит это и сделает лишний клик, либо даже не догадается о опечатке.
Чем большее совпадение зафиксировано, тем лучше результат поисковика по данному анализатору.
Анализатор качества поиска цитат
Цитатный поиск - это поиск определенного текста по его заданному фрагменту. Качественный поисковик должен показать ссылку на страницу, где содержится текст произведения, цитата из которого запрашивается.
Анализатор спама в поисковой выдаче
Поисковым спамом могут являться текст, ссылка, технология, программный код и иные элементы веба, созданные не для удобства пользователей, целью которых является быстрый и легкий поиск, а для улучшения позиции продвигаемого сайта в результатах поиска.
Проверяются следующие разновидности поискового спама:
- doorway - явный спам: дорвеи, увод пользователя к другим страницам,
- spamcatalog - явный спам: спамерские каталоги,
- spamcontent - явный спам: спамерский ворованный контент,
- pseudosite - явный спам: сайт, маскировка под корпоративный (псевдофирма),
- catalog - каталоги,
- board - доски объявлений,
- domainsale - домены на продажу,
- secondary - вторичный, не уникальный контент,
- partner - любые партнерские программы,
- linksite - сайт линкоподдержки,
- spamforum - заспамленный форум,
- techspam - технический спам,
- searchres - результаты поиска
Сводным показателем является доля спам-сайтов выдаче поисковой системы. Лучшим является поисковик с наименьшим сводным показателем. Информер данного анализатора отсортировывает поисковики в соответствии со сводным показателем.
Анализатор SEO-прессинга
Используется для запросов, которые невозможно понять однозначно. Например, дизайн, автомобили, спорт и др. Результатом выдачи может быть множество вариантов.
Анализатор ищет в титульных фразах и сниппетах Тор10 выдачи по анализируемым запросам однотипные строки. Суммарным показателем является процент найденных однотипных строк от общего количества сайтов в Тор10 выдачи по используемым для анализа запросам. Чем выше этот показатель - тем более велико SEO-давление на данный поисковик. Лучшим считается поисковик с наименьшим сводным показателем по данному анализатору. Информер данного анализатора отсортировывает поисковики в соответствии со сводным показателем.
Анализатор наличия 'сайтов для взрослых' в поисковой выдаче
Данный анализатор пока еще тестируется, сейчас идет отладка детектора порнографии в текстах документов. К результатам стоит относиться критически. Возможны ошибки.
Анализатор полноты индексов
Данный анализатор пока еще тестируется. К результатам стоит относиться критически. Возможны ошибки.
Анализатор апдейтов поисковых машин
Апдейт (от англ. update - гл. обновить информацию) поисковой машины - процесс обновления результатов поиска. В результате апдейтов чаще всего меняется результат выдачи поисковика. Одни сайты поднимаются в Топ, какие-то теряют позиции в выдаче. У каждого поисковика собственный алгоритм обновлений. Анализатор апдейтов поисковых машин ежедневно проверяет позиции первые страницы выдачи по 140 запросам и определяет, для какого количества сайтов позиция изменилась и какова степень этого изменения по сравнению с прошлыми данными.
Расчет сводного индекса апдейта производится по специальным формулам. При расчете так же учитываются количество исчезнувших из поисковой выдачи сайтов и количество сайтов, изменивших позицию.
У этого анализатора нет "оценочной" характеристики. Результаты можно трактовать по разному: 1) поисковик с частыми большими апдейтами можно считать более актуальным. 2) поисковик с редкими апдейтами можно считать стабильным и предсказуемым. В информере поисковики отсортированы в порядке увеличения уровня апдейта сверху вниз.
Анализатор переходов
Анализатор переходов с поисковых машин не является "качественным" анализатором, но может служить для оценки популярности и используемости поисков. Для расчета показателей анализатора используются данные счетчика Liveinternet.ru.
Следует отметить, что эти цифры - не абсолютная посещаемость или количество переходов, а процентные доли (сумма долей постоянна и равна 100%).
В определенном приближении, можно рассматривать этот Информер, как степень популярности анализируемых поисковиков для Рунета. Именно в таком порядке сверху вниз отсортированы поисковики в информере этого анализатора.
Сегодня в анализаторе представлены: Яндекс, Google, Rambler, Live.com, Yahho, Gogo, Aport, Liveinternet, Yanga.