Настройка Google Analytics: расширенный отчет о страницах с 404 ошибкой

Стандартный код Google Analytics не даёт нам никакой информации о несуществующих страницах. Всё, что мы видим в стандартном отчёте — это список посещённых страниц, статистика и информация об источниках.

Но, настроив счётчик правильно, мы можем собрать весьма полезную информацию:

  1. список несуществующих страниц, на которые попадали ваши посетители
  2. referer (страница, с которой посетитель попал на несуществующую страницу)

Эта информация будет особенно полезна для очень больших сайтов, где нет возможности пробежать сайт с помощью программ типа Xenu.

Есть как минимум 2 способа получить больше информации о 404 ошибках в Google Analytics.

Первый способ

Идею подхватил у АличЪ’а, за что ему спасибо.

Для того, чтобы начать собирать расширенную статистику понадобится изменить всего одну строчку в коде счётчика на 404 странице.

Так выглядит фрагмент кода Google Analytics для существующих страниц:

А так для несуществующих:

Т.е. код на работающей странице и на не существующей должен отличаться!

Как это работает?

  • location.pathname – возвращает путь в url от корневого слэша.
    Например, для страницы http://internet-marketolog.com/page/ будет возвращено значение /page/
  • location.search – возвращает GET-запрос из url.
    Например, для страницы http://internet-marketolog.com/page.php?peremennaya=znachenie будет возвращено: ?peremennaya=znachenie
  • document.referrer – возвращает реферер (url документа с которого был совершен переход).

Этот код передает в статистику просмотр страницы. Виртуальная страница будет называться /error404. В Get-параметрах этого url будет адрес просмотренной страницы и реферер.

Не получается сделать разный код для существующей и не существующей страницы?

В этом случае просто добавьте код для отслеживания ошибки после (это важно!) основного кода GA. То есть, если код GA стоит у вас в футере, то это не сработает, надо перенести код ближе к началу документа, например, поставить его сразу после открывающего тега <body>.

Внимание! В этом случае код отслеживания ошибки генерирует виртуальную страницу дополнительно к передаваемой странице, отдающей ошибку 404, стандартным кодом. То есть при просмотре страницы с ошибкой в статистике фиксируется просмотр сразу двух страниц, самой несуществующей страницы и виртуальной страницы /error404.

Второй способ

Если у несуществующих страниц отображается специальный Заголовок в тэге <title>, мы можем настроить фильтр в аккаунте Google Analytics.

Например, на моём сайте <title> для 404 страницы имеет вид:

Страница «Page-that-does-not-exist» не найдена

Page-that-does-not-exist — это адрес страницы, которая была открыта. Т.е., в случае этого примера, была прсмотрена страница http://internet-marketolog.com/page-that-does-not-exist.

Я настроил такой фильтр:

Мы ищем страницы, заголовок у которых начинается на «Страница » и заканчивается на » не найдена».

У страниц, которые подходят под этот критерий, мы изменяем URL: добавляем «404: » слева. Это нужно для того, чтобы мы могли опознать страницы, которые выдали ошибку среди всех остальных страниц в отчёте.

Где посмотреть отчёт?

Данные об ошибках можно найти в отчете «Содержание / Содержание сайта / Страницы».

Для первого способа

В форме поиска пишем «error404», чтобы отобразить только несуществующие страницы:

Получаем список страниц с расширенной инфой:

Нельзя сказать, что это очень удобно, т.к. вся информация собирается в один URL. Но это точно лучше, чем ничего. К тому же, если ошибок много, Вы можете выгрузить их в .csv и с помощью автозамены разбить каждую строку на 2 ячейки: URL страницы с ошибкой и URL реферера. Да, это дополнительные действия, но это не сложно.

Для второго способа

В форме поиска пишем «Error 404», чтобы отобразить только несуществующие страницы:

Получаем список страниц с ошибкой, которые были просмотрены:

Выбираем заинтересовавшую нас страницу и кликаем на её URL. Переходим в режим «Сводка по навигации»:

И изучаем проблему:

  • Такое отображение можно получить и для первого способа, но оно не так сильно нужно, т.к. вся эта информация уже есть в URL. Её удобнее смотреть в Excel.
  • Если переходов на страницу с ошибкой будет много (с разных страниц), второй способ может не показать всех страниц-рефереров, т.к. сводка по навигации показывает только по 10 самых популярных страниц, с которых пришли и на которые ушли.
  • Инструменты для веб-мастеров дают подобный отчет — см. Ошибки сканирования

    • Инструменты для вебмастеров не дают информации о трафике, который идёт на страницы с ошибкой 404. И ещё эти инструменты будут молчать, если на вас поставили битую ссылку с какого-нибудь внешнего сайта (например, с посещаемого форума).

      Если у Вас пара слабопосещаемых страниц выдаёт ошибку — это одно. В рамках большого сайта можно и не заморачиваться (иногда исправления делаются долго и/или сложно). А представьте ситуацию, когда Вы запускаете новую рекламную кампанию в Директе и Adwords и по какой-то причине ошиблись с URL или программист «допилил» сайт и поменялась структура URL.

      В инструментах для вебмастеров — всего лишь на одну строчку больше — не существенно. А в Google Analytics Вы можете увидеть, что уже 400 человек пришли «никуда» и быстро отреагировать.

      В инструментах для вебмастеров эта информация появится в лучшем случае на следующий день. А в Google Analytics можно увидеть это в тот же день и даже настроить себе уведомления.

      • Инструменты для вебмастеров не дают информации о трафике — верно, но Инструменты для вебмастеров, по крайней мере у меня, показывают — сколько страниц не найдено, они же ссылки с ошибкой 404. Можно провалится, где выведется список url которых гугл не обнаружил на сайте и присвоил им вышеупомянутую ошибку. В моем случае это страницы с которых не проставлен 301 редирект при смене cms. Дальше можно провалится на любую из ссылок и в всплывшем окошке выбрать закладку Ссылающиеся домены — тут и будут ваши битые ссылки или старые (как на вашем сайте так и внешних) которые еще в индексе как в моем случае. Единственное, что действительно — статистику по трафику из Инструментов для вебмастеров мы не возьмем, но зато есть возможность её исправить, даже если по ней 0 трафик, например это неправильная ссылка в содержании вашего сайта на страницу в рамках сайта.

        • Всё верно. Эта настройка нужна не столько для нужд seo, сколько для быстрой реакции и защиты от потери большого количества ценного трафика.
          Как бонус — Вы можете увидеть, как ведут себя люди, попавшие на 404 страницу и улучшить саму 404 страницу.