This page is an archived copy on Gagin.ru personal site

InterNet magazine, number 24
Вебиздат
Сергей Аксенов

Эники-беники

Если задать вопрос, с чего начинается интернет, девять из десяти обитателей ближайшего чата так вот с ходу и не ответят ничего путного. Едва ли с провайдера: им интернет как раз заканчивается (причем чаще всего именно в тот момент, когда приветливая девчонка сообщила по ICQ, что фотки выслала на e-mail и ждет ответа). Наверняка не с сервера, мерно гудящего в стойке годы напролет, и уж точно не с проводов, по которым все это бегает туда-сюда. Ладно, не будем гадать. Представьте себе, что вы только что сделали персональную страничку. Ваши действия? Что вы говорите? У вас в портфолио уже пара десятков сайтов, сделанных на заказ? Тогда вы точно должны догадываться, о чем пойдет речь. Разумеется, о счетчиках и классификаторах.

Технологически счетчик — один из самых простых интернет-сервисов, который только может прийти в голову. Поставили на страничку код загрузки изображения, а при каждом его вызове — перещелкнули цифру и вернули новую картинку. Дальнейшая функциональность счетчика зависит только от фантазии его изготовителя.

Родина слонов

Говоря о российском сегменте интернета, а особенно о его уникальных характеристиках, я всякий раз не забываю упомянуть совершенно фантастический охват русскоязычных страниц внешними счетчиками и рейтингами. Из 130 тысяч уникальных серверов (согласно статистике «Яндекса») счетчики установлены минимум на 50 тысячах, то есть около 40%. Реально эту цифру можно увеличить раза в полтора, а то и в два — поскольку, во-первых, из четырех основных счетчиков, которые будут перечислены ниже, все четыре на одной странице встречаются не так уж и часто, а во-вторых, «Яндекс» не всегда способен корректно различать виртуальные серверы, предоставляющие одно и то же содержимое в разных кодировках. Нигде больше в интернете подобные сервисы так не распространены; исключением может служить разве что порноиндустрия. Нелестное сравнение, правда?

Однако из проведенной таким образом параллели можно понять и суть вышеописанного феномена. Изначально в рунете счетчики служили не только статистическим инструментом, но и способом привлечь посетителей, ориентирующихся в оценке популярности тех или иных ресурсов на их позицию в различных рейтингах. Впрочем, во времена оны рейтинг у нас был всего один.

Рамблер

Rambler Top100 был запущен компанией «Стек» еще в феврале 1997 года, когда российского интернета еще не существовало в том виде, который кажется нам столь привычным сегодня. Глядя на числовые идентификаторы отдельных ресурсов, можно в лицах и деталях проследить всю историю рунета. ID номер 7 — «Россия Онлайн», номер 60 — «Вечерний Интернет» Антона Носика, номер 1376 — «Анекдоты из России», номер 2565 — «Паравозов-News». Сейчас новым участникам рейтинга выдаются ID в районе 156 000 (три нуля, вы не ошиблись). Правда, работают из этих 150 000 лишь чуть больше 46 тысяч, остальные удалены либо владельцами, либо по истечении двухнедельной тишины на аккаунте (не было зафиксировано ни одного посещения ресурса), либо в процессе чистки. О последнем стоит упомянуть особо: заработав де-факто многолетним трудом репутацию главного рейтинга страны, «Рамблер» старается ее поддерживать: безжалостно удаляются накрутчики, нарушители правил; сайты, не соответствующие тематике выбранной категории, переносятся в более подходящую. Еще свежа в памяти история с категорией «Программы», откуда были вежливо попрошены держатели сайтов с серийными номерами и программами для взлома после того, как крупнейшие ресурсы с условно-бесплатным обеспечением (которое и страдало от кибержуликов в первую очередь) хором пообещали покинуть рейтинг, дабы не мараться присутствием в одном списке со своими нечистоплотными антагонистами. Так же вежливо и без шума были препровождены в отдельный раздел сайты с музыкой в формате MP3.

Причина столь ревностного отношения участников рейтинга к своей в нем позиции очевидна, хотя обычно она не афишируется. Побочный эффект участия в таком сверхпопулярном рейтинге, как «Рамблер» — дополнительный приток посетителей, притом подчас весьма существенный. Если первое место в разделе «Кино» приводит на сайт около 300 читателей, то уже первое место в категории «СМИ и периодика» гарантирует более тысячи визитеров в день. Не знаю, задумывались ли создатели рейтинга о таком его свойстве, но нездоровый ажиотаж и бурление в первых двадцатках происходит непрерывно — накрутки, взаимные обвинения и выпады, требования разобраться... Ни один мало-мальски посещаемый ресурс, имеющий шанс войти в первую двадцатку «Рамблера» в своей категории, этот шанс, как правило, не упускает, несмотря на то, что как счетчик «Рамблер» не приносит никакой практической пользы.

То есть он, конечно, что-то там считает. Подсчету подвержены хиты и хосты, причем недельные и месячные показатели выдаются в результате простого суммирования статистики по дням, что, ясное дело, в корне неверно. Цифра «тридцать тысяч уникальных хостов в месяц» может ввести в заблуждение кого угодно, хотя на самом деле этих хостов может быть не больше тысячи, просто они заглядывают каждый день в течение месяца. Из предоставляемых отчетов имеются в наличии только два: статистика по хитам и хостам за последние два месяца в виде столбчатой диаграммы и почасовое распределение хитов. Когда-то этого было достаточно, сегодня же подобные услуги вызывают только улыбку. Не забудем также, что обсчету подлежит всегда одна и только одна страница. Это порождает массу неудобств, вроде необходимости при регистрации указывать все синонимы обсчитываемой страницы, а также приводит к дурацким казусам, когда хорошо посещаемые сайты регистрируют пять—десять счетчиков на своих самых популярных страницах, занимая лишнее место в рейтинге. Делается это, понятное дело, все с той же целью привлечения дополнительных посетителей.

Ситуация эта остается практически неизменной уже больше года: счетчики крутятся, пользователи недоумевают, а верхи либо не хотят, либо не могут, либо просто заняты другими делами. Понятно, что более молодые конкуренты, претенденты на корону лидера, совсем не дремлют.

Апорт Top 1000
(ранее — Ранкер)

Первый же претендент не заставил себя долго ждать. «Апорт» (ныне — @Rus) компании «Агама» представлял собой поначалу фактический клон сервисов «Рамблера» — поисковой машины и рейтинга, к которым был добавлен еще и каталог по образу и подобию Yahoo. Однако в рейтинге произошло небольшое изменение, прошедшее поначалу незамеченным, — стало возможно устанавливать один и тот же счетчик на любое число страниц сайта. В результате статистика сделалась намного более точной — ведь чем больше на сайте информации, тем больше на него ставится ссылок, и ссылки эти, естественно, ведут мимо первой страницы. Таким образом, большая часть приходящих на сайт по ссылкам посетителей «Рамблером» просто не засчитывается — он их не видит. «Ранкер» стал более объективным счетчиком, и его начали устанавливать на своих страницах крупные и известные сайты. Однако ввиду отсутствия тесной интеграции между поисковой машиной, каталогом и рейтингом количество посетителей последнего невелико и, как следствие, невелик поток посетителей, вызванный нахождением в верхних позициях рейтинга. Счетчик достаточно популярен во многом благодаря собственным контент-проектам «Апорта» — в отличие от «Рамблера», «Агама» практически со старта взяла курс на их создание параллельно с предоставлением стандартных сервисов, в результате чего проект @Rus стал одним из первых русскоязычных порталов. Впрочем, он недолго оставался в одиночестве.

TopList

Дочерний проект List.ru изначально создавался с прицелом на будущее, поэтому структура его более прозрачна и интуитивна. Разделы рейтинга совпадают с рубрикатором каталога, а чтобы избавиться от элемента цензуры, присущего «Рамблеру», был найден элегантный выход — дополнительные разделы под названием «Избранное», в участии в которых ресурсам «не-комильфо» попросту вежливо отказывают. Рубрикатор оказался настолько хорош, что многие ресурсы из первой сотни с удовольствием пользуются им. «Яндекс» сумел существенно улучшить качество поиска среди ресурсов TopList, предоставив возможность ограничить его одним или несколькими разделами. Примерно тогда же стало ясно, что «Яндекс» как поисковая машина окончательно обошел «Рамблер» по уровню, после чего его популярность резко рванула вверх. Политика «дружим со всеми» принесла свои плоды: по количеству установленных счетчиков TopList почти сравнялся с «Рамблером». Конечно, это произошло в изрядной степени благодаря наличию просто огромного числа собственных ресурсов. Например, сервер бесплатных страничек Boom.ru интегрирован с TopList'ом и предлагает автоматически установить своим пользователям именно этот счетчик и пользоваться его статистикой.

Со статистикой у TopList'а тоже все в порядке, сказывается время вхождения на рынок — чем позже, тем больше усилий надо прикладывать, чтобы на равных конкурировать со старшими коллегами. Само собой разумеется, что счетчик устанавливается на все страницы. Есть удобный отчет о местах ресурса в различных разделах рейтинга, также интересна динамика аудитории с разделением на новых пользователей и «бывалых» — очень полезно для определения темпов роста своего «тиража». В комплекте с отчетом о географии посетителей это вполне позволяет принимать важные решения о дальнейшем развитии. Если установить специальный код счетчика, включающий в себя JavaScript, можно получить информацию о ссылках, по которым посетители приходят на сайт (что раньше было возможно только с помощью программ-анализаторов протокола на стороне сервера), а также о разрешении и цветности мониторов посетителей. И совсем приятные моменты: можно создать для себя свой собственный мини-рейтинг, чтобы наглядно наблюдать за динамикой развития своего сайта в сравнении с ближайшими конкурентами; недавно добавлена функция сравнения аудиторий — вводим ID или адрес другого сайта и видим, сколько процентов наших посетителей ходят также и к ним. Цифры получаются замечательные, интересные, их можно долго обдумывать и интерпретировать. Например, если два сайта с примерно одинаковой посещаемостью (около 1000 человек в день) долго обмениваются рекламой, то общая аудитория их в конце концов составит 20—25%, а совсем не 80—90%, как хотелось бы. Также понимаешь, что мир тесен: взяв любые два сайта совсем даже не общей тематики, выясняешь, что процентов 5 их посетителей пересекаются между собой. Однако даже это изобилие — далеко не все, чего можно добиться на ниве суммирования и анализа.

SpyLog

История самого молодого и самого таинственного участника нашего обзора началась в конце прошлого года со скандала — полноценного, с хлопаньем дверями и взаимным поливанием грязью «развода» с рейтингом Count.Ru, который с тех пор зачах, но все еще продолжает что-то тихонько считать. Причины никто уже не вспомнит, даже если она и существовала на самом деле, но имидж был подпорчен. Тем более эффектно выглядит ракетоподобный взлет проекта: фактически за полгода была достигнута цифра в сорок восемь тысяч зарегистрированных ресурсов, и каждый день это число увеличивается на две-три сотни (откуда, черт побери, столько сайтов вообще берется?) Таким образом, как-то совершенно незаметно на арене появилась темная лошадка, которая фактически обскакала конкурентов, долгие годы собиравших и лелеявших свою аудиторию.

Еще интереснее предыстория проекта. С самого начала SpyLog не был ориентирован ни на построение рейтинга или каталога, ни на генерацию визитов пользователей, продажу рекламы и прочие цели, которые принято называть «порталообразующими». Создатели целенаправленно настроились на сбор статистики и предоставление отчетов и подошли к этому делу с педантичностью бухгалтеров. Отчетов у них накопилось уже шестьсот разновидностей (на самом деле чуть больше шестидесяти, но с раскладкой по дням, неделям, странам и т.п.) Помимо банального подсчета посетителей, происходит невидимая взгляду работа по сбору глобальных данных по всей сети — об используемых поисковых машинах, рейтингах, броузерах, а главное, об общем количестве и динамике пользователей. Добавим сюда пустячную деталь: для новичков у системы предусмотрены отключаемые подсказки к каждому отчету. Мелочь, а приятно. Излишне говорить, что SpyLog устанавливается на каждую страницу. Кстати, есть даже специальный код счетчика для страницы, указывающей на ошибку (файл не найден, доступ запрещен и т.п.) Установив его, вебмастер сможет быстро локализовать «висячие» внутренние ссылки или написать другим сайтам, чтобы они сменили свои ссылки на правильные. Также вызывает уважение подчеркнутая корректность по отношению к участникам: например, для включения сайта в отчет сравнения аудиторий (как у TopList) по умолчанию требуется согласие ответственной персоны.

Картина получается настолько исчерпывающей, что возникают сомнения в целесообразности использования собственной внутренней статистики, анализирующей протоколы сервера, — тем более что множество данных, например размер и цветность экрана пользователя или же использование им Java и JavaScript, иными способами получить невозможно. Впрочем, делаются движения и в эту сторону. В ближайших планах SpyLog'а — акция совсем уже революционного характера, о необходимости которой кто только не говорил за последний год. Ребята замахнулись ни много ни мало на полноценный аудит протоколов посещаемости, ведущихся на серверах. Это очень серьезный шаг, способный поставить под вопрос деятельность в сети традиционных мониторинговых агентств, таких как, например, Gallup Media. Действительно, кому будут нужны их полуэмпирические построения, когда настоящие, железные цифры будут доступны каждый день, а не раз в квартал? Технологические подробности пока не разглашаются, но что эта услуга будет востребована — сомнению не подлежит. Замечу лишь, что о разработке подобной идеи первым сообщил именно «Рамблер», но прошел год, и вот молодые конкуренты уже наступают на пятки патриарху.

Вызывает интерес и оригинальная методика подсчета, используемая SpyLog'ом. Впервые на моей памяти была предпринята попытка отделить безликий термин «хост» от понятия «посетитель». Хост — это некоторая машина, с которой приходят запросы. За каждым таким хостом на самом деле может скрываться от одного до ста и больше реальных людей. Чтобы различать их, SpyLog устанавливает каждому персональный ключик (cookie), по которому потом и происходит отслеживание. Именно из-за этого ключика (и, возможно, шпионского названия) SpyLog подозревают в сборе секретных сведений о пользователях и чуть ли не сотрудничестве с ФАПСИ. Не знаю, как насчет ФАПСИ, а вот со всеми остальными участниками рынка SpyLog, кажется, уже успел посотрудничать.

Хотите собственный рейтинг? Нет проблем. Показать его у себя на сайте? Вот код, дизайн настройте по вкусу. Предлагается померяться всем чем угодно — от числа подписчиков рассылок до количества читателей в форумах или гостевых книгах. В результате в числе партнеров системы оказались такие гиганты разных отраслей, как 3D-news, «Ситилайн», «Компьютерра», «Интерреклама», МТУ, Port.ru, Travel.ru, СМИ.ru и даже «Спорт-Экспресс». И это при практически полном отсутствии собственной рекламы, за исключением устанавливаемой кнопки рейтинга, что, впрочем, тоже неплохо: при почти пятидесяти тысячах обсчитываемых ресурсов и двадцати миллионах хитов в сутки маленькие прямоугольнички с логотипом SpyLog приводят на сайт около пяти тысяч посетителей в день.

Конечно, не все так радужно. Как и любой молодой проект, SpyLog не лишен недостатков. Обязательное использование JavaScript в коде счетчика за таковой считать нельзя, так как без этого счетчик потеряет половину своей привлекательности. А вот мощность сервера, обрабатывающего поток данных и выдающего результаты, стоит увеличить или же воспользоваться опытом «Яндекса» по прозрачному распараллеливанию сервера. Иногда нужного отчета приходится ждать по несколько минут (можно его и вовсе не дождаться), и с каждым месяцем нагрузка будет только расти. Поскольку рейтинг/классификатор является в изрядной степени побочным продуктом, то неизбежная неразбериха в отдельных разделах пройдет сама собой, как только туда окончательно впишутся все лидеры. Думаю, SpyLog пойдет по пути счетчика TopList и создаст «избранные» категории для основных разделов. Пока же это, несомненно, лучшая на сегодня русскоязычная система сбора статистики.

Le Grand Finale

Буквально на наших глазах в рунете выросла та самая молодая шпана. Она с энтузиазмом трясет подряд все деревья, на верхушки которых за годы своего присутствия на рынке забрались корифеи, так и не сумевшие воспользоваться заработанным преимуществом. Лицо сети меняется на глазах, и никому не известные вчера ребята сегодня вдруг становятся лидерами. Смогут ли они это лидерство удержать — другой вопрос. Но заявки на жизнь поданы очень серьезные. Природа не терпит пустоты, и если вдруг кто-то из грандов засыпает, убаюканный ароматом лаврового венка, тут же за его спиной возникают претенденты, которые не прочь этот головной убор примерить на себя. Очевидно, в жизни «Рамблера» наступает черная полоса. Смешно, конечно, говорить о черной полосе для сайта, зарабатывающего одной рекламой полсотни тысяч долларов в месяц, однако пугающая неподвижность наблюдается уже больше года (мелкие изменения в дизайне и введение дополнительных общеинформационных сервисов — не в счет). В интернете год простоя равносилен клинической смерти любого ресурса. Левиафан масштаба «Рамблера» продолжает держаться на поверхности за счет огромного запаса плавучести, накопленного за годы безраздельного господства, но и эти запасы могут подойти к концу. Конкуренты в один голос твердят о скором коллапсе, о том, что счетчики «Рамблера» снимают, поисковой машиной перестают пользоваться, и, видимо, основания к подобным заявлениям имеются. Что служит тому причиной — поспешная и непродуманная капитализация или же отсутствие внутренних резервов, невосполнимое никакими инвестиционными вливаниями — можно только гадать, а из офиса компании «Стек» исходят только победные реляции. Остается надеяться, что в ближайшее время нас ожидает громадный качественный скачок, — если его не произойдет, будущее когда-то самого мощного ресурса рунета представляется мне безрадостным.


В оглавление номера This page is an archived copy on Gagin.ru personal site