This page is an archived copy on Gagin.ru personal site

InterNet magazine, number 27
Вебиздат
Андрей Албитов

Полет над гнездом cookушки

Наверное немногие сегодня смогут точно ответить на вопрос, когда появились сookies. Тем не менее сотни процветающих в настоящее время компаний обязаны своим благосостоянием именно этим небольшим, размером в несколько килобайт, файлам. Несмотря на то что технологию сookies поддерживали самые ранние версии современных броузеров, интерес к ней проснулся значительно позже, когда требования к веб-проектам заметно возросли и сложное программирование стало нормой сайтостроительства.

Кто сказал cookies?

Cookie («кука», «куки») — это небольшой блок текстовой информации, который сервер передает броузеру посетителя. Броузер сохраняет эту информацию на локальном диске и, в свою очередь, передаст ее обратно серверу в том случае, если пользователь снова посетит одну из его страниц. Некоторые сookies устроены так, что могут храниться на локальном диске пользователя ровно столько, сколько длится один сеанс связи. Но более распространенной является другая их разновидность. Относящиеся к ней сookies прописываются на постоянное место жительства в одноименную директорию на диске посетителя. Microsoft Internet Explorer создает для cookies каждого просмотренного сайта отдельный файл, по названию которого можно определить, кем он был установлен. Netscape Navigator записывает все «куки» в один файл.

Если бы на свете не существовало cookies, каждый запрос пользователя к серверу обрабатывался бы совершенно отдельно от его предшествующего запроса. Например, благодаря cookies вы приходите в интернет-магазин, один-единственный раз кладете товар в «корзину», и он остается там в течение всего времени, которое вы проводите на сайте. При этом вы можете положить в «корзину» и другие товары, которые тоже останутся там вплоть до того момента, когда вы захотите покинуть магазин и рассчитаться. Cookies используются на большинстве сайтов, которые предлагают пользователю индивидуальную настройку сервиса — именно благодаря им вы можете не только менять способ представления информации на сайте, но и оставаться уверенными в том, что эти изменения будут сохраняться до тех пор, пока вы сами их не отмените. Альтернативой cookies является регистрация пользователя на сайте. Прежде чем позволять человеку вносить какие бы то ни было изменения в содержание сайта, его отправляют заполнять анкету. В этом случае сервер «вспомнит» посетителя, когда тот при повторном визите введет зарегистрированное в предыдущий раз уникальное имя и пароль. Эта распространенная процедура, во-первых, отнимает у пользователя время, а во-вторых, на адреса электронной почты, которые «регистраторы» обычно вынуждают пользователей указывать, впоследствии то и дело сыплется спам. Существует еще способ идентифицировать пользователя по IP-адресу, однако его недостатки еще более очевидны — по одному и тому же адресу могут работать несколько людей, и наоборот, нередко один и тот же человек в течение дня выходит в сеть с разными IP-адресами. Первое возможно в корпоративной сети, где одним и тем же компьютером пользуются несколько человек поочередно, а второе в порядке вещей для тех пользователей интернета, которые выходят в сеть при помощи модема: при каждом дозвоне сервер провайдера присваивает пользователю новый IP.

Существует масса других примеров применения cookies. Они задействуются при голосованиях на сайтах как способ защиты от накруток, хотя наиболее ушлые накрутчики могут стирать проставленные сайтом cookies вручную после каждого захода, чтобы поучаствовать в голосовании заново. Также широко распространено использование cookies в качестве инструмента для сбора статистических данных в сети. Так, система глобальной интернет-статистики SpyLOG предоставляет своим пользователям более 600 видов отчетов, многие из которых не удалось бы составить, если бы не существовало технологии cookies.

Наиболее активно cookies применяются при построении персонализированных страниц. Например, каталог «Пингвин» (www.pingwin.ru) отслеживает, какие его разделы вы просматриваете, и посетив сайт вновь после сколь угодно долгого перерыва, вы будете извещены обо всех новых ссылках, появившихся в нем за время вашего отсутствия. Для того чтобы идентифицировать прежнего посетителя, серверу достаточно одних только cookies.

Удостоверение личности

Персонализация контента часто базируется на определенных правилах. Это значит, что сервер работает на основе заданных шаблонов и ограничений: генерируя страницу, он учитывает не только предпочтения и пожелания пользователя, но и предписания владельцев сайта. Правил может быть множество — они зависят от того, как владельцы сайта позиционируют его на рынке — как комерческий, информационный, рекламный или какой-либо другой ресурс. Но алгоритм, естественно, задается человеком; отсюда и проистекают недостатки этого типа персонализации. Не всегда навязчивый сервис способен сослужить посетителю хорошую службу. Чаще всего все происходит как раз наоборот: например, в том случае, когда интернет-ресурсы помимо его воли подсовывают ту или иную информацию. Самый известный пример такого рода поведения владельцев сайта — это недавний случай с компанией Amazon.com, которая установила разные цены на один и тот же товар в зависимости от того, с какого компьютера и под каким именем заходил пользователь. К счастью, бдительные американские граждане, обсуждая покупки в форуме на том же сервере, достаточно быстро обнаружили разницу в ценах, после чего Amazon.com был вынужден признаться в некорректности «эксперимента» и принести пользователям свои извинения. 6896 пользователей, по вине Amazon заплативших за DVD-диски повышенную цену, получили компенсацию.

Еще один распространенный тип персонализации — групповая фильтрация. Она основана на идентификации группы людей, имеющих одинаковые предпочтения. Страницы генерируются по определенным правилам — здесь никакого отличия от первого типа нет. Разница только в том, что в этом случае правил не так много и рассчитаны они на определенное число групп. Например, с высокой степенью вероятности определив какую-нибудь одну характеристику посетителя (скажем, на основе его поведения на сайте, интереса к особым разделам и т.п. установив его половую принадлежность), можно отнести его к соответствующей группе, установив ему cookie. Это позволит более осмысленно организовывать предлагаемый его вниманию контент — например, показывать рекламу товаров, предположительно соответствующих запросам той группы пользователей, к которой он относится.

Конечно, существует некоторая вероятность погрешности, но то, насколько она будет велика, зависит от качества составления профиля группы, надежности данных и квалификации исполнителей. Групповой тип персонализации осуществляется поэтапно. Сначала либо проводят опрос посетителей, либо фиксируют, какие страницы они посещают. Затем на основе полученных таким образом данных создают «профиль» того или иного посетителя, учитывающий его привычки и интересы. В следующий раз, когда пользователь вернется на сайт, сервер, сравнив его «профиль» с «профилями» всех групп, определит, к какой из этих групп он относится. Если предпочтения посетителя изменяются, то он переводится в другую группу.

Теоретически возможна также мгновенная персонализация. Это очень сложный, но при этом и наиболее эффективный метод. Для его реализации требуется помощь специализированных компаний — в одиночку этого не осилить никакому, даже самому крупному интернет-ресурсу. Специфика этого метода заключается в использовании больших баз данных, источником которых являются провайдеры, баннерные сети, различные сайты, сервисы бесплатной электронной почты. Невозможно представить себе человека, пользующегося интернетом, который при этом не вступает ни в какие контакты с этими «сетевыми элементами». Вступает, и неоднократно. И каждый раз, когда он это делает, вся информация о наиболее часто посещаемых им местах, его интересах и т.п. заносится в некий обезличенный аккаунт. Теоретически, независимо от того, откуда пользователь приходит на сайт, использующий метод мгновенной персонализации, его профиль и категория, к которой он относится, будут немедленно определены. Соответственно, принимающий его сайт отобразит страницу, сформированную с учетом этих данных, даже если это будет первое для этого пользователя посещение, а информация о нем будет ограничиваться указанием на его географическое местоположение. Сайтов, воплотивших этот способ персонализации в жизнь, пока не существует, хотя многие веб-магазины на Западе давно пользуются более простой моделью персонализации - по географическому принципу. Так работал, например, сайт GreatCoffee.Com (сейчас этот магазин ищет нового владельца), осуществляющий торговлю кофе и сопутствующими товарами (например, посетителям, проживающим в Северной Калифорнии, предлагалось купить билет на матч, проходящий в расположенном в том же штате Сан-Франциско). Предлагать подобную услугу всем пользователям сайта без разбору было бы бессмысленно, однако при направленном действии подобные предложения дают весьма хорошие результаты: посещаемость сайта возрастает до 50%, причем эта цифра относится к повторным посещениям, что говорит о том, что «старые» посетители, возвращаясь снова и снова, образуют как бы ядро аудитории сайта.

Несомненно, будущее — за технологиями мгновенной персонализации, но пока они еще слишком дороги и время их широкого внедрения еще не пришло.

Что cookies нам готовят?

Поскольку сookies — это не сложная программа, а просто некие данные в текстовом формате, значимость их прямо зависит от того, что это за данные. Они могут передавать серверу всю информацию о настройках и предпочтениях посетителя либо один только идентификатор пользователя, знания о конкретных предпочтениях которого хранятся на сервере интернет-ресурса и активизируются только после его опознания через идентификатор.

Некоторых пользователей раздражает то, что серверы посредством cookies записывают на их собственные локальные диски свою информацию. Но ограничения, принятые при разработке технологии cookies, предполагают, что размер каждого отдельного cookie-файла не может превышать 80 кб, а в сравнении с объемом современных винчестеров эта цифра выглядит как капля в море. Кроме того, современные броузеры располагают функциями, которые позволяют пользователю либо совсем блокировать прием cookies, либо получать предупреждение в случае, если сервер будет пытаться установить их на его компьютер. К сожалению, многие серверы настолько сильно полагаются на использование cookies, что предупреждение вы будете получать всякий раз, как попытаетесь загрузить какую бы то ни было новую страницу, поэтому такая настройка имеет шанс очень быстро вам надоесть. Гораздо удобнее настроить броузер так, чтобы он хранил cookies только на время соединения с сервером, их установившим, а после прерывания сеанса связи автоматически их удалял, — этого позволяет добиться как Internet Explorer, так и Netscape Navigator последних версий.

Если вам неприятна мысль о том, что кто-то распоряжается вашим дисковым пространством, то вероятность, что персональные данные, которые хранятся в ваших cookies, могут быть переданы третьим лицам, должна нравиться вам еще меньше. Существует возможность перехватить данные в момент их передачи с пользовательского компьютера серверу и затем перенаправить совсем не тому адресату, которому они изначально предназначались по замыслу пользователя.

Существует и проблема, связанная с тем, что некоторые из proxy-серверов и корпоративных систем безопасности не пропускают cookies, создавая дополнительные неудобства для сайтов и пользователей. Нужно иметь в виду, что если эти методы и пускаются в ход, то происходит это только на рабочих местах: таким образом работодатели пытаются предотвратить утечку информации и нецелевое использование рабочего времени своими сотрудниками.

Распространено мнение, что использование cookies нарушает право пользователя на тайну частной информации. Но посредством этих текстовых файлов передается только та информация, которую вы по какой-то причине ввели в окно броузера сами, и это обстоятельство необходимо иметь в виду, указывая свои предпочтения или личные данные на тех или иных сайтах. Если вы по той или иной причине не хотите отключать у себя cookies, вам поневоле придется надеяться на добросовестность разработчиков систем персонализации. В арсенале у последних есть масса способов уберечь персональную информацию пользователей — начиная от хранения их данных на сервере в зашифрованном виде и заканчивая применением технологии SSL, позволяющей на ходу шифровать все данные, которыми обмениваются сервер и клиентская программа.


В оглавление номера This page is an archived copy on Gagin.ru personal site