This page is an archived copy on Gagin.ru personal site

InterNet magazine, number 14
Лица|Строитель
Александр Гагин

В птичьем полете

Валерий Бардин работает в отечественном Интернете с самых ранних времен кооператива "Демос". Он активно участвовал в организации АО "Релком", затем в создании той части "Национальной службы новостей", которая затем превратилась в "Национальную электронную библиотеку". Говорят, что именно Бардин был одним из идеологов этих проектов. От ярлыка "идеолог" Валерий пытался отказаться, но мы ему не поверили. Беседовал Александр ГАГИН

Послушать
фрагмент
интервью с
В. Бардиным

Чего публика не знает о ранних временах Интернета в России?

Известно, что Интернет -- не российское изобретение. Однако появление советского участка в мировой сети в 1990 году не во всем походило на приезд убогого родственника.

Было три занимательных момента.

Во-первых, при подключении "Релкома" к мировой сети наша сеть состояла из 13 хостов, но уже к 1993 году мы обслуживали более половины европейских пользователей. В России этот факт не обсуждался, в то время наших сограждан интересовали более серьезные проблемы. Более того, я думаю, что если бы нам не приходилось платить европейской ассоциации сетей (EUnet) за каждого пользователя, эту "победу" мы вообще бы не заметили.

Во-вторых, в тот же период Россия обогнала Штаты по такому параметру, как доля сетевых машин в общем парке ЭВМ. Об этом мы узнали из зарубежных публикаций, но особого впечатления это событие ни на кого не произвело. Кто же знал, что для американцев этот параметр считался более важным, чем количество произведенного чугуна на душу населения. У Эстер Дайсон все это хорошо воспето в ее публикациях того времени.

И третье. К 93 году в стране было более 120 региональных интернет-провайдеров, что по тем временам было очень серьезно для любой страны.

Интерес зарубежных специалистов к развитию российской сети прежде всего был связан с тем, что мы совершенно не вписывались в привычные каноны. У нас начался взрывной рост Сети.

Вы хотите сказать, что взлет Интернета начался именно в России?

На приоритете России я бы настаивать не стал. Здесь было множество научных организаций и квалифицированных людей, была какая-то техника, море энтузиазма, не было денег, но никто и не надеялся на мгновенные прибыли. Но самое главное -- это была коммерческая сеть, которая изначально жила по законам рынка. А "взлет" начался именно с коммерциализации Интернета и появления множества мелких коммерческих узлов, которые взяли на себя основную работу по привлечению клиентов.

Откуда в России 120 ISP?

Сначала появилась идея, что если все группы любителей ОС Unix разом купят модемы и поставят специальную математику, то возникнет сеть, охватывающая почти всю территорию СССР. Полгода ушло на обкатку ПО, придумывание модели взаимодействия узлов. Потом началась агитация... В течение года в строительство сети была вовлечена большая часть коллективов, имевших опыт работы с ОС ДЕМОС (адаптация UNIX). Многие из этих 120 узлов в том или ином виде живы и действуют до сих пор -- в основном переквалифицировавшись в IP-провайдеров (прим. ред. -- 1993 году Интернет в России в основном ограничивался электронной почтой и новостями Usenet).

Какая часть из этих 120 была в Москве?

Кажется, четыре. Для более точного ответа на этот вопрос нужно поднять справочник того года.

Существовал справочник абонентов сети?

Он выпускался "Релкомом" в типографском виде. Тогда это можно было делать. Если сейчас попытаться соорудить справочник, включающий все вплоть до личных адресов, то получится том невероятного объема. А тогда справочник составлялся автоматически из базы данных -- это ведь были параметры строгого учета, потому что количество клиентов на данной территории являлось основой взаиморасчетов с EUnet.

Были ли проблемы взаимодействия с европейской сетью?

Да, причем неожиданные для нас. Дело в том, что у нас была коммерческая сеть. Когда мы в 92-м впервые приехали на совещание Европейской ассоциации открытых систем, то были очень удивлены. Мы прибыли из почти социалистического государства (правда, с уже запрещенной на некоторое время компартией) как представители сети, которая жила исключительно на свои деньги. И столкнулись с тем, что большая часть из 22-х стран-участниц представлена полугосударственными структурами. Все голосования проходили так: они встают и говорят -- "Дания -- за", "Франция -- за", "Великобритания -- за". А нам приходилось постоянно сообщать, что мы голосуем от имени компьютерной сети, находящейся на территории некоторых стран бывшего СССР. Кстати, главной темой совещаний тех лет был вопрос о создании европейской коммерческой сети.

Но потом западные сети развивались быстрее, судя по тому, что сейчас они более развиты, чем наши.

Действительно, в 1993 году в США были созданы экономические условия, способствующие появлению мелких провайдеров. Первоначально в Штатах было несколько крупных фирм, которые, опасаясь конкурентов, не допускали никого на рынок. Услуги для вторичных провайдеров у них стоили дороже, чем для простых клиентов. Как только цены были снижены, начался резкий рост сети.

В России тем временем сеть была признана серьезным занятием, ею занялись серьезные люди, которые взяли за основу "западный" путь развития -- то есть модель, работавшую в Америке до 93 года. Все основные фирмы, например тот же "Релком", объявили себя коннект-провайдерами, и попытки строить франчайзинговые или корпоративные сети были заброшены.

Я неоднократно слышал, что именно Вы были идеологом организации "Релкома" как акционерного общества с узлами, построенными на принципах франчайзинга.

Штатного идеолога у нас не было. Был постоянно действующий семинар с участием всей команды, представителей региональных узлов. После многочасовых (иногда крайне эмоциональных) обсуждений, как правило, было трудно понять, кто первый подал идею, кто привел ее в приемлемый вид.

Ведь у нас была большая команда -- мы пытались построить корпоративную сеть, опираясь на Unix-группы. Предполагалось создание единой сети, в которой узлы сами владеют своим имуществом, сами обеспечивают сервис, сами получают деньги. И есть центр сети, который разрабатывает стандарты сервиса, типовые договоры, фирменный стиль; готовит рекламу и отлаживает математику (прим. ред. -- математикой компьютерщики старой закалки называют программы). Эту функцию должен был взять на себя центр сети АО "Релком". Увы, это не было сделано. Система оказалась недостроенной, хотя какие-то остатки есть до сих пор. Можно найти, помимо центрального АО "Релком", провайдеров с этим словом в названии -- "Урал-Релком", например. В основном их хозяева поставили это слово себе на вывеску уже после того, когда проект начал разваливаться.

До какой степени он успел развиться, в какой части был реализован?

Узлы были созданы, взаимоотношения сложились, и, в принципе, сеть развивалась. В 1993 году центр (отдел развития АО "Релком") был расформирован. В результате франчайзинговая сеть не была юридически оформлена, множество общих проблем, которые можно было решить единожды, стали решаться по 120 раз (на каждом из узлов). Интернет по-прежнему захватывал Россию, ни о каком "феномене российской сети" более никто не писал.

Действительно ли отсутствие единых стандартов могло существенно затормозить развитие сети?

Представьте себе, что будет, если в пустыне Сахара взять и поставить автомобильный завод. Строить его будут скорее всего марокканцы или турки, станки, может быть, купят у "Боша". Поставщики будут одними и теми же, но завод станет выпускать либо "Мерседесы", либо "Жигули". Чем определяется, что за модель будет там выпускаться и насколько она будет надежна? Прежде всего -- системой принятия решений, структурой фирмы, документооборотом (остальное покупается на стороне).

В нашем случае была попытка создать такую структуру, которая могла бы выживать, развиваться, самовоспроизводиться, то есть вести себя как биологический объект. Успех зависел от того, насколько правильно построена система отношений, как распределены финансовые потоки.

Можно придумать экономические аналогии? Была ли в России реализована подобная система?

Удачные примеры можно найти в сфере массового обслуживания: сеть бензоколонок часто делается на принципах франчайзинга. Каждая бензоколонка принадлежит своему владельцу, но ведро, шапка и то, как он заливает бензин, выглядят стандартно. Вся технология сервиса и все формы отчетности идут от центральной фирмы.

В случае компьютерной сети модель получается даже более естественной, потому что если бензоколонки в разных концах страны связывает лишь внешняя атрибутика, то здесь у нас общая математическая и аппаратная платформа, мы активно общаемся по сети, связаны общей инфраструктурой каналов и т.д.

Так что произошло? Оказалось, что эта модель нежизнеспособна у нас?

Я бы так не сказал. Успешно работает Макдональдс, эту модель использует программная фирма "1С", франчайзинговые сети строят "Интурист", "Аэрофлот".

Просто в России была сделана ставка на переход к коннект-провайдерству: "Я сижу здесь, у меня торчит модемный пул и толстый канал, тащите ко мне кабель, я беру столько-то".

Почему произошла смена концепции? Сыграл ли какую-то роль приход dialup-подключения на смену электронной почте по UUCP?

Нет, произошла она совсем по другим причинам. Начался процесс приватизации, в частности, путем образования акционерных компаний. Типичный случай -- АО "Релком". В данном случае деньги "Ринако" складывались с ноу-хау программистов и с имуществом Курчатовского института. Из всего этого рождалась акционерная компания. Шла приватизация фирм, имеющих "слишком много" владельцев. При большой конторе появлялась контора помельче, которая брала ее финансовые потоки на себя. Так доходили либо до одного владельца, либо до узкой группы владельцев. Как правило, это сопровождалось появлением знака "плюс" в названии. "Фирма такая-то плюс" -- это означало, что прошел процесс сокращения части собственников. Всем было не до строительства глобальных сетей, шел процесс первоначального накопления личных капиталов. Для этих условий идея франчайзинговой сети была слишком сложна и, кроме того, требовала среднесрочных инвестиций. Вряд ли можно было получить существенные деньги с провайдеров, которые только родились и сами пытались хоть как-то выжить. В то время, когда продажа колготок давала сумасшедшую прибыль, два оборота в три недели, такие виды бизнеса успехом не пользовались. Страна играла в "короткие деньги".

Если бы все так и развивалось путем единой сети, могла бы возникнуть ситуация, когда бы мы "обгоняли Америку"?

Безусловно! Нужно только правильно формализовать правила нашего "забега". Мы же то и дело обгоняем Штаты, то по количеству бирж, то по количеству банков.

А если серьезно -- подари американцы свою компьютерную сеть нам, она оказалась бы невостребованной: студентов у нас в несколько раз меньше, деловая жизнь потише...

Что мешает идее франчайзинга интернет-услуг возродиться сегодня?

Недостает только толкового инвестора. Ситуация на рынке ISP более чем благоприятная. Своих ресурсов у провайдеров слишком мало, а монстр, готовый разом скупить российскую инфраструктуру, еще не появился.

Что произошло с Вами дальше? Как Вы оказались в "Национальной службе новостей"?

Дальше я интересовался только проблемами повышения содержательной ценности сети. По контенту нужно было очень много работать, и тема была довольно интересная. Она, кстати, и сейчас интересная. Если смотреть с высоты птичьего полета, то есть носители знаний и те, кому они нужны. Неважно, знает ли человек что-то про рыбок, или про спелеологию, или он -- специалист в какой-то узкой области, -- наверняка кому-то в мире его советы нужны, если это специалист. Но получить за это деньги он не может, потому что потенциальных потребителей такой информации слишком мало, и нет механизма, который позволял бы продать эти советы. Хотелось бы построить систему отношений и взаиморасчетов, которая, используя возможности сети, позволяла бы это делать.

А как же общепринятая идея, что производство контента будет окупаться с рекламы? Насколько она соответствует той модели, о которой Вы говорите?

Дело в том, что на сегодня у нас нет другого выхода, потому что система оплаты автору отсутствует. Поэтому получается, что специалист занимается своим делом, но деньги получает за рекламу, которую он вешает на своем столбе, если к нему почему-то часто ходят. Неважно, чем он занимается: показывает фокусы на улице или поет в переходах под гитару. Я могу пытаться собирать деньги за свою услугу, а могу сказать: "Знаете, мимо меня много народу проходит, давайте я буду заодно рекламировать ваши сосиски". Затраты на информационные исследования, на анализ, на все то, что называется нематериальным производством, -- они же бешеные. А материальное производство должно прокормить не только себя, но еще и этот рынок, потому что мы не можем сделать его платным. Я не сторонник этой модели.

И что же может произойти? Известна идея, что никто не готов платить за информацию, а платить за услугу готовы.

Как платить за информацию, я тоже не знаю. Это информация как численное значение снижения меры неопределенности, да? Очевидно, у вас сначала должна быть неопределенность, а потом я вам ее снижаю как-то, и вы получаете информацию в соответствующем объеме. Это объявлено товаром. Причем военные знают, что самый простой способ загасить противника -- не пытаться уничтожить все его источники вещания, а добавить туда свою информацию. Так глушились в свое время "Радио Свобода" и "Голос Америки" -- сверху накладывалось радио "Маяк". Человек получал больше "товара".

Речь идет об услугах. Меня интересует данный рынок, и мне кто-то делает услугу по его изучению. Я не могу сам бегать, искать, собирать цифры и факты, оценивать обстановку и записывать цены. Кто-то это сделает вместо меня, и вот это -- информационная услуга. Сколько стоит сама информация? Кому как: для кого-то она бесценна, но для большинства населения просто никакого интереса не представляет.

Когда, наконец, будут платить за информацию? -- А как за нее платить? Как ее оценивать? Ведь книжный магазин продает не тексты Пушкина, а материальные носители. И законы об авторском праве защищают материальные носители.

Идеологически все это вообще не простроено никак: в любом случае, непонятен объект продажи. Предположим, объектом является информационная услуга. Тогда возникает вопрос: а как мне найти такого человека, который может мне ее оказать? Как убедиться в том, что данный поставщик услуги (человек или организация) действительно сделает это на достаточном уровне? Я должен верить в то, что он дает. Можно заказать исследования в 25 местах и нанять еще исследователей, чтобы они сравнили и сказали, какое из 25 правильней. Опять же, это не решение вопроса: даже если мы это выяснили, то как расплатиться с поставщиком?

Причем речь идет, как правило, об очень маленьких суммах. Хорошо, когда мне написали великолепный роман, я его оплатил и прочел с восторгом. Обеспечил, так сказать, автора до пенсии. Так не бывает, автор собирает деньги по копейкам. Если довести их до него, то эта деятельность будет выгодна. Может, он будет меньше грузить дрова и больше писать романы... Но этот канал у нас не создан. Понятно, что любые подвижки на этом рынке серьезно активизируют и меняют среду. И потенциал там громаднейший -- даже чисто географически. Сеть принципиально меняет очень многое: скажем, живет человек в небольшом городе, великолепно разбирается в чем-то, но его услуга нужна в этом городе, к сожалению, только троим. Они не в силах его прокормить, потому что это у них не главное в жизни. А в соседнем городе вообще нет такого специалиста. Осталось только перевести эти финансовые потоки на него и загрузить его, не заставлять искать другую работу. Это интересно.

И как это решается? Насколько удалось добиться каких-то результатов?

Мы сейчас пытаемся это делать. В частности, в этом направлении работает проект "Национальная электронная библиотека". Не знаю, насколько удачно его название, но цель именно такая.

Мы построили самый крупный в мире массив русскоязычных изданий. Мы заключаем договоры со СМИ, у нас есть система расчетов, и если пользователь берет материалы, владельцу авторских или смежных прав автоматически начисляются деньги.

То, что мы пытаемся сейчас делать, -- это как раз схема, которая позволяет довести деньги до создателя данного текста. Почему так, а не иначе? Интернет -- это все-таки система коммуникаций, сеть, которая позволяет получать доступ к любой информации, к информационным услугам, к контенту. Откуда брать контент? Существуют громадные упорядоченные пласты: архивы, пресса. Мы хотели бы ввести всех пишущих, независимо от того, интернетовские они писатели или нет, в Интернет, сделать их доступными. Причем на таких финансовых условиях, при которых они что-то получают. Тогда это очень интересно и можно получить интересный результат.

В электронной библиотеке только пресса?

Там есть законодательство и издания, которые трудно признать прессой, вроде работ аналитических центров. Общая схема такова, что теоретически автор может отдать любой свой материал, заключив соглашение о royalty и не будучи ни газетой, ни журналом, ни изданием. Вдруг материал будет жутко популярен. Такое бывает.

Какова технология отбора информации?

Есть два пути. Первый -- берем все. Причем если статья берется, то целиком, т. е. не может быть купирования, цитирования, если в ней есть хоть что-то достойное. Если не берется, то не берется по формальным признакам. Формальные признаки на старте НЭБ были такие: минус культура, шоу-бизнес, спорт. И не потому, что нам эти темы не нравились, а потому, что начало деятельности НЭБ пришлось на предвыборные кампании и эта информация оказалась менее востребованной. Возможно, через несколько месяцев у нас были бы другие приоритеты. Тем не менее некоторой специализированной службы, которая определяет ценность информации для складирования, у нас нет.

А как организовать выборку? Допустим, вы стали собирать всю информацию, какую возможно, и получилось, как в Интернете, -- поисковая машина находит слишком много релевантных документов.

Тут есть две известных беды. Первая -- не получить нужное. Вторая -- зарыться во всем остальном. Это -- проблема любой библиотеки. То, чем занимается НЭБ внутри -- это как раз решение этих задач, создание механизма поиска, который позволяет не получать море хлама, а приемлемый результат.

Такая технология, будучи разработана, могла бы применяться и к открытому Интернету?

Это очень большая и очень интересная тема. Допустим, у нас есть исходный пласт информации, срез. Скажем, это информация прессы. Мы можем искать, и если я точно знаю, что ищу, и владею достаточно сложными технологиями или методами поиска, то понимаю: сюда ходить, сюда не ходить, надо зацепить такие-то ключевые фразы. Эксперт может получить таким образом хорошие результаты, потому что у него в голове есть дополнительная субъективная (неформализуемая) информация.

Отдельно возникает проблема достоверности. Информация в этом срезе объективна для нас -- по крайней мере, объективен факт ее появления. Газета такая-то действительно напечатала эту статью тогда-то. Это достоверность соответствия источнику. Может быть, статья была абсолютно идиотская и никакого отношения к жизни не имела -- это не наше дело. Мы просто знаем, что факт публикации был. И на основании этого начинаем строить различные метапоисковые системы.

Мы пытаемся построить модель информационного мира, систему связей, переходим к технологиям типа Netmap, к системам поиска связей. Есть такой великолепный продукт -- Netmap, созданный для удовлетворения нужд разведсообществ. Берется некоторый информационный массив, и программа начинает строить графы и показывать, что нашла такие-то связи между тем-то и тем-то. Далее редактор вносит свои субъективные знания, говоря, что эти связи мне нужны, а те -- нет.

Например, есть группа людей, которые упоминались в прессе или в каких-то учетных данных, и программой строится модель их взаимоотношений. Выясняется связь номер 1: они учились в общей школе, т.е. в одной и той же, или все кончили среднюю школу. "Мне не интересно, убираем", -- сообщает программе эксперт. Они учились в одном институте -- и опять происходит выбор: интересно или не интересно. Они живут рядом, они работают на одних фирмах, работали или работают сейчас. Посредством указания существенных связей выделяется кластер из этой группы людей.

Например, если иллюстрировать это ближе к библиотеке, то вот простейший вопрос: есть финансово-промышленная группа. Что понимается под группой? Если кластеризовать предпринимательские структуры, то можно это понятие сделать определенным. Мы говорим -- "вот МЕНАТЕП". А что значит МЕНАТЕП? МЕНАТЕП -- это "Роспром" и еще море контор, которые лежат под "Роспромом", и еще море их дочерних предприятий. Понятно. Чтобы перейти в термины финансовой группы, нужно выстроить эти связи.

Обязательно нужен квалифицированный эксперт, который понимает, что делает?

Никто не знает, что тут обязательно, -- просто на сегодня это работает вот так. А как повернется Интернет через некоторое время? Это лишь один из методов поиска информации. Я ищу вот это, я пытаюсь на базе каких-то гипотез кластеризовать информацию, пытаюсь докластеризоваться до такого состояния, чтобы получить данные, которые мне нужны. Может быть, в будущем интерфейс поисковых машин будет устроен так же.

Насколько применяются технологии структуризации языка? Скажем, есть две крайности -- строго упорядоченная таблица и свободный текст. Голова разбирает текст в некоторую структуру. Задача состоит в том, чтобы создать программу, которая будет разбирать этот текст не хуже, чем голова. Превращать не в таблицу, но тоже в некоторый структурированный вид. Есть ли такие технологии?

Наши попытки не были настолько глобальными. Но вопросами языка мы интересовались. Естественно, НЭБ -- это более миллиарда слов, достаточно крупный массив. Конечно, на этой основе были изыскания -- а как вообще ведет себя язык, как он изменяется, что с ним происходит. У нас целенаправленно проводились такие работы. В принципе, раньше таких исследований было сделано крайне мало по причине отсутствия больших выборок. Теперь нами получены очень интересные результаты.

Поговорим о перспективах. Так что же будет с контентом?

Сейчас идет смещение интереса в сторону реального контента. Люди хотят не ссылку на погоду, а погоду. Не ссылку на программу телевидения, а программу. Постепенно теряют актуальность серверы, которые представляют весь Интернет.

Но такую систему нужно саму по себе сначала найти.

Все как-то обустраиваются в жизни. Вы же не идете в аптеку, чтобы попасть в прачечную? Хотя там наверняка знают, где находится прачечная. В состоянии взрывного роста была построена среда, где никто ничего не знает. В жизни вы, обустроившись, уже знаете, где булочная, где прачечная. Сами становитесь носителем этой географии. И сейчас это происходит в Интернете. Я не говорю, что системы, которые собирают ссылки и дают справки, исчезают вообще. Серверы общего типа были главными, когда со взрывом Интернета появилось такое количество новых пользователей без знания "географии", что эта услуга стала на какой-то период очень важной.

Предполагая, что область Ваших сегодняшних занятий -- это то, где будет горячо завтра для всех, было бы очень интересно узнать, насколько долго для Вас будет актуален проект электронной библиотеки и какие новые темы появляются. В какой области лежат сейчас Ваши личные интересы?

Очень любопытны результаты изучения языка. Например, если мы ведем какую-нибудь PR-кампанию или какую-нибудь рекламную кампанию (неважно, политических или реальных товаров), то так или иначе эта деятельность опосредованно смещает частотность языка. По частоте употребления в прессе тех или иных слов сразу становится видно, где проводится PR-кампания. Видно, насколько она успешна, как она распространяется. Появляется возможность наблюдения за языком общества как за отдельным явлением.

У нас в базе есть региональная пресса, и поэтому можно проводить географический анализ. Скажем, если я в некоторую газету в Москве выдаю некоторую мысль, она может быть перепечатана или не перепечатана, подхвачена или не подхвачена. Разные типы идей имеют свои каналы. Даже с позиции рекламного рынка получается, что если есть такая кластеризация средств массовой информации в стране, то некоторый материал лучше всего давать сюда, потому что он отзовется там-то, там-то и там-то и будет иметь такое-то распространение. Это попытка представить информационные каналы общества, которые мы себе создали. Это интересно для изучения политической ситуации, для изучения ситуации на рекламном рынке. Да и просто интересно.

Например, как отразился кризис 17 августа. Народ начал готовиться, хотя бы мысленно, к войне, закупал мыло, соль и спички. Произошел резкий взлет частоты использования этих слов после 17 августа, причем в Москве больше интересовались спичками, в Питере мылом, а регионах -- солью. Или вот основная российская проблема: дураки -- дороги. Оказывается, Москву больше интересуют дураки, а регионы -- дороги.

Это не аналитика, а просто попытка простроить индикаторы. Серьезная проблема -- устойчивость результатов. Можно быстро построить любой график, а вот насколько он отражает жизнь -- отвечать приходится довольно долго. Это очень интересная тема.


В оглавление номера This page is an archived copy on Gagin.ru personal site