This page is an archived copy on Gagin.ru personal site



3Internet -- ежемесячное приложение к сети
АрхивРеклама в журналеКнига отзывов
SearchВыходные данныеОбратная связь



Технология



"Кто ищет, тот всегда найдет?"


Бьерн ОЛСТРЕМ
bjorn.allstrom@usa.net

"...а он все читал и читал,
и мало-помалу его начал
побирать черт".

Станислав Лем (из похождений звездных конструкторов Трурля и Клапауциуса)

Для тех, кто не помнит или не читал старика Лема -- в одном из своих путешествий Трурль и Клапауциус наткнулись на космического разбойника особого рода -- разбойник этот был информационным грабителем, причем не особо разборчивым -- ему годилась любая информация, лишь бы она была истинной. Не долго думая, Трурль нашел в логове разбойника бочонок с воздухом, проделал в нем дырочку и посадил в нее демона, наподобие максвелловского. Этот демон извлекал информацию из движения молекул воздуха в бочонке и записывал на телеграфную ленту алмазным перышком.

Радостный разбойник начал жадно поглощать море истинной, но абсолютно бесполезной информации и, похоже, закончил свои дни погребенным под тоннами телеграфной ленты (или рехнулся, что, впрочем, почти то же самое).

Эта история вспомнилась мне не далее как месяц назад, когда с помощью лопаты и "Альтависты" я перерывал горы сетевой информации, пытаясь найти хоть какое-нибудь описание обряда венчания в греческой церкви. Как несложно догадаться, я получил тысячи ссылок на сотни сайтов, посвященных чему угодно -- от греческой мифологии до "греческой любви", но совсем не то, что мне нужно.

Огромные системы поиска, похоже, уже достигли предела своих возможностей. Не в том, что касается объема индексируемых веб-страниц, а в возможности предоставить пользователю информацию, не требующую дополнительной "ручной" обработки. Совсем неожиданно абстрактное прежде понятие информационного шума обрело конкретное значение -- сотни и тысячи ссылок, не имеющих отношения к предмету поиска, однако выданных "Альтавистой", "Лайкосом" и прочими сетевыми "демонами", готовыми добросовестно завалить нас горами абсолютно ненужной информации. Миллионы затопивших Сеть домашних страничек американских домохозяек с картинками любимых кошечек стали настоящим песком, в котором вязнут колеса крупных поисковых систем.

Нынешнее положение дел среди сетевых "искалок" сильно напоминает мне архитектуру ранних IBM PC, которая, будучи революционной для своего времени, надолго осталась настоящим "бутылочным горлышком". А ведь сбор информации -- это еще не все. Более половины сетевых ресурсов уже содержатся не на английском языке, и, несмотря на все потуги крупных "искалок" достойно обрабатывать русские, испанские, французские, макассарские -- да какие угодно неанглоязычные страницы, проблемы синтаксиса и лексики, а также близости "искалки" к ресурсам, которые собирает ее робот, сводят на нет все усилия по их обработке.

Так где же спасение? Давайте вспомним, как развивалась архитектура персональных компьютеров с явления IBM PC народу. Сначала обработка практически всей информации была положена на центральный процессор, а контроллеры периферии были чрезвычайно просты. Потом появились более умные контроллеры, а сейчас не редкость периферийные платы со своими собственными процессорами. Сделано это было для того, чтобы, сняв часть нагрузки с ЦПУ, поднять качество и скорость обработки данных.

Вот тут-то и всплывает реальная альтернатива заморским джаггернаутам. Практически в каждой стране и в каждой языковой зоне имеется локальная (и, чаще всего, любимая местными пользователями) система поиска. В России это "Рамблер" (www.rambler.ru), в Чехии -- "Сезнам" (www.seznam.cz) в Венесуэле -- www.auyantepui.com и так далее. Будучи написанными местными авторами, которые хорошо знают не только свой родной язык, но и структуру и особенности сети, которую они индексируют, эти системы поиска дают более качественную и свободную от шума информацию. Кроме того, они в состоянии более полно индексировать веб-страницы, потому что объем локальной информации меньше и соответственно выше качество поиска информации.

Однако кто из нас знает, какой локальной "искалкой" пользуются в Сингапуре и какой в Исландии, и должен ли нормальный пользователь вообще об этом что-нибудь знать? Видимо, настала наконец пора пойти по пути разработчиков "железа" и заняться параллельной обработкой данных. Сбор информации должен быть локальным, а поиск -- глобальным, и сделать это совсем несложно. Система поиска, объединяющая ресурсы сотен локальных "искалок" во всех частях света, -- вот что спасет Сеть от доминирования альтавист и инфосиков. Будучи интерфейсом сразу ко всем местным и национальным системам поиска, она даст пользователю возможность не задумываться, как и на каком языке сделаны локальные "искалки". Достаточно будет выбрать страну и язык поиска. Предположим, мне нужна информация о долгоносиках в Южной Америке и Польше. Отметив, что поиск должен быть произведен по локальным "искалкам" Бразилии, Аргентины (или всего региона) и Польши, пользователь напишет слово "долгоносик" на своем (любом) языке. Интерфейс переведет это слово на испанский и польский и запустит параллельный поиск по "искалкам" всех указанных стран, с учетом синтаксиса обращения к каждой конкретной "искалке".

Все просто, вопрос только в том, кто и когда это осуществит.



3 FAQСледующий материалКнига отзывов
К оглавлениюПредыдущий материалОбратная связь

Журнал "Интернет". Регистрационное свидетельство Госкомпечати РФ N. 016370 от 16.07.1997 г. Распространяется через сети розничной торговли, через компьютерные сети, а также путем подписки. Мнение редакции по тем или иным вопросам может не всегда совпадать с мнениями авторов. Редакция не несет ответственности за содержание рекламных материалов. Перепечтка или копирование запрещены, при цитировании ссылка на журнал "Интернет" обязательна.
Copyright © 1997-1998 Журнал "Internet"
Copyright © 1997-1998 Netskate
Netskate E-mail: imag@netskate.ru
Телефон: 245-45-84