This page is an archived copy on Gagin.ru personal site



1Internet - ежемесячное приложение к сети
АрхивРеклама в журналеКнига отзывов
SearchВыходные данныеОбратная связь



Тема



Сам себе Sony Music


Соло для дисковода со скрипом

Максим ТИГУЛЕВ
makst@uc.ru
паранойя - Иван ПТИЦЫН
birdman@paranoia.ru

Максим Тигулев. В сеть попал примерно 2 года назад, но сумел остаться в реальном мире. Считает, что Интернет - это всего лишь важный источник информации, а не предмет культа, поэтому относиться к нему надо, как к радио или телевидению с гораздо более широкими возможностями и глубокой обратной связью с пользователем.

Музыку любят все. Если не все, то очень многие. Компьютерщики не исключение. С тех пор, как появилась первая ЭВМ, они пытались извлечь звуки из всех ее устройств: из встроенного динамика (в просторечии - бипера) и из параллельного порта - с помощью нехитрого устройства под названием Covox. Эта штука представляла собой восьмибитный цифроаналоговый преобразователь (проще говоря, плату с 8 резисторами R-2R и несколькими проводами) и втыкалась в параллельный порт. Еще во времена AT 286 она очень неплохо играла всяческие STM и MOD файлы и с помощью специального драйвера воспроизводила шум выстрелов и хлопанье дверей в первой трехмерной игре Wolfenstein. Некоторые компьютерные фрики пытались извлечь звуки из дисковода для гибких дисков - программа discomus действительно что-то играет хриплым "голосом" дисковода и под ритмичное пощелкивание динамика фальшиво насвистывает песенку про чижика-пыжика. Если не верите, посетите коллекцию программ www.mbt.ru/~sidor/arbat/ и возьмите discomus в разделе DOS.

Как только появились звуковые карты, позволяющие воспроизводить и записывать оцифрованный голос и музыку, звука стало намного больше. Теперь не только специалист, но и каждый "конечный пользователь" мог записать свой собственный голос в компьютер, изменить его до неузнаваемости и предъявить всем желающим. Вскоре на массовом рынке появились и CD-ROM приводы, которые (сперва только теоретически) могли считывать аудиоданные в память компьютера. Использовать компьютер в качестве цифрового магнитофона и переписывать с его помощью любимые мелодии - желание вполне естественное. В свое время мне тоже захотелось попробовать: я пошел к другу в гости, захватив с собой жесткий диск (своего CD-ROM у меня тогда не было), и попросил скопировать трехминутную песенку с компакт-диска. Все получилось замечательно, только объем конечного файла оказался огромен: тридцать с лишним мегабайт (при качестве аудиоCD: 44 кГц, 16 бит, стерео). У меня немедленно возник вопрос: как уменьшить размеры файла, не ухудшая качество звучания (то есть сохранить те же параметры оцифровки), чтобы при этом его можно было воспроизводить, распаковывая "на лету". Имеющиеся форматы сжатия, например, PCM от Creative Labs (создателей Sound Blaster) или формат Microsoft ADPCM давали только четырехкратную степень сжатия (без потерь), то есть вышеупомянутая песенка умещалась в восемь мегабайт. Слишком много для быстрого копирования на гибкие диски или передачи по Сети.

Недавно мне подарили обычный 100 Мб диск (Iomega ZIP), на котором были записаны три полных альбома Chemical Brothers. На диске находились файлы весьма небольшого размера (единицы мегабайт) с расширением .mp3 и проигрыватель WinAmp. Запустив его, я услышал знакомые мелодии с качеством, на мой непрофессиональный слух не отличавшимся от компакт-диска. Тут я вспомнил, как пару лет назад, делая первые шаги по Сети, наткнулся на музыку, сжатую по алгоритму MPEG в файлы с расширением .mp2 сравнительно малого размера, но не очень высокого качества звучания.

Никто подвоха не услышит
С тех пор многое изменилось. Moving Picture Experts Group (drogo.cselt.stet.it/mpeg/) разработала метод под названием MPEG1 Layer 3 (коротко MP3), который теперь является стандартом для кодирования звуковых потоков. Он позволяет получить десяти- двенадцатикратное сжатие звука с сохранением технических параметров звука компакт-диска. Столь высокая компрессия невозможна без формальных потерь данных, но искажения вносятся так, что ухо человека их не должно замечать - такой метод называется perceptual audio coding: кодирование, основанное на восприятии. Впрочем, даже такое сильное сжатие не решает всех проблем: MP3-дорожки максимального качества не удается транслировать по Сети обычным пользователям. Если же аудио надо упаковать сильнее, то можно выбрать приемлемый уровень "даунсэмплинга" (загрубления) звука из набора стандартных, которые для удобства сравнивают со звучанием УКВ радиостанции, СВ радио или телефонной связи (в последнем случае степень сжатия достигнет 96 раз).

Весьма необычным для компьютерной индустрии способом разработчики оценивали работу кодера MP3. Так как за основу оценки качества упаковки было принято восприятие звука человеком, реальная эффективность метода не поддавалась количественной оценке. Оцифрованный звук, идеальный с точки зрения отношения сигнал/шум, уровня нелинейных искажений, коэффициента гармоник и прочих математических характеристик, может казаться слушателю раздражающим и искаженным. Поэтому при подготовке стандартизации алгоритма проводились дорогостоящие "субъективные" тесты, на которых профессиональные тренированные слушатели оценивали по пятибальной шкале качество звучания.

Выступая в роли слушателя и оценщика, я не заметил отличий от оригинала на компакт-диске. А как оценит результаты специалист? За советом я обратился к эксперту по high-end аппаратуре Игорю Прохорову. Прослушав ряд образцов, он сделал заключение, что звук, упакованный по алгоритму MP3, отличается от оригинальной дорожки очень незначительно, давая ощущение смазанных высоких частот, к которому ухо быстро привыкает. Такое искажение наиболее заметно при прослушивании полифонических джазовых композиций. А если сжимается оцифрованная речь или поп-музыка, то слышимые искажения вообще отсутствуют.

Созданный алгоритм совершил переворот в своей области. Он позволяет получить практически любую степень сжатия, обладает поточностью (streamability), то есть звук можно передавать по Сети и слушать по ходу получения (для широкой полосы - с высоким качеством, для узкой - похуже). Можно также воспроизводить запись с любого места, например, можно в любой момент включиться в поток, передаваемый сетевой "радиостанцией".

рис. 1

Модели граммофонов
Формат MP3 успел завоевать популярность не только у фирм, связанных с звукозаписью и презентациями, но и у "неприсоединившейся" публики. В Сети можно найти множество страниц, на которых выложены целые альбомы известных исполнителей (разумеется, с нарушением авторских прав), которые можно свободно переписать на свой компьютер и слушать. Есть даже поисковые механизмы, которым в качестве ключевого слова можно дать имя артиста или название песни, и в ответ они укажут где их взять - в формате MP3, разумеется. Эти адреса каждый может найти самостоятельно, допросив любимую искалку.

Сразу предупреждаю, что для воспроизведения файлов с CD-качеством (44 кГц, 16 бит, стерео) необходим процессор не хуже Pentium 100. На "четверке", увы, без искажений можно слушать только сигнал с вдвое меньшей частотой дискретизации (22 кГц), да еще и моно - иначе воспроизведение "съест" все ресурсы процессора.

Среди программ для прослушивания MP3 особо выделяется WinAmp от Nullsoft - размер его архива всего 245 кб, и распространяется он совершенно бесплатно с сайта www.nullsoft.com/amp/ [рис. 1]. Приятнейший, хотя и несколько непривычный "био" интерфейс [таб. 2] и, как следствие, удобное управление, богатые возможности настройки, поддержка списка дорожек (Playlist), анализатор частотного спектра (иногда называемый графическим эквалайзером) и правильная интеграция с броузером (на манер Real Player) делают его почти идеальным "источником сигнала". Для медленных процессоров он позволяет вдвое снизить частоту дискретизации и преобразовать стерео в моно. К Win Amp'у есть даже собственные plugin'ы: для визуализации (скажем, в виде динамичной кислотной улыбочки [рис. 2, 3]) и для обработки звука (например, удаления голоса).

рис. 2

Гораздо менее красив и функционален Winplay3, он не поддерживает Playlist, и у него заметно меньше настроек. Но если очень хочется, взять его можно вот здесь: ftp.iis.fhg.de/pub/layer3wp32v23b5.exe (размер дистрибутива 1Мб, причем большую часть занимает "упаковка").

Из программ для DOS наиболее заметен DosAmp от тех же Nullsoft, который хоть и не так эффектно выглядит (текстовый режим), но так же, как и его старший брат, позволяет снизить вдвое частоту дискретизации, преобразовать стерео в моно и проигрывать файлы прямо из командной строки. У него есть довольно занятная функция - измеритель использования ресурсов процессора. Отсюда я узнал, что Pentium 133 тратит около 27% ресурсов при воспроизведении полноценного звука, а 486 процессор задыхается даже при половинной частоте дискретизации в монофоническом режиме (87% ресурсов).

Консервируем звук сами
Переходим к практической части - изготовлению файлов MP3. Обычно в качестве источника используют дорожки компакт-дисков, вытягивая аудиоданные с помощью специальной программы. Она записывает цифровое представление звука в файл формата .wav, минуя звуковую карту, - только так можно получить "чистый" цифровой звук, без тех искажений, которые обязательно внесет преобразование цифра-аналог-цифра. Далее полученный файл обрабатывает программа-кодировщик и записывает в формате MP3.

рис. 3

В ходе тестов я отобрал несколько программ, пригодных для самостоятельного изготовления высококачественных звуковых файлов. Начнем с получения цифровых копий треков. С этим может справиться программа CDDA. Она работает под DOS, не против сессии Windows 95, управляется из командной строки и очень удобна для пакетной обработки дисков. Взять ее можно по адресу: ftp.simtel.net/pub/simtelnet/msdos/cdrom/da2wav17.zip (99 кб). Если по каким-то причинам эта ссылка не будет работать, можете воспользоваться системой поиска файлов www.filez.com, сообщив ей имя архива da2wav17.zip.

Для запуска программы следует набрать в командной строке следующее: cdda.exe /t N /f trackN.wav /o /w /m , где N - номер дорожки, /f указывает имя файла, /o игнорирует бит защиты от копирования (помните, что в этот момент вы совершаете нарушение авторских прав), /w устанавливает формат записи WAV, /m заставляет программу использовать функции драйвера mscdex. По умолчанию программа поддерживает режим коррекции дрожания (jitter correction), что позволяет исправить ошибки, возникающие при чтении некачественных или заезженных дисков.

Для Windows 95 также есть программа под названием WinDAC, которая находится по адресу: members.aol.com/schmelnik/wdac133.zip (287 кб). Она условно бесплатная (shareware), но никогда не просит денег и работает, выполняя свою прямую задачу. Программа имеет три режима чтения, перебирая которые, можно добиться безошибочного чтения на разных дисководах. [таб. 1]


Таблица 1.
Способностью записывать цифровые копии дорожек обладают не все модели приводов CD-ROM (например Aztech этого не умеет), хотя большинство современных моделей допускают такую возможность. Интересно было попробовать, как ведут себя разные дисководы при чтении и как с ними взаимодействуют перечисленные выше программы. Я протестировал несколько образцов в разных сочетаниях. В качестве контрольной была взята дорожка длительностью 3 минуты 32 секунды. Как и можно было предположить, каждый дисковод (интерфейс IDE) проявил себя по-разному, порой весьма неожиданным образом. Pioneer DR-A24X (24х) одинаково ровно вел себя со всеми программами и во всех режимах, затратив на чтение дорожки чуть больше минуты. Samsung SCR-2030 (20х) был необычайно скор и заслуживает всяческих похвал, как по качеству чтения, так и по скорости - ему потребовалось лишь около 30 секунд. Когда очередь дошла до NEC CDR 1450A (8х), вместе с WinDAC он стал читать медленно и с ошибками. Программа CDDA при работе с ним вообще отказалась дочитать дорожку в режиме коррекции дрожания до конца, мотивируя это тем, что ошибок на диске слишком много, чтобы их исправить. Привод Mitsumi FX810T4 (8х) вместе с WinDAC чуть было не догнал нашего лидера по скорости, но прочитать дорожку полностью сумел только с пятого раза, выдавая в разных местах сообщения об ошибках выполнения ASPI команд. При работе под DOS, вместе с CDDA, на чтение он затратил больше четырех минут. Можно сделать вывод, что никаких отчетливых закономерностей не наблюдается, скорость и качество чтения сильно зависят от устройства самого привода и на других дисководах могут получиться совсем другие цифры, поэтому производительность (особенно при копировании всего диска) будет меняться в очень широких пределах.

Перейдем к кодированию по MP3.

Наиболее распространена программа l3enc, работающая под DOS. Работа из командной строки делает ее исключительно удобной для пакетной обработки. Находится она по адресу: ftp.iis.fhg.de/pub/layer3/l3v271d1.zip (318 кб). Для запуска наберите в командной строке: l3enc.exe infile.wav outfile.mp3 -br 128000 -hq. Здесь infile и outfile - имена входного и выходного файлов, ключ -br 128000 определяет качество звукового потока (это значение рекомендуется для получения наилучшего качества при наибольшем сжатии), ключ -hq устанавливает режим высокого качества кодирования (это займет больше времени, но того стоит).

Другая программа работает под Windows 95 или NT, называется она MPEG Producer. За время подготовки статьи она исчезла с сервера разработчиков, поэтому выкладываю свой экземпляр. Он будет ждать вас здесь: ftp://lgm.uc.ru/incoming/maks/mp3/l3prod.zip.

Программа имеет понятный графический интерфейс, и работа с ней не нуждается в особых пояснениях.

Процесс кодирования по MPEG требует больших вычислительных ресурсов и идет достаточно долго. Соответственно, чем мощнее у вас процессор, тем меньше времени вы потратите на сжатие. Так, например, наша тестовая дорожка (WAV файл объемом 37 Мб) на процессоре Pentium 133 была сжата программой l3enc под DOS до размера 3,5 Мб за 24 минуты. MPEG Producer'у на это потребовалось 14 минут. А когда он был запущен на машине с двумя Pentium Pro 200, работающими под управлением Windows NT, он справился с упаковкой всего за 5 минут 48 секунд. Так что вторая программа работает явно быстрее, хотя не поддерживает пакетную обработку. Однако процесс может быть ускорен одновременным запуском нескольких экземпляров программы.

Таблица 2.
Волшебные слова MIME

Чтобы выдавать потоком с сервера mp3-дорожки, недостаточно знать, как этот механизм был организован в RealAudio, - необходимо еще усвоить правильные слова MIME. Ссылку в гипертексте нужно давать на файлы с расширением .m3u, с серверной стороны прописывать их как, MIME-тип audio/x-mpegurl (тут есть некоторая двусмысленность - Nullsoft в документации утверждает, что прописывать надо audio/mpeg-url, но работает и так). Внутри такого файла следует написать обычный URL, указывающий уже собственно на файл MP3 (или несколько ссылок, каждая на отдельной строке, тогда получится playlist). Расширение .mp3 с серверной стороны прописывается, как MIME-тип audio/x-mpeg3 (Nullsoft, опять же, предлагает audio/mpeg). Вот и вся наука.

Домашнее аудиопиратство
То, чего так долго ждали футуристы, адепты киберпанка и прочие подпольщики, наконец произошло. Появился простой и дешевый способ массового попрания авторских прав, причем не только прав производителей программ, но и звукозаписывающих компаний. Связано это с резким падением цен на устройства для записи CD и матрицы компакт-дисков. Сравните: всего полтора года назад средний CD-рекордер стоил несколько тысяч долларов, теперь он доступен за четыре сотни. Мелкооптовая стоимость матриц (зачем мелочиться?) теперь не превышает и двух долларов.

Сегодня вполне реально записывать свои собственные компакт-диски. Впрочем, можно предположить, что музыку скорее слушают, чем сочиняют, то есть большинство обладателей CD-рекордеров будет копировать "фирменные" CD. Имейте в виду, что любое несанкционированное копирование аудиоданных, защищенных копирайтом, противозаконно.

Файлы МР3, которых в Сети очень много (хотя в основном растиражирован мейнстрим не первой свежести), можно также записать на компакт-диск, но для их прослушивания нужен специальный проигрыватель и компьютер.

Если же вы хотите получить обычный CD для своего Discman, то просто распакуйте MР3 назад в WAV-файл, а затем запишите на компакт-диск в виде обычных звуковых дорожек.

Таблица 3.
"Мы ненавидели стандартные типы окон, встроенные в Windows. Нам нужно было что-то компактное и стильное, что умело бы все, положенное плейеру, в минимальном пространстве", - Thomas Pepper, один из разработчиков WinAmp.

На сайте WinAmp'а написано "The new standard for Internet Audio". Мы поинтересовались - а каковы отношения Nullsoft'a с компанией Progressive Networks, владельцем технологии RealAudio? "Сейчас никаких, хотя мы можем когда-нибудь просто включить декодер RealAudio в ядро WinAmp".

Что нужно начинающему СD-писателю? Привод CD-R, несколько болванок и подходящая программа для вашей операционной системы. Сегодня лучше использовать SCSI-устройства, хотя есть и модели с интерфейсом IDE. Существует два метода записи CD - с созданием "образа диска" на винчестере и с прямым переписыванием файлов. Второй метод несомненно прогрессивнее, поскольку не требует резервирования сотен мегабайт твердого диска, но ошибки записи (с последующим выбрасыванием болванки в мусорную корзину) в этом случае будут случаться чаще. Среди программ, использующих "образ диска", наиболее популярна Easy CD Pro, которая может "нарезать" звуковые диски, многосессионные диски данных и смешанные диски, состоящие из аудиодорожек и данных, с одинаковой легкостью. Недавно появившаяся программа Adaptec Direct CD переносит файлы на CD напрямую. Хотя с ней работают только самые последние модели приводов, она представляет пользователю интуитивный интерфейс, отображая привод в виде двух логических дисков - одного для записи, другого для чтения. Вся хитрая работа по открытию и закрытию сессий записи проходит в фоновом режиме и не заметна для пользователя. Кстати, звуковые диски можно копировать и непосредственно с привода на привод (если у вас на машине есть еще один CD-ROM), что несколько опасно, если диск источника читается неустойчиво - стоит прерваться потоку данных, как болванка будет испорчена. Кроме того, такой метод размножения музыки слишком сильно напоминает подпольное товарное производство (около 30 минут на копию), поощрять которое автор не намерен.

Фонотека на домашней страничке
Самодельные коллекции MPEG-аудиодорожек, в изобилии расплодившиеся в Сети, можно поделить на две категории - "аудиофильские" и "потоковые". "Аудиофильские" коллекции, как правило, состоят из нескольких полностью оцифрованных альбомов с картинками обложек и тщательно составленными списками песен. Обычные авторы таких страничек - фанатичные поклонники той или иной рок-группы. Все MP3-файлы сжаты без ухудшения качества (44 кГц, 16 бит, стерео) и, в силу своих больших размеров (3-7 Мб), пригодны только для перекачивания на ваш диск.

Таблица 4.
От редакции: Не следует думать, что технология MP3 - орудие пирата. Мирные применения правильной компрессии звука придумывать не приходится. У нас в редакции, например, интервью расшифровывают именно так: звук с диктофона оцифровывают, чистят, пропускают через фильтры, запаковывают в MP3, передают по Сети кому положено и затем интервью расшифровывают. Не нажимая непрерывно кнопки перемотки диктофона, но управляя движением звука в программе.

"Потоковые" коллекции более анархичны по подбору репертуара, хотя многие подборки не уступят по выдержанности стиля коммерческим компиляциям. Главная их прелесть состоит в том, что музыку можно слушать "прямо сейчас", не дожидаясь загрузки файла: скорости вашего модема будет достаточно (или почти достаточно) для передачи аудиопотока в реальном масштабе времени, "со скоростью звука". Разумеется, бесплатный сыр бывает только в мышеловках: качество звука в таких файлах заметно ниже.

А как же стандартный и самый массовый способ передачи звука RealAudio от Progressive Networks (www.real.com)?

Его кодеки (алгоритмы сжатия/распаковки) дают слишком низкое качество звучания, хотя и работают на маломощных компьютерах. Они попросту недостаточно музыкальны: cips02.physik.uni-bonn.de/~scheller/audio/.

Если вы уже морально готовы обзавестись собственной качественной аудиотекой в Сети и имеете представление о работе с файлами RealAudio, то техническая сторона вопроса не покажется вам сколько-нибудь сложной: проигрыватель MP3-файлов WinAmp принимает "поточный" звук по той же схеме, что и Real Player [таб. 2]. Автор только вынужден напомнить, что хозяевам авторских прав на музыку такие странички вряд ли придутся по душе, да и закон будет скорее на их стороне.

Вместо заключения с конфискацией
Итак, двери открыты, ключ под ковриком, сигнализация отключена, а электрики объявили забастовку. Анонимных сторонников свободы информации столько, что бороться с отдельными представителями никто всерьез и не пытается, понимая, что молоток - не оружие против тараканов. В довершение этой неприглядной картины, человек - существо порочное, ленивое: если можно безнаказанно украсть, то, скорее всего, так оно и произойдет. Институты копирайта озабочены, экономисты озадачены, общественность наслаждается высококачественным звуком по цене пластмассы.

Ноябрьский Wired рассказывает, как Дэвид Викли, схваченный за руку родным Стэнфордским университетом при торговле дорожками MP3, бросил alma mater ради успешной торговли. Фирма Sony аккуратно разделяет audio и data технику в каталогах, но никого уже особенно не обманешь, кремний достаточно дешев, чтобы под маской аудио отыскалась все та же дейта. У Sony в геометрической прогрессии растут продажи устройств на мини-дисках, а вот традиционные плейеры уже никому не интересны, и компания потихоньку сворачивает торговлю. Молодые люди вебного вида бредут по улицам городов в наушниках, раздумывая, что пять дюймов компакта слишком громоздко и завтра надо бы поискать в альтависте производителей дешевых MPEG-плейеров на флэш-карточке. Большой Брат сохраняет видимость олимпийского спокойствия, лихорадочно продумывая варианты кровавой порки бутлегеров без нарушения демократических норм.

МРЗ в Сети
www.mpeg.org - самый главный сайт про MPEG (по крайней мере, с точки зрения правильного сетевого маркетинга). Все про MPEG вообще, и про MP3, в частности. В основном теоретического плана: что это, как работает и почему;
www.mp3.com - здесь собрана огромная коллекция ссылок на информации по теме: наиболее полный список программ, поисковые машины, FAQ, файлы MP3;
www.lehigh.edu/~aag4/tools.html - руководство к действию, как самому сделать MP3 - с чего начать, как работать с программами и где их взять;
www.geocities.com/SouthBeach/1690/mp3.html - список часто задаваемых вопросов (FAQ);
www.suite224.net/~wickedgarden/asylum.html - хорошо подобранная коллекция ссылок на программы для работы с MP3;
www.iis.fhg.de/departs/amm/layer3/index.html - Институт Фраунгофера (Fraunhofer) - создатели кодировщика l3enc - программы, ссылки, ответы на вопросы.

Небезызвестный музыкант-электронщик Ричард Джеймс (он же Aphex Twin) в свое время сказал: "В будущем музыкой будут обмениваться, а не продавать".

Похоже, что это будущее уже наступило.

Впрочем, ничего особенного не происходит. Пройдет немного времени, и молодые перспективные менеджеры в отделах сбыта сообразят, что если нельзя продать звук как товар, то можно - как услугу. А эта схема бизнеса вполне отработана, хотя норма прибыли, извлекаемая из движения воздуха, заметно ниже, чем при его продаже.



1 FAQСледующий материалКнига отзывов
К оглавлениюПредыдущий материалОбратная связь

Журнал "Интернет". Регистрационное свидетельство Госкомпечати РФ N. 016370 от 16.07.1997 г. Распространяется через сети розничной торговли, через компьютерные сети, а также путем подписки. Мнение редакции по тем или иным вопросам может не всегда совпадать с мнениями авторов. Редакция не несет ответственности за содержание рекламных материалов. Перепечтка или копирование запрещены, при цитировании ссылка на журнал "Интернет" обязательна.
Copyright © 1997-1998 Журнал "Internet"
Copyright © 1997-1998 Netskate
Netskate E-mail: imag@netskate.ru
Телефон: 245-45-84