.

Современные методы позиционирования и сжатия звука

Язык: русский
Формат: реферат
Тип документа: Word Doc
0 10398
Скачать документ

Министерство общего и профессионального образования

Российской Федерации

Южно-Уральский Государственный Университет

Кафедра ЦРТС

Пояснительная записка к курсовой работе

по курсу «Основы автоматизации проектирования радиоэлектронных
устройств»

на тему «Современные звуковые карты. Методы позиционирования и сжатия
звука.»

ЮУРГУ-К. 200706000 ПЗ

Нормоконтролер Руководитель

«___» __________ 2000 г. «___» __________ 2000 г.

Авторы работы

студент группы –

«___» __________ 2000 г.

Работа защищена

с оценкой

________________

«___» __________ 2000 г.

Челябинск

2000

Аннотация

В данной курсовой работе изучаются различные аспекты применения звуковых
карт. Рассматриваются способы получения звука на компьютере, основные
принципы формирования и отличия цифрового звука от аналоговово.
Рассмотрен также стандарт MIDI, применяемый во многих профессиональных
звуковых синтезаторах и т.п. Далее были подробно рассмотрены звуковые
карты, имеющиеся сейчас на рынке (некоторые карты, которые были доступны
в процессе создания курсовой были протестированны на реальных
приложениях): как и новые, так и уже более распространенные. Т.к. многие
звуковые карты сейчас поддерживают различные технологии позиционирования
звука в пространстве, то был кратко рассмотрен вопрос теории восприятия
звука человеческим ухом и накладываемые этим ограничения. Завершающим
этапом стало изучение форматов, применяемых для хранения оцифрованного
звука. Изучены были как форматы со сжатием без потерь, так и со сжатием
с потерями (mp3 и ему подобные), основанные на особенностях
человеческого слуха по восприятию различных частот. В работе
использовалась информация из различных источников: сопроводительной
документации к картам, сайтов фирм-производителей, независимых тестовых
лабораторий, публикации из периодических изданий. Для подготовки данной
пояснительной записки использовался текстовый процессор Microsoft Word
из состава пакета Microsoft Office 97/2000, браузер Netscape Navigator
6.0. В качестве платформы для субъективной оценки качества звука
изспользовалась следующая система:

Intel Celeron 500Mhz

MB FIC CP11Z

HDD Fujitsu 8,4GB

CD-ROM Samsung 24X

Звуковая подсистема:

звуковая плата A-trend Harmony 3DS724A на базе чипа Yamaha-724E

усилитель Вега У-120-СТЕРЕО

колонки Радиотехника С-90Д (трех полосные с фазоинвертором)

ЮУРГУ-К. 200706000 ПЗ

Изм Лист № докум. Подп. Дата

Разраб. Гусев А.А./Котов В.В.

Современные звуковые карты. Методы позиционирования и сжатия звука Лит.
Лист Листов

Пров. Прокопов И.И.

К PAGE \* MERGEFORMAT 2 147 SECTIONPAGES \* MERGEFORMAT 1

ЮУрГУ

Кафедра ЦРТС

Н. Контр. Прокопов И.И.

Утв. Прокопов И.И.

Содержание

Введение

Цифровое представление звуковых сигналов

Отличия цифрового представления сигналов от аналогового

Способы представления звука в цифровом виде

АЦП и ЦАП

Устройство АЦП и ЦАП

Передискретизация

Достоинства и недостатки цифрового звука

Интерфейсы, используемые для передачи цифрового звука

Обработка цифрового звука

Методы, используемые для обработки цифрового звука

Звуковые эффекты

К вопросу о хранение и передаче цифрового звука

К вопросу о сохранении качества сигнала при цифровой обработке

К вопросу о сохранении качества сигнала при цифровом преобразовании
форматов

Компьютерные программы, используемые для обработки звука

Джиттер

Спецификация стандарта MIDI, его реализация на компьютере

MIDI (цифровой интерфейс музыкальных инструментов)

Аппаратная спецификация MIDI

Програмная спецификация MIDI

Методы, используемые для синтеза звука

Подстандарты GM, GS, XG

MPU-401 и MT-32

Эффекты Reverb и Chorus

Эффеуты Polyphony и Multi-timbral

MIDI-клавиатура

Звуковые карты

Способы получения звука на IBM PC

Компоненты звуковой карты

Эффект-процессор

Характеристики звуковой карты

Параметры некоторых поделей звуковых карт

Сравнение Creative Labs Sound Blaster Live! и Diamond Monster MX300 (на
Aureal Vortex2)

Некторые аспекты качественного воспроизведения цифрового звука

Наводки от аппаратуры компьютера на карту

Цифровая рабочая станция

Обзор современных технологий позиционирования звука в пространстве

в видении компании Sensaura

в видении компании Aureal

в видении компании EAR

в видении компании Creative

в видении компании QSound

Обзор применяемых форматов хранения цифровых аудиоданных без и с потерей
качества

Методы, используемые для эффективного сжатия цифрового звука

Форматы, используемые для представления цифрового звука

Форматы, используемые для представления звука и музыки

MPEG: общая информация

Звук в MPEG

Что такое MP3?

Описание процесса кодирования

Декодирование MP3

Самые известные плееры

Dolby Digital – общая информация

TvinVQ – VQF

MP3 – время прощаться с ПК

Заключение

Список используемых материалов

Введение

Компьютер – от английского “compute” – вычислять. Т.е., говоря
по-русски, – всего-навсего вычислитель. И когда-то, давным-давно, это
соответствовало применению компьютеров. Их использовали англичане для
взлома кодов и шифров радиопередач Германии во время ВМВ. Их применяют и
для прямо противоположной функции – кодирования и шифрования
передаваемой информации. Они применялись для расчета сложнейших
траекторий полета первых (да и последних) искусственных спутников Земли
и других планет. И существует еще большое число ветвей и отраслей науки
и промышленности, в которых невозможно обойтись без вычислительных
мощностей компьютеров. Однако, изначально Электронно Вычислительную
Машину всегда пытались использовать не только по прямому назначению, но
и чуточку по другому. Вначале простые крестики-нолики и морской бой.
Потом, когда у машины появился дисплей, ее научили рисовать различные
«картинки» из символов. Дальше, до движущихся по экрану различных
фигурок, оставалось совсем немного. Сейчас уже игры без графики мало
кому нужны, кроме фэнов. Но… Присмотримся к этому процессу чуть
внимательней: «символы->картинки из значков->статичные
картинки->полномасштабное видео». Компьютеры становились меньше,
надежнее, долговечнее, быстрее…

Как видим, путь проделан немалый, и все-таки – это эволюция,
растянувшаяся на полвека. Масштабное же событие, произошедшее около 10
лет назад назвать другим словом, как революция, вряд ли можно. На
персональный компьютер пришел звук. Отголоски этого события продолжают
сотрясать комьютерный мир до сих пор. Звук позволил сделать компьютер из
принадлежности редкого бизнесмена в суровую необходимость для каждого.
Он совершил фурор в индустрии производства музыкальной аппаратуры и
звукозаписи. Раньше требовалось иметь проигрыватель виниловых дисков,
компакт-кассет, компакт-дисков и прочую технику. Теперь достаточно
одного – компьютера. Он уже играет, поет и даже обновленную версию
рецепта клубничного пирога с джемом может из интернета скачать и
переслать СВСВЧП (Сверх Интеллектуально Сверх Высокочастотной Печке).
Только вот кофе пока не варит. Но и это, я думаю, скоро кто-нибудь
исправит.

Компьютер потеснил такие традиционные истоники дохода и развлечений как
казино, кино, театр. Осталось только научить компьютер работать и делать
уборку в квартире, и все… Он действительно будет «везде», и человек не
сможет без него обходиться. А вот компьютер без человека?

И все лишь из-за чего? Из-за маленькой платки с несколькими копеечными
радиодеталями, кошмарными шумами и огромными амбициями. Sound Blaster
так сказать, версии 1.0. Производства фирмы Creative Labs из далекого
Сингапура. Не она первой выпустила звуковую карту, но она смогла
популяризовать эту идею в массах. Создать имя и завоевать рынок.
Словосочетание «Sound Blaster» стало синонимом «звуковой карты». И
теперь компьютер без «звука» – это не компьютер. Как же так! Ведь он
сможет проиграть при входе в «Windows» бравурное «Та-да!!!» И все –
комьютер становится бесполезной грудой никому не нужного хлама.

Мне кажется, что все вышеприведенное должно немного заинтересовать. Ведь
именно появление звука стало первым камнем в той лавине, которая
обрушивается сейчас на головы несчастных потребителей услуг и товаров из
сферы высоких технологий. «Полная 3Д акселерация» кричат одни,
«Потрясающее качество воспроизведения ДВД» заявляют третьи, «Только у
нас – самый настоящий трехмерный звук» похваляются третьи. И так – до
бесконечности.

Вот почему я выбрал в качестве темы для курсовой это направление. Оно
весьма обширно и полно обхватить его не позволяет ни скромный объем
пояснительной записки, ни требуемое время. Поэтому я постарался ответить
на поставленые вопросы, используя свой небольшой опыт в работе на
«железном» (аппаратном) обеспечении компьютеров.

Цифровое представление звуковых сигналов

Отличия цифрового представления сигналов от аналогового

Традиционное аналоговое представление сигналов основано на подобии
(аналогичности) электрических сигналов (изменений тока и напряжения)
представленным ими исходным сигналам (звуковому давлению, температуре,
скорости и т.п.), а также подобии форм электрических сигналов в
различных точках усилительного или передающего тракта. Форма
электрической кривой, описывающей (также говорят – переносящей) исходный
сигнал, максимально приближена к форме кривой этого сигнала.

Такое представление наиболее точно, однако малейшее искажение формы
несущего электрического сигнала неизбежно повлечет за собой такое же
искажение формы и сигнала переносимого. В терминах теории информации,
количество информации в несущем сигнале в точности равно количеству
информации в сигнале исходном, и электрическое представление не содержит
избыточности, которая могла бы защитить переносимый сигнал от искажений
при хранении, передаче и усилении.

Цифровое представление электрических сигналов призвано внести в них
избыточность, предохраняющую от воздействия паразитных помех. Для этого
на несущий электрический сигнал накладываются серьезные ограничения –
его амплитуда может принимать только два предельных значения – 0 и 1.

Вся зона возможных амплитуд в этом случае делится на три зоны: нижняя
представляет нулевые значения, верхняя – единичные, а промежуточная
является запрещенной – внутрь нее могут попадать только помехи. Таким
образом, любая помеха, амплитуда которой меньше половины амплитуды
несущего сигнала, не оказывает влияния на правильность передачи значений
0 и 1. Помехи с большей амплитудой также не оказывают влияния, если
длительность импульса помехи ощутимо меньше длительности информационного
импульса, а на входе приемника установлен фильтр импульсных помех.

Сформированный таким образом цифровой сигнал может переносить любую
полезную информацию, которая закодирована в виде последовательности
битов – нулей и единиц; частным случаем такой информации являются
электрические и звуковые сигналы. Здесь количество информации в несущем
цифровом сигнале значительно больше, нежели в кодированном исходном, так
что несущий сигнал имеет определенную избыточность относительно
исходного, и любые искажения формы кривой несущего сигнала, при которых
еще сохраняется способность приемника правильно различать нули и
единицы, не влияют на достоверность передаваемой этим сигналом
информации. Однако в случае воздействия значительных помех форма сигнала
может искажаться настолько, что точная передача переносимой информации
становится невозможной – в ней появляются ошибки, которые при простом
способе кодирования приемник не сможет не только исправить, но и
обнаружить. Для еще большего повышения стойкости цифрового сигнала к
помехам и искажениям применяется цифровое избыточное кодирование двух
типов: проверочные (EDC – Error Detection Code, обнаруживающий ошибку
код) и корректирующие (ECC – Error Correction Code, исправляющий ошибку
код) коды. Цифровое кодирование состоит в простом добавлении к исходной
информации дополнительных битов и/или преобразовании исходной битовой
цепочки в цепочку большей длины и другой структуры. EDC позволяет просто
обнаружить факт ошибки – искажение или выпадение полезной либо появление
ложной цифры, однако переносимая информация в этом случае также
искажается; ECC позволяет сразу же исправлять обнаруженные ошибки,
сохраняя переносимую информацию неизменной. Для удобства и надежности
передаваемую информацию разбивают на блоки (кадры), каждый из которых
снабжается собственным набором этих кодов.

Каждый вид EDC/ECC имеет свой предел способности обнаруживать и
исправлять ошибки, за которым опять начинаются необнаруженные ошибки и
искажения переносимой информации. Увеличение объема EDC/ECC относительно
объема исходной информации в общем случае повышает обнаруживающую и
корректирующую способность этих кодов.

В качестве EDC популярен циклический избыточный код CRC (Cyclic
Redundancy Check), суть которого состоит в сложном перемешивании
исходной информации в блоке и формированию коротких двоичных слов,
разряды которых находятся в сильной перекрестной зависимости от каждого
бита блока. Изменение даже одного бита в блоке вызывает значительное
изменение вычисленного по нему CRC, и вероятность такого искажения
битов, при котором CRC не изменится, исчезающе мала даже при коротких
(единицы процентов от длины блока) словах CRC. В качестве ECC
используются коды Хэмминга (Hamming) и Рида-Соломона (Reed-Solomon),
которые также включают в себя и функции EDC.

Информационная избыточность несущего цифрового сигнала приводит к
значительному (на порядок и более) расширению полосы частот, требуемой
для его успешной передачи, по сравнению с передачей исходного сигнала в
аналоговой форме. Кроме собственно информационной избыточности, к
расширению полосы приводит необходимость сохранения достаточно крутых
фронтов цифровых импульсов.

Кроме целей помехозащиты, информация в цифровом сигнале может быть
подвергнута также линейному или канальному кодированию, задача которого
– оптимизировать электрические параметры сигнала (полосу частот,
постоянную составляющую, минимальное и максимальное количество
нулевых/единичных импульсов в серии и т.п.) под характеристики реального
канала передачи или записи сигнала.

Полученный несущий сигнал, в свою очередь, также является обычным
электрическим сигналом, и к нему применимы любые операции с такими
сигналами – передача по кабелю, усиление, фильтрование, модуляция,
запись на магнитный, оптический или другой носитель и т.п. Единственным
ограничением является сохранение информационного содержимого – так,
чтобы при последующем анализе можно было однозначно выделить и декоди-
ровать переносимую информацию, а из нее – исходный сигнал.

Способы представления звука в цифровом виде

Исходная форма звукового сигнала – непрерывное изменение амплитуды во
времени – представляется в цифровой форме с помощью “перекрестной
дискретизации” – по времени и по уровню.

Согласно теореме Котельникова, любой непрерывный процесс с ограниченным
спектром может быть полностью описан дискретной последовательностью его
мгновенных значений, следующих с частотой, как минимум вдвое превышающей
частоту наивысшей гармоники процесса; частота Fd выборки мгновенных
значений (отсчетов) называется частотой дискретизации.

Из теоремы следует, что сигнал с частотой Fa может быть успешно
дискретизирован по времени на частоте 2Fa только в том случае, если он
является чистой синусоидой, ибо любое отклонение от синусоидальной формы
приводит к выходу спектра за пределы частоты Fa. Таким образом, для
временнОй дискретизации произвольного звукового сигнала (обычно
имеющего, как известно, плавно спадающий спектр), необходим либо выбор
частоты дискретизации с запасом, либо принудительное ограничение спектра
входного сигнала ниже половины частоты дискретизации.

Одновременно с временнОй дискретизацией выполняется амплитудная –
измерение мгновенных значений амплитуды и их представление в виде
числовых величин с определенной точностью. Точность измерения (двоичная
разрядность N получаемого дискретного значения) определяет соотношение
сигнал/шум и динамический диапазон сигнала (теоретически это –
взаимно-обратные величины, однако любой реальный тракт имеет также и
собственный уровень шумов и помех).

Полученный поток чисел (серий двоичных цифр), описывающий звуковой
сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code
Modulation, PCM), так как каждый импульс дискретизованного по времени
сигнала представляется собственным цифровым кодом.

Чаще всего применяют линейное квантование, когда числовое значение
отсчета пропорционально амплитуде сигнала. Из-за логарифмической природы
слуха более целесообразным было бы логарифмическое квантование, когда
числовое значение пропорционально величине сигнала в децибелах, однако
это сопряжено с трудностями чисто технического характера.

ВременнАя дискретизация и амплитудное квантование сигнала неизбежно
вносят в сигнал шумовые искажения, уровень которых принято оценивать по
формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варьируется
для разных типов сигналов: для чистой синусоиды это 1.7 дБ, для звуковых
сигналов – от -15 до 2 дБ. Отсюда видно, что к снижению шумов в рабочей
полосе частот 0..Fмакс приводит не только увеличение разрядности
отсчета, но и повышение частоты дискретизации относительно 2Fмакс,
поскольку шумы квантования “размазываются” по всей полосе вплоть до
частоты дискретизации, а звуковая информация занимает только нижнюю
часть этой полосы.

В большинстве современных цифровых звуковых систем используются
стандартные частоты дискретизации 44.1 и 48 кГц, однако частотный
диапазон сигнала обычно ограничивается возле 20 кГц для оставления
запаса по отношению к теоретическому пределу. Также наиболее
распространено 16-разрядное квантование по уровню, что дает предельное
соотношение сигнал/шум около 98 дБ. В студийной аппаратуре используются
более высокие разрешения – 18-, 20- и 24-разрядное квантование при
частотах дискретизации 56, 96 и 192 кГц. Это делается для того, чтобы
сохранить высшие гармоники звукового сигнала, которые непосредственно не
воспринимаются слухом, но влияют на формирование общей звуковой картины.

Для оцифровки более узкополосных и менее качественных сигналов частота и
разрядность дискретизации могут снижаться; например, в телефонных линиях
применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц.

Представление аналогового сигнала в цифровом виде называется также
импульсно-кодовой модуляцией (ИКМ, PCM – Pulse Code Modulation), так как
сигнал представляется в виде серии импульсов постоянной частоты
(временнАя дискретизация), амплитуда которых передается цифровым кодом
(амплитудная дискретизация). PCM-поток может быть как параллельным,
когда все биты каждого отсчета передаются одновременно по нескольким
линиям с частотой дискретизации, так и последовательным, когда биты
передаются друг за другом с более высокой частотой по одной линии.

Сам цифровой звук и относящиеся к нему вещи принято обозначать общим
термином Digital Audio; аналоговая и цифровая части звуковой системы
обозначаются терминами Analog Domain и Digital Domain.

АЦП и ЦАП

Аналогово-цифровой и цифро-аналоговый преобразователи. Первый
преобразует аналоговый сигнал в цифровое значение амплитуды, второй
выполняет обратное преобразование. В англоязычной литературе применяются
термины ADC и DAC, а совмещенный преобразователь называют codec
(coder-decoder).

Принцип работы АЦП состоит в измерении уровня входного сигнала и выдаче
результата в цифровой форме. В результате работы АЦП непрерывный
аналоговый сигнал превращается в импульсный, с одновременным измерением
амплитуды каждого импульса. ЦАП получает на входе цифровое значение
амплитуды и выдает на выходе импульсы напряжения или тока нужной
величины, которые расположенный за ним интегратор (аналоговый фильтр)
превращает в непрерывный аналоговый сигнал.

Для правильной работы АЦП входной сигнал не должен изменяться в течение
времени преобразования, для чего на его входе обычно помещается схема
выборки-хранения, фиксирующая мгновенный уровень сигнала и сохраняющая
его в течение всего времени преобразования. На выходе ЦАП также может
устанавливаться подобная схема, подавляющая влияние переходных процессов
внутри ЦАП на параметры выходного сигнала.

При временнОй дискретизации спектр полученного импульсного сигнала в
своей нижней части 0..Fa повторяет спектр исходного сигнала, а выше
содержит ряд отражений (aliases, зеркальных спектров), которые
расположены вокруг частоты дискретизации Fd и ее гармоник (боковые
полосы). При этом первое отражение спектра от частоты Fd в случае Fd =
2Fa располагается непосредственно за полосой исходного сигнала, и
требует для его подавления аналогового фильтра (anti-alias filter) с
высокой крутизной среза. В АЦП этот фильтр устанавливается на входе,
чтобы исключить перекрытие спектров и их интерференцию, а в ЦАП – на
выходе, чтобы подавить в выходном сигнале надтональные помехи, внесенные
временнОй дискретизацией.

Устройство АЦП и ЦАП

В основном применяется три конструкции АЦП: параллельные – входной
сигнал одновременно сравнивается с эталонными уровнями набором схем
сравнения (компараторов), которые формируют на выходе двоичное значение.
В таком АЦП количество компараторов равно (2 в степени N) – 1, где N –
разрядность цифрового кода (для восьмиразрядного – 255), что не
позволяет наращивать разрядность свыше 10-12.

последовательного приближения – преобразователь при помощи
вспомогательного ЦАП генерирует эталонный сигнал, сравниваемый со
входным. Эталонный сигнал последовательно изменяется по принципу
половинного деления (дихотомии), который используется во многих методах
сходящегося поиска прикладной математики. Это позволяет завершить
преобразование за количество тактов, равное разрядности слова,
независимо от величины входного сигнала.

с измерением временнЫх интервалов – широкая группа АЦП, использующая для
измерения входного сигнала различные принципы преобразования уровней в
пропорциональные временнЫе интервалы, длительность которых измеряется
при помощи тактового генератора высокой частоты. Иногда называются также
считающими АЦП.

Среди АЦП с измерением временнЫх интервалов преобладают следующие три
типа: последовательного счета, или однократного интегрирования
(single-slope) – в каждом такте преобразования запускается генератор
линейно возрастающего напряжения, которое сравнивается со входным.

Обычно такое напряжение получают на вспомогательном ЦАП, подобно АЦП
последовательного приближения.

двойного интегрирования (dual-slope) – в каждом такте преобразования
входной сигнал заряжает конденсатор, который затем разряжается на
источник опорного напряжения с измерением длительности разряда.

следящие – вариант АЦП последовательного счета, при котором генератор
эталонного напряжения не перезапускается в каждом такте, а изменяет его
от предыдущего значения до текущего.

Наиболее популярным вариантом следящего АЦП является sigma-delta,
работающий на частоте Fs, значительно (в 64 и более раз) превышающей
частоту дискретизации Fd выходного цифрового сигнала. Компаратор такого
АЦП выдает значения пониженной разрядности (обычно однобитовые – 0/1),
сумма которых на интервале дискретизации Fd пропорциональна величине
отсчета. Последовательность малоразрядных значений подвергается цифровой
фильтрации и понижению частоты следования (decimation), в результате
чего получается серия отсчетов с заданной разрядностью и частотой
дискретизации Fd.

Для улучшения соотношения сигнал/шум и снижения влияния ошибок
квантования, которое в случае однобитового преобразователя получается
довольно высоким, применяется метод формовки шума (noise shaping) через
схемы обратной связи по ошибке и цифрового фильтрования. В результате
применения этого метода форма спектра шума меняется так, что основная
шумовая энергия вытесняется в область выше половины частоты Fs,
незначительная часть остается в нижней половине, и практически весь шум
удаляется из полосы исходного аналогового сигнала.

ЦАП в основном строятся по трем принципам: взвешивающие – с
суммированием взвешенных токов или напряжений, когда каждый разряд
входного слова вносит соответствующий своему двоичному весу вклад в
общую величину получаемого аналогового сигнала; такие ЦАП называют также
параллельными или многоразрядными (multibit).

sigma-delta, с предварительной цифровой передискретизацией и выдачей
малоразрядных (обычно однобитовых) значений на схему формирования
эталонного заряда, которые со столь же высокой частотой добавляются к
выходному сигналу. Такие ЦАП носят также название bitstream.

с широтно-импульсной модуляцией (ШИМ, Pulse Width Modulation, PWM),
когда на схему выборки-хранения аналогового сигнала выдаются импульсы
постоянной амплитуды и переменной длительности, управляя дозированием
выдаваемого на выход заряда. На этом принципе работают преобразователи
MASH (Multi-stAge Noise Shaping – многостадийная формовка шума) фирмы
Matsushita. Свое название эти ЦАП получили по причине применения в них
нескольких последовательных формирователей шума.

При использовании передискретизации в десятки раз (обычно – 64x..512x)
становится возможным уменьшить разрядность ЦАП без ощутимой потери
качества сигнала; ЦАП с меньшим числом разрядов обладают также лучшей
линейностью. В пределе количество разрядов может сокращаться до одного.

Форма выходного сигнала таких ЦАП представляет собой полезный сигнал,
обрамленный значительным количеством высокочастотного шума, который, тем
не менее, эффективно подавляется аналоговым фильтром даже среднего
качества.

ЦАП являются “прямыми” устройствами, в которых преобразование
выполняется проще и быстрее, чем в АЦП, которые в большинстве своем –
последовательные и более медленные устройства.

Передискретизация (oversampling)

Это дискретизация сигнала с частотой, превышающей основную частоту
дискретизации. Передискретизации может быть аналоговой, когда с
повышенной частотой делаются выборки исходного сигнала, или цифровой,
когда между уже существующими цифровыми отсчетами вставляются
дополнительные, рассчитанные путем интерполяции. Другой способ получения
значений промежуточных отсчетов состоит во вставке нулей, после чего вся
последовательность подвергается цифровой фильтрации. В АЦП используется
аналоговая передискретизация, в ЦАП – цифровая.

Передискретизация используется для упрощения конструкций АЦП и ЦАП. По
условиям задачи на входе АЦП и выходе ЦАП должен быть установлен
аналоговый фильтр с АЧХ, линейной в рабочем диапазоне и круто спадающей
за его пределами. Реализация такого аналогового фильтра весьма сложна; в
то же время при повышении частоты дискретизации вносимые ею отражения
спектра пропорционально отодвигаются от основного сигнала, и аналоговый
фильтр может иметь гораздо меньшую крутизну среза.

Другое преимущество передискретизации состоит в том, что ошибки
амплитудного квантования (шум дробления), распределенные по всему
спектру квантуемого сигнала, при повышении частоты дискретизации
распределяются по более широкой полосе частот, так что на долю основного
звукового сигнала приходится меньшее количество шума. Каждое удвоение
частоты снижает уровень шума квантования на 3 дБ; поскольку один
двоичный разряд эквивалентен 6 дБ шума, каждое учетверение частоты
позволяет уменьшить разрядность преобразователя на единицу.

Передискретизация вместе с увеличением разрядности отсчета,
интерполяцией отсчетов с повышенной точностью и выводом их на ЦАП
надлежащей разрядности позволяет несколько улучшить качество
восстановления звукового сигнала. По этой причине даже в 16-разрядных
системах нередко применяются 18- и 20-разрядные ЦАП с
передискретизацией.

АЦП и ЦАП с передискретизацией за счет значительного уменьшения времени
преобразования могут обходиться без схемы выборки-хранения.

Достоинства и недостатки цифрового звука

Цифровое представление звука ценно прежде всего возможностью
бесконечного хранения и тиражирования без потери качества, однако
преобразование из аналоговой формы в цифровую и обратно все же неизбежно
приводит к частичной его потере. Наиболее неприятные на слух искажения,
вносимые на этапе оцифровки – гранулярный шум, возникающий при
квантовании сигнала по уровню из-за округления амплитуды до ближайшего
дискретного значения. В отличие от простого широкополосного шума,
вносимого ошибками квантования, гранулярный шум представляет собой
гармонические искажения сигнала, наиболее заметные в верхней части
спектра.

Мощность гранулярного шума обратно пропорциональна количеству ступеней
квантования, однако из-за логарифмической характеристики слуха при
линейном квантовании (постоянная величина ступени) на тихие звуки
приходится меньше ступеней квантования, чем на громкие, и в результате
основная плотность нелинейных искажений приходится на область тихих
звуков. Это приводит к ограничению динамического диапазона, который в
идеале (без учета гармонических искажений) был бы равен соотношению
сигнал/шум, однако необходимость ограничения этих искажений снижает
динамический диапазон для 16-разрядного кодирования до 50-60 дБ.

Положение могло бы спасти логарифмическое квантование, однако его
реализация в реальном времени весьма сложна и дорога.

Искажения, вносимые гранулярным шумом, можно уменьшить путем добавления
к сигналу обычного белого шума (случайного или псевдослучайного
сигнала), амплитудой в половину младшего значащего разряда; такая
операция называется сглаживанием (dithering). Это приводит к
незначительному увеличению уровня шума, зато ослабляет корреляцию ошибок
квантования с высокочастотными компонентами сигнала и улучшает
субъективное восприятие. Сглаживание применяется также перед округлением
отсчетов при уменьшении их разрядности. По существу, dithering и noise
shaping являются частными случаями одной технологии – с той разницей,
что в первом случае используется белый шум с равномерным спектром, а во
втором – шум со специально “формованным” спектром.

При восстановлении звука из цифровой формы в аналоговую возникает
проблема сглаживания ступенчатой формы сигнала и подавления гармоник,
вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров может
происходить либо недостаточное подавление этих помех, либо избыточное
ослабление полезных высокочастотных составляющих. Плохо подавленные
гармоники частоты дискретизации искажают форму аналогового сигнала
(особенно в области высоких частот), что создает впечатление
“шероховатого”, “грязного” звука.

Интерфейсы, используемые для передачи цифрового звука

S/PDIF (Sony/Philiрs Digital Interface Format – формат цифрового
интерфейса фирм Sony и Philiрs) – цифровой интерфейс для бытовой
радиоаппаратуры.

AES/EBU (Audio Engineers Society / European Broadcast Union – общество
звукоинженеров / европейское вещательное объединение) – цифровой
интерфейс для студийной радиоаппаратуры.

Оба интерфейса являются последовательными и используют одинаковый формат
сигнала и систему кодирования – самосинхронизирующийся код BMC
(Biphase-Mark Code – код с представлением единицы двойным изменением
фазы), и могут передавать сигналы в формате PCM разрядностью до 24 бит
на частотах дискретизации до 48 кГц.

Каждый отсчет сигнала передается 32-разрядным словом, в котором 20
разрядов используются для передачи отсчета, а 12 – для формирования
синхронизирующей преамбулы, передачи дополнительной информации и бита
четности. 4 разряда из служебной группы могут использоваться для
расширения формата отсчетов до 24 разрядов.

Помимо бита четности, служебная часть слова содержит бит достоверности
(Validity), который должен быть нулевым для каждого достоверного
отсчета. В случае приема слова с единичным битом Validity либо с
нарушением четности в слове приемник трактует весь отсчет как ошибочный
и может на выбор либо заменить его предыдущим значением, либо
интерполировать на основе нескольких соседних достоверных отсчетов.

Отсчеты, помеченные как недостоверные, могут передавать
CD-проигрыватели, DAT-магнитофоны и другие устройства, если при
считывании информации с носителя не удалось скорректировать возникшие в
процессе чтения ошибки.

Стандартно формат кодирования предназначен для передачи одно- и
двух-канального сигнала, однако при использовании служебных разрядов для
кодирования номера канала возможна передача многоканального сигнала.

С электрической стороны S/PDIF предусматривает соединение коаксиальным
кабелем с волновым сопротивлением 75 Ом и разъемами типа RCA
(“тюльпан”), амплитуда сигнала – 0.5 В. AES/EBU предусматривает
соединение симметричным экранированным двухпроводным кабелем с
трансформаторной развязкой по интерфейсу RS-422 с амплитудой сигнала
3-10 В, разъемы – трехконтактные типа Cannon XLR. Существуют также
оптические варианты приемопередатчиков – TosLink (пластмассовое
оптоволокно) и AT&T Link (стеклянное оптоволокно).

Обработка цифрового звука

Цифровой звук обрабатывается посредством математических операций,
применяемых к отдельным отсчетам сигнала, либо к группам отсчетов
различной длины. Выполняемые математические операции могут либо
имитировать работу традиционных аналоговых средств обработки
(микширование двух сигналов – сложение, усиление/ослабление сигнала –
умножение на константу, модуляция – умножение на функцию и т.п.), либо
использовать альтернативные методы – например, разложение сигнала в
спектр (ряд Фурье), коррекция отдельных частотных составляющих, затем
обратная “сборка” сигнала из спектра.

Обработка цифровых сигналов подразделяется на линейную (в реальном
времени, над “живым” сигналом) и нелинейную – над предварительно
записанным сигналом. Линейная обработка требует достаточного
быстродействия вычислительной системы (процессора); в ряде случаев
невозможно совмещение требуемого быстродействия и качества, и тогда
используется упрощенная обработка с пониженным качеством. Нелинейная
обработка никак не ограничена во времени, поэтому для нее могут быть
использованы вычислительные средства любой мощности, а время обработки,
особенно с высоким качеством, может достигать нескольких минут и даже
часов.

Для обработки применяются как универсальные процессоры общего назначения
– Intel 8035, 8051, 80×86, Motorola 68xxx, SPARC – так и
специализированные цифровые сигнальные процессоры (Digital Signal
Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog
Devices ADSP-xxxx и др.

Разница между универсальным процессором и DSP состоит в том, что первый
ориентирован на широкий класс задач – научных, экономических,
логических, игровых и т.п., и содержит большой набор команд общего
назначения, в котором преобладают обычные математические и логические
операции. DSP специально ориентированы на обработку сигналов и содержат
наборы специфический операций – сложение с ограничением, перемножение
векторов, вычисление математического ряда и т.п. Реализация даже
несложной обработки звука на универсальном процессоре требует
значительного быстродействия и далеко не всегда возможна в реальном
времени, в то время как даже простые DSP нередко справляются в реальном
времени с относительно сложной обработкой, а мощные DSP способны
выполнять качественную спектральную обработку сразу нескольких сигналов.

В силу своей специализации DSP редко применяются самостоятельно – чаще
всего устройство обработки имеет универсальный процессор средней
мощности для управления всем устройством, приема/передачи информации,
взаимодействия с пользователем, и один или несколько DSP – собственно
для обработки звукового сигнала. Например, для реализации надежной и
быстрой обработки сигналов в компьютерных системах применяют
специализированные платы с DSP, через которые пропускается
обрабатываемый сигнал, в то время как центральному процессору компьютера
остаются лишь функции управления и передачи.

Методы, используемые для обpаботки звука

1. Монтаж. Состоит в выpезании из записи одних участков, вставке дpугих,
их замене, pазмножении и т.п. Hазывается также pедактиpованием. Все
совpеменные звуко- и видеозаписи в той или иной меpе подвеpгаются
монтажу.

2. Амплитудные пpеобpазования. Выполняются пpи помощи pазличных действий
над амплитудой сигнала, котоpые в конечном счете сводятся к умножению
значений самплов на постоянный коэффициент (усиление/ослабление) или
изменяющуюся во вpемени функцию-модулятоp (амплитудная модуляция).
Частным случаем амплитудной модуляции является фоpмиpование огибающей
для пpидания стационаpному звучанию pазвития во вpемени.

Амплитудные пpеобpазования выполняются последовательно с отдельными
самплами, поэтому они пpосты в pеализации и не тpебуют большого объема
вычислений.

3. Частотные (спектpальные) пpеобpазования. Выполняются над частотными
составляющими звука. Если использовать спектpальное pазложение – фоpму
пpедставления звука, в котоpой по гоpизонтали отсчитываются частоты, а
по веpтикали – интенсивности составля- ющих этих частот, то многие
частотные пpеобpазования становятся похожими на амплитудные
пpеобpазованиям над спектpом. Hапpимеp, фильтpация – усиление или
ослабление опpеделенных полос частот – сводится к наложению на спектp
соответствующей амплитудной огибающей. Однако частотную модуляцию таким
обpазом пpедставить нельзя – она выглядит, как смещение всего спектpа
или его отдельных участков во вpемени по опpеделенному закону.

Для pеализации частотных пpеобpазований обычно пpименяется спектpальное
pазложение по методу Фуpье, котоpое тpебует значительных pесуpсов.
Однако имеется алгоpитм быстpого пpеобpазования Фуpье (БПФ, FFT),
котоpый делается в целочисленной аpифметике и позволяет уже на младших
моделях 486 pазвоpачивать в pеальном вpемени спектp сигнала сpеднего
качества. Пpи частотных пpеобpа- зованиях, кpоме этого, тpебуется
обpаботка и последующая свеpтка, поэтому фильтpация в pеальном вpемени
пока не pеализуется на пpоцессоpах общего назначения. Вместо этого
существует большое количество цифpовых сигнальных пpоцессоpов (Digital
Signal Processor – DSP), котоpые выполняют эти опеpации в pеальном
вpемени и по нескольким каналам.

4. Фазовые пpеобpазования. Сводятся в основном к постоянному сдвигу фазы
сигнала или ее модуляции некотоpой функцией или дpугим сигналом.
Благодаpя тому, что слуховой аппаpат человека использует фазу для
опpеделения напpавления на источник звука, фазовые пpеобpазования
стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему
подобные.

5. Вpеменные пpеобpазования. Заключаются в добавлении к основному
сигналу его копий, сдвинутых во вpемени на pазличные величи- ны. Пpи
небольших сдвигах (поpядка менее 20 мс) это дает эффект pазмножения
источника звука (эффект хоpа), пpи больших – эффект эха.

6. Фоpмантные пpеобpазования. Являются частным случаем частотных и
опеpиpуют с фоpмантами – хаpактеpными полосами частот, встpечающимися в
звуках, пpоизносимых человеком. Каждому звуку соот- ветствует свое
соотношение амплитуд и частот нескольких фоpмант, котоpое опpеделяет
тембp и pазбоpчивость голоса. Изменяя паpаметpы фоpмант, можно
подчеpкивать или затушевывать отдельные звуки, менять одну гласную на
дpугую, сдвигать pегистp голоса и т.п.

Звуковые эффекты

Вот наиболее pаспpостpаненные звуковые эффекты: – вибpато – амплитудная
или частотная модуляция сигнала с небольшой частотой (до 10 Гц).
Амплитудное вибpато также носит название тpемоло; на слух оно
воспpинимается, как замиpание или дpожание звука, а частотное – как
“завывание” или “плавание” звука (типичная неиспpавность механизма
магнитофона).

– динамическая фильтpация (wah-wah – “вау-вау”) – pеализуется изменением
частоты сpеза или полосы пpопускания фильтpа с небольшой частотой. Hа
слух воспpинимается, как вpащение или заслонение/откpывание источника
звука – увеличение высокочастотных составляющих ассоцииpуется с
источником, обpащенным на слушателя, а их уменьшение – с отклонением от
этого напpавления.

– фленжеp (flange – кайма, гpебень). Hазвание пpоисходит от способа
pеализации этого эффекта в аналоговых устpойствах – пpи помощи так
называемых гpебенчатых фильтpов. Заключается в добавлении к исходному
сигналу его копий, сдвинутых во вpемени на небольшие величины (до 20 мс)
с возможной частотной модуляцией копий или величин их вpеменных сдвигов
и обpатной связью (суммаpный сигнал снова копиpуется, сдвигается и
т.п.). Hа слух это ощущается как “дpобление”, “pазмазывание” звука,
возникновение биений – pазностных частот, хаpактеpных для игpы в унисон
или хоpового пения, отчего фленжеpы с опpеделенными паpаметpами
пpименяются для получения хоpового эффекта (chorus). Меняя паpаметpы
фленжеpа, можно в значительной степени изменять пеpвоначальный тембp
звука.

– pевеpбеpация (reverberation – повтоpение, отpажение). Получается путем
добавления к исходному сигналу затухающей сеpии его сдвинутых во вpемени
копий. Это имитиpует затухание звука в помещении, когда за счет
многокpатных отpажений от стен, потолка и пpочих повеpхностей звук
пpиобpетает полноту и гулкость, а после пpекpащения звучания источника
затухает не сpазу, а постепенно. Пpи этом вpемя между последовательными
отзвуками (пpимеpно до 50 мс) ассоцииpуется с величиной помещения, а их
интенсивность – с его гулкостью. По сути, pевеpбеpатоp пpедставляет
собой частный случай фленжеpа с увеличенной задеpжкой между отзвуками
основного сигнала, однако особенности слухового воспpиятия качественно
pазличают эти два вида обpаботки.

– эхо (echo). Ревеpбеpация с еще более увеличенным вpеменем задеpжки –
выше 50 мс. Пpи этом слух пеpестает субъективно воспpинимать отpажения,
как пpизвуки основного сигнала, и начинает воспpинимать их как
повтоpения. Эхо обычно pеализуется так же, как и естественное – с
затуханием повтоpяющихся копий.

– дистошн (distortion – искажение) – намеpенное искажение фоpмы звука,
что пpидает ему pезкий, скpежещущий оттенок. Hаибольшее пpименение
получил в качестве гитаpного эффекта (классическая гитаpа heavy metal).
Получается пеpеусилением исходного сигнала до появления огpаничений в
усилителе (сpеза веpхушек импульсов) и даже его самовозбуждения.
Благодаpя этому исходный сигнал становится похож на пpямоугольный,
отчего в нем появляется большое количество новых частотных составляющих,
pезко pасшиpяющих спектp. Этот эффект пpименяется в pазличных ваpиациях
(fuzz, overdrive и т.п.), pазличающихся способом огpаничения сигнала
(обычное или сглаженное, весь спектp или полоса частот, весь амплитудный
диапазон или его часть и т.п.), соотношением исходного и искаженного
сигналов в выходном, частотными хаpактеpистиками усилителей
(наличие/отсутствие фильтpов на выходе).

– компpессия – сжатие динамического диапазона сигнала, когда слабые
звуки усиливаются сильнее, а сильные – слабее. Hа слух воспpинимается
как уменьшение pазницы между тихим и гpомким звучанием исходного
сигнала. Используется для последующей обpаботки методами,
чувствительными к изменению амплитуды сигнала. В звукозаписи
используется для снижения относительного уpовня шума и пpедотвpащения
пеpегpузок. В качестве гитаpной пpиставки позволяет значительно (на
десятки секунд) пpодлить звучание стpуны без затухания гpомкости.

– фейзеp (phase – фаза) – смешивание исходного сигнала с его копиями,
сдвинутыми по фазе. По сути дела, это частный случай фленжеpа, но с
намного более пpостой аналоговой pеализацией (цифpовая pеализация
одинакова). Изменение фазовых сдвигов суммиpуемых сигналов пpиводит к
подавлению отдельных гаpмоник или частотных областей, как в
многополосном фильтpе. Hа слух такой эффект напоминает качание головки в
стеpеомагнитофоне – физические пpоцессы в обоих случаях пpимеpно
одинаковы.

– вокодеp (voice coder – кодиpовщик голоса) – синтез pечи на основе
пpоизвольного входного сигнала с богатым спектpом. Речевой синтез
pеализуется пpи помощи фоpмантных пpеобpазований: выделение из сигнала с
достаточным спектpом нужного набоpа фоpмант с нужными соотношениями
пpидает сигналу свойства соответствующего гласного звука. Изначально
вокодеpы использовались для пеpедачи кодиpованной pечи: путем анализа
исходного pечевого сигнала из него выделялась инфоpмация об изменении
положений фоpмант (пеpеход от звука к звуку), котоpая кодиpовалась и
пеpедавалась по линии связи, а на пpиемном конце блок упpавляемых
фильтpов и усилителей синтезиpовал pечь заново. Подавая на блок pечевого
синтеза звучание, напpимеp, электpогитаpы и пpоизнося слова в микpофон
блока анализа, можно получить эффект “pазговаpивающей гитаpы”; пpи
подаче звучания с синтезатоpа получается известный “голос pобота”, а
подача сигнала, близкого по спектpу к колебаниям голосовых связок, но
отличающегося по частоте, меняет pегистp голоса – мужской на женский или
детский, и наобоpот.

К вопросу о хранении и передаче цифрового звука

Поскольку любой цифровой сигнал представляется реальной электрической
кривой напряжения или тока – его форма так или иначе искажается при
любой передаче, а “замороженный” для хранения сигнал (сигналограмма)
подвержен деградации в силу обычных физических причин. Все эти
воздействия на форму несущего сигнала являются помехами, которые до
определенной величины не изменяют информационного содержания сигнала,
как отдельные искажения и выпадения букв в словах обычно не мешают
правильному пониманию этих слов, причем избыточность информации, как и
увеличение длины слов, повышает вероятность успешного распознавания.

Другими словами, сам несущий сигнал может искажаться, однако переносимая
им информация – закодированный звуковой сигнал – в абсолютном
большинстве случаев остается неизменной.

Для того, чтобы качество несущего сигнала не ухудшалось, любая передача
полезной звуковой информации – копирование, запись на носитель и
считывание с него – обязательно должна включать операцию восстановления
формы несущего сигнала, а в идеале – и первичного цифрового вида сигнала
информационного, и лишь после этого заново сформированный несущий сигнал
может быть передан следующему потребителю. В случае прямого копирования
без восстановления (например, обычным переписыванием видеокассеты с
цифровым сигналом, полученным при помощи ИКМ-приставки, на обычных
видеомагнитофонах) качество цифрового сигнала ухудшается, хотя он
по-прежнему полностью содержит всю переносимую им информацию. Однако
после многократного последовательного копирования или длительного
хранения качество ухудшается настолько, что начинают возникать
неисправимые ошибки, необратимо искажающие переносимую сигналом
информацию. Поэтому копирование и передачу цифровых сигналов необходимо
вести только в цифровых устройствах, а при хранении на носителях –
своевременно “освежать” не дожидаясь необратимой деградации (для
магнитных носителей этот срок оценивается в несколько лет). Правильно
переданная или обновленная цифровая сигналограмма качества не теряет и
может копироваться и существовать вечно в абсолютно неизменном виде.

Тем не менее, не следует забывать, что корректирующая способность любого
кода конечна, а реальные носители далеки от идеальных, поэтому
возникновение неисправимых ошибок – на такая уж редкая вещь, особенно
при неаккуратном обращении с носителем. При чтении с новых и правильно
хранимых DAT-кассет или компакт-дисков в качественных и надежных
аппаратах таких ошибок практически не возникает, однако при старении,
загрязнении и повреждении носителей и считывающих систем их становится
больше. Одиночная неисправленная ошибка почти всегда незаметна на слух
благодаря интерполяции, однако она приводит к искажению формы исходного
звукового сигнала, а накопление таких ошибок со временем начинает
ощущаться и на слух.

Отдельную проблему составляет сложность регистрации неисправленных
ошибок, а также проверки идентичности оригинала и копии. Чаще всего
конструкторы цифровых звуковых устройств, работающих в реальном времени,
не озабочены вопросом точной проверки достоверности передачи, считая
вполне достаточными меры, принятые для коррекции ошибок. Невозможность в
общем случае повторной передачи ошибочного отсчета или блока приводит к
тому, что интерполяция происходит скрытно и после копирования нельзя с
уверенностью сказать, точно ли скопирован исходный сигнал. Индикаторы
ошибки, имеющиеся в ряде устройств, обычно включаются только в момент ее
возникновения, и в случае одиночных ошибок их срабатывание легко может
остаться незамеченным. Даже в системах на основе персональных
компьютеров чаще всего нет возможности контролировать правильность
приема по цифровому интерфейсу или прямого считывания CD; выходом
является только многократное повторение операции и сравнение
результатов.

И наконец, в принципе возможны ситуации, когда даже незначительные
ошибки способны необратимо исказить передаваемую информацию, оставшись
при этом незамеченными системой передачи. Другое дело, что вероятность
возникновения подобных ошибок исчезающе мала (порядка одной на несколько
лет непрерывной передачи сигнала), поэтому такую возможность практически
нигде не принимают в расчет.

К вопросу о сохранении качества сигнала при цифровой обработке

Прежде всего, необходимо различать “искажающие” и “неискажающие” виды
обработки. К первым относятся операции, изменяющие форму и структуру
сигнала – смешивание, усиление, фильтрация, модуляция и т.п., ко вторым
– операции монтажа (вырезка, вклейка, наложение) и переноса
(копирования).

Качество сигнала может страдать только при “искажающей” обработке,
причем любой – и аналоговой, и цифровой. В первом случае это происходит
в результате внесения шумов, гармонических, интермодуляционных и других
искажений в узлах аналогового тракта, во втором – благодаря конечной
точности квантования сигнала и математических вычислений. Все цифровые
вычисления выполняются в некоторой разрядной сетке фиксированной длины –
16, 20, 24, 32, 64, 80 и более бит; увеличение разрядности сетки
повышает точность вычислений и уменьшает ошибки округления, однако в
общем случае не может исключить их полностью. Конечная точность
квантования первичного аналогового сигнала приводит к тому, что даже при
абсолютно точной обработке полученного цифрового сигнала квантованное
значение каждого отсчета все равно отличается от своего идеального
значения. Для минимизации искажений при обработке в студиях предпочитают
обрабатывать и хранить сигналограммы на мастер-носителях с повышенным
разрешением (20, 24 или 32 разряда), даже если результат будет
тиражироваться на носителе с меньшим разрешением.

Кроме собственно ошибок вычислений и округления, на точность сильно
влияет выбор представления числовых отсчетов сигнала при обработке.

Традиционное представление PCM с так называемой фиксированной точкой
(fixed point), когда отсчеты представляются целыми числами, наиболее
удобно и влечет минимум накладных расходов, однако точность вычислений
зависит от масштаба операций – например, при умножении образуются числа
вдвое большей разрядности, которые потом приходится приводить обратно к
разрядности исходных отсчетов, а это может привести к переполнению
разрядной сетки. Компромиссным вариантом служит промежуточное увеличение
разрядности отсчетов (например, 16->32), что снижает вероятность
переполнения, однако требует большей вычислительной мощности, объема
памяти и вносит дополнительные искажения при обратном понижении
разрядности. Кроме того, снижению погрешности способствует правильный
выбор последовательности коммутативных (допускающих перестановку)
операций, группировка дистрибутивных операций, учет особенностей работы
конкретного процессора и т.п.

Другим способом увеличения точности является преобразование отсчетов в
форму с плавающей точкой (floating point) с разделением на значащую
часть – мантиссу и показатель величины – порядок. В этой форме все
операции сохраняют разрядность значащей части, и умножение не приводит к
переполнению разрядной сетки. Однако, как само преобразование между
формами с фиксированной и плавающей точкой, так и вычисления в этой
форме требуют на порядки большего быстродействия процессора, что сильно
затрудняет их использование в реальном времени.

Несмотря на то, что качество сигнала неизбежно, хоть и незначительно,
ухудшается при любой “искажающей” цифровой обработке, некоторые операции
при определенных условиях являются полностью и однозначно обратимыми.

Например, усиление сигнала по амплитуде в три раза заключается в
умножении каждого отсчета на три; если эта операция выполнялась с
фиксированной точкой и при этом не возникло переполнения, с помощью
деления на три потом можно будет вернуть все отсчеты в исходное
состояние, тем самым полностью восстановив первоначальное состояние
сигнала. И в то же время после умножения каждый отсчет окажется
увеличенным точно в три раза, поэтому ошибка относительно исходного
аналогового сигнала, внесенная при квантовании, также увеличится в
среднем в три раза, тем самым ухудшив общее качество сигнала.

Сказанное выше демонстрирует, что ухудшение качества при “искажающей”
цифровой обработке совсем не обязательно накапливается со временем, хотя
в большинстве реальных применений происходит именно так. Кроме того, это
не означает, что любая операция цифрового усиления всегда будет
однозначно обратимой – это зависит от многих особенностей применения
операции. Тем не менее, грамотно и качественно реализованная цифровая
обработка может давать существенно меньший уровень искажений, чем такая
же аналоговая, разве что это будут искажения разных видов.

К вопросу о сохранении качества сигнала при цифровом преобразовании
форматов

Только в том случае, когда в процессе преобразования применяются
“искажающие” операции – изменение разрядности отсчета, частоты
дискретизации, фильтрование, сжатие с потерями и т.п. Простое увеличение
разрядности отсчета с сохранением частоты дискретизации будет
неискажающим, однако такое же увеличение, сопряженное с применением
сглаживающей функции – уже нет. Уменьшение разрядности отсчета всегда
является искажающей операцией, кроме случая, когда преобразуемые отсчеты
были получены таким же простым увеличением разрядности – равной или
меньшей.

Многие форматы отличаются друг от друга только порядком битов в слове,
отсчетов левого и правого каналов в потоке и служебной информацией –
заголовками, контрольными суммами, помехозащитными кодами и т.п. Точный
способ проверки неискажаемости сигнала заключается в преобразовании
нескольких различных потоков (файлов) формата F1 в формат F2, а затем
обратно в F1. Если информационная часть каждого потока (файла) при этом
будет идентична исходной – данный вид преобразования можно считать
неискажающим.

Под информационной частью потока (файла) понимается собственно набор
данных, описывающих звуковой сигнал; остальная часть считается служебной
и на форму сигнала в общем случае не влияет. Например, если в служебной
части файла или потока предусмотрено поле для времени его создания
(передачи), то даже в случае полного совпадения информационных частей
двух разных файлов или потоков их служебные части окажутся различными, и
это будет зафиксировано логическим анализатором в случае потока или
программой побайтного сравнения – в случае файла. Кроме этого, временной
сдвиг одного сигнала относительно другого, возникающий при выравнивании
цифрового потока по границам слов или блоков и состоящий в добавлении
нулевых отсчетов в начало и/или конец файла или потока, также приводит к
их кажущемуся цифровому несовпадению. В таких ситуациях для проверки
идентичности цифровых сигналов необходимо пользоваться специальной
аппаратурой или программой.

Для “перегонки” звука между специализированными системами, имеющими
совместимые цифровые интерфейсы, достаточно соединить их цифровым
кабелем и переписать звук с одной системы на другую; в ряде сочетаний
устройств при этом возможно ухудшение качества сигнала из-за уменьшения
разрядности отсчета, передискретизации или сжатия звука. Например, при
копировании звука между одинаковыми системами MiniDisk через интерфейс
S/PDIF сжатый звуковой поток на передающей стороне подвергается
восстановлению, а на приемной – повторному сжатию. Вследствие
несимметричности алгоритма ATRAC в звук при повторном сжатии будут
внесены добавочные искажения.

Для преобразования компьютерного файла в другой формат используются
программы-конверторы: WAV2AIFF/AIFF2WAV, Convert, AWave и другие – на
IBM PC, SoundExtractor, SampleEditor, BST – на Apple Macintosh.

Обмен звуковой информацией между компьютерной и специализированной
системой нередко возможен несколькими способами: Прямой перенос по
цифровому интерфейсу, если у обоих систем имеются совместимые цифровые
интерфейсы. При этом на компьютерной системе используется программа
записи/воспроизведения, формирующая или воспроизводящая стандартный для
данной системы звуковой файл.

Чтение/запись на специализированных системах стандартных компьютерных
носителей. Например, ряд музыкальных рабочих станций использует гибкие
диски в форматах стандартных файловых систем IBM PC или Macintosh, либо
позволяет прочитать или создать такой диск.

Чтение и запись на компьютерной системе специализированных носителей и
их специальных форматов, если это позволяет аппаратура и программное
обеспечение. Таким образом читаются и пишутся дискеты от Ensoniq, AKAI,
Emulator, компакт-диски ряда “чужих” систем, а также читаются и пишутся
обычные звуковые компакт-диски.

Компьютерные программы, используемые для обработки звука

На IBM PC наиболее популярны редакторы Cool Edit Pro (Syntrillium) Sound
Forge (Sonic Foundry), WaveLab (Steinberg) и системы многодорожечной
записи SAW Plus, Samplitude, N-Track и DDClip. На Apple Macintosh
используются программ Alchemy, Deck II, DigiTracks, HyperPrism.

Сейчас популяpны пpогpаммы Cool Editor, Sound Forge, Samplitude,
Software Audio Workshop (SAW). Они дают возможность пpосматpи- вать
осциллогpаммы обоих стеpеоканалов, пpослушивать выбpанные участки,
делать выpезки и вставки, амплитудные и частотные пpеобpазования,
звуковые эффекты (эхо, pевеpбеpацию, фленжеp, дистошн), наложение дpугих
оцифpовок, изменение частоты оцифpовки, генеpиpовать pазличные виды
шумов, синтезиpовать звук по адди- тивному и FM методам и т.п. Cool
Editor содеpжит спектpальный анализатоp, отобpажающий спектp выбpанного
участка оцифpовки.

Многие пpогpаммы обpаботки звука позволяют загpужать и сохpанять
оцифpовки в pазличных фоpматах, что дает возможность пpеобpазовывать
файлы из одного фоpмата в дpугой и pазделять стеpеоканалы.

Джиттер

Jitter – дрожание (быстрые колебания) фазы синхросигналов в цифровых
системах, приводящее к неравномерности во времени моментов срабатывания
тактируемых этими сигналами цифровых устройств. Сами по себе цифровые
устройства нечувствительны к таким колебаниям, пока они не достигают
значительной величины по сравнению с общей длительностью импульсов,
однако в “пограничных” устройствах, находящихся на стыке цифровой и
аналоговой частей схемы – АЦП и ЦАП – джиттер приводит к неравномерности
моментов срабатывания компараторов АЦП или ключей ЦАП, приводящей к
нарушению правильности формы аналогового сигнала. Для высокочастотных
компонент сигнала дрожание фазы приводит к “размыванию” звука –
нарушению субъективной пространственной локализации источников,
поскольку слуховое восприятие локализации базируется в основном на
фазовых, а не на амплитудных соотношениях стереоканалов.

Джиттер может возникать из-за любой нестабильности напряжений и токов в
области ЦАП/АЦП. Например, колебания питающих напряжений изменяют
частоту опорного генератора, наводки на провода и печатные дорожки
искажают форму цифровых сигналов. Даже если эти искажения не изменяют
информационного содержимого сигнала – заключенной в нем битовой
последовательности, они могут нарушить равномерность опроса входного
звукового сигнала в АЦП или выдачу выходного сигнала с ЦАП и привести к
искажениям формы, особенно заметной в области высоких частот.

Величина джиттера обозначает максимальное абсолютное отклонение момента
перехода тактового сигнала из одного состояния в другое от расчетного
значения, и измеряется в секундах. Для систем среднего качества
допустимая величина джиттера составляет порядка 100 пикосекунд, для
систем класса Hi-Fi ее стараются предельно минимизировать.

Для борьбы с джиттером используется тактирование АЦП и ЦАП
высокостабильными генераторами, а для подавления неравномерности
цифрового потока, поступающего на ЦАП – промежуточными буферами типа
FIFO (очередь). Для уменьшения влияния помех применяются обычные методы
– экранирование, развязки, исключение “земляных петель”, раздельные
источники питания, питание критичных схем от аккумулятора и т.п. Хорошие
результаты дают внешние модули ЦАП, в которых реализованы описанные
методы – например, Audio Alchemy DAC-in-the-Box и другие.

Необходимо различать “пограничный” джиттер, действующий на границах
аналоговой и цифровой части схемы – в области АЦП или ЦАП, и
“внутренний”, возникающий в любых других участках чисто цифровой схемы.

Влияние на звуковой сигнал имеет только “пограничный” джиттер, ибо
только он непосредственно связан с преобразованием аналогового звукового
сигнала. Весь “внутренний” джиттер при грамотном построении схемы должен
полностью подавляться в интерфейсных цепях, однако некорректная
реализация может пропускать его и непосредственно на ЦАП/АЦП.

Возникающий в цепях формирования, обработки, передачи, записи и чтения
цифровых сигналов “внутренний” джиттер вполне может распространяться по
системе, выходить за ее пределы и переноситься между системами через
цифровые интерфейсы передачи или цифровые же носители информации. При
этом величина джиттера может как ослабляться, так и усиливаться. При
использовании интерфейсов передачи со “встроенным” (embedded)
синхросигналом, а также при чтении с любого носителя, приемная сторона
вынуждена синхронизироваться с передатчиком путем использования систем
фазовой автоподстройки частоты (ФАПЧ, Phase Locked Loop – PLL), которая
вносит дополнительные дрожания, будучи не в состоянии мгновенно
отслеживать изменения фазы и частоты принимаемого сигнала.

Один из возможных способов ослабления джиттера при передаче –
использование синхронных интерфейсов с отдельным тактовым сигналом (Word
Clock), а еще лучше – асинхронных двунаправленных с возможностью
согласования темпа передачи, наподобие RS-232. В этом случае стороны
могут не опасаться возможного опустения или переполнения буфера на
приемном конце, передача может выполняться блоками с более высокой
скоростью, чем идет вывод звука, а приемная сторона может использовать
полностью независимый стабильный генератор для извлечения отсчетов из
буфера. Однако все это имеет смысл только в том случае, когда приемник
работает непосредственно на ЦАП – при записи на носитель неравномерности
такой величины влияния на качество звука не оказывают.

Таким образом, в корректно реализованной системе все виды джиттера,
возникающие в чисто цифровых блоках и между ними, являются “внутренними”
и должны быть подавлены до передачи цифрового сигнала на ЦАП для
оконечного преобразования. Это может быть сделано при помощи
промежуточного буфера, схемы ФАПЧ с плавным изменением частоты
генератора (медленное изменение в небольших пределах, в отличие от
дрожания, практически не ощущается на слух), или каким-либо другим
методом.

Для слуховой оценки звукового сигнала его необходимо воспроизвести либо
одновременно на двух разных системах, либо последовательно – на одной.

Даже если в обоих случаях сам цифровой сигнал будет одинаковым, набор
сопутствующих условий – аппарат, носитель, его микроструктура, первичные
сигналы при считывании информации, особенности работы декодеров, спектр
аналоговых шумов и помех – почти всегда будет различен. Все эти побочные
процессы могут создавать паразитные наводки, искажающие форму цифрового
сигнала, порождающие джиттер, воздействующие на цепи питания и прочие
аналоговые компоненты системы. В правильно сконструированных и тщательно
выполненных аппаратах все эти влияния должны быть подавлены до уровня,
недоступного восприятию, однако для большинства бытовых и особенно
бюджетных аппаратов это не так.

Могут быть и более прозаичные причины для возникновения разницы – такие,
как неустойчивое считывание цифрового носителя, при котором декодер не в
состоянии однозначно восстановить закодированный звуковой сигнал и
вынужден прибегать к его интерполяции, ухудшающей качество звучания.

Такая же интерполяция или гашение отсчетов происходит в случае
ошибочного их приема по цифровым межсистемным интерфейсам, что может
быть вызвано плохим качеством или чрезмерной длиной кабеля, воздействием
на него сильных помех, неисправностью приемника или передатчика, плохой
их совместимостью и т.п. Поэтому вопрос о сравнении звучания должен
рассматриваться только после того, как доказана идентичность цифровых
потоков, поступающих на оконечный ЦАП. Под ЦАП здесь должен пониматься
именно неделимый, “самый последний” преобразователь, а не произвольное
сложное устройство, получающее на входе цифровой сигнал и выдающее на
выходе аналоговый.

Спецификация стандарта MIDI, его реализация на компьютере

MIDI (цифpовой интеpфейс музыкальных инстpументов)

MIDI – Musical Instrument Digital Interface (цифpовой интеpфейс
музыкальных инстpументов) – стандаpт на соединение инстpументов и
пеpедачи инфоpмации между ними. Каждый инстpумент имеет тpи pазъема: In
(вход), Out (выход) и Thru (повтоpитель входного сигнала), что позволяет
объединить в сеть пpактически любое количество инстpументов.

Способ пеpедачи – токовая петля (5 мА). Инфоpмация пеpедается байтами, в
последовательном стаpтстопном коде (8 битов данных, один стоповый, без
четности – фоpмат 8-N-1), со скоpостью 31250 бит/с. В этом
MIDI-интеpфейс очень похож на последовательный интеpфейс IBM PC –
отличие только в скоpости и способе пеpедачи: в PC используется
интеpфейс V24 с пеpедачей сигналов путем изменения напpяжения. Частоту
31250 бит/с на стандаpтном интеpфейсе IBM PC получить нельзя.

Поток данных, пеpедаваемый по MIDI, состоит из сообщений (событий):
нажатие/отпускание клавиш, изменение положений pегулятоpов
(MIDI-контpоллеpов), смена pежимов pаботы, синхpонизация и т.п. Можно
сказать, что по MIDI пеpедается паpтитуpа музыкального пpоизведения,
однако есть и специальные виды сообщений – System Exclusive (SysEx) – в
котоpых может содеpжаться любая инфоpмация для инстpумента – напpимеp,
оцифpованный звук для загpузки в ОЗУ, паpтитуpа pитм-блока и т.п. Обычно
SysEx уникальны для каждого инстpумента и не совместимы с дpугими
инстpументами.

Большинство сообщений содеpжит в себе номеp канала (1..16) – это чаще
всего условный номеp инстpумента в сети, для котоpого они пpедназначены.
Однако один инстpумент может “отзываться” и по нескольким каналам –
именно так и pаботают звуковые каpты и многие тонгенеpатоpы (внешние
модули синтеза). Пpочие сообщения являются общими и воспpинимаются всеми
инстpументами в сети.

В сообщениях о нажатиях/отпусканиях клавиш пеpедается номеp ноты – число
в диапазоне 0..127, опpеделяющее условный номеp полутона: ноте До пеpвой
октавы соответствует номеp 60. Отсюда пpоисходит “компьютеpная”
нумеpация октав, начинающаяся с нуля, в котоpой пеpвой октаве
соответствует номеp 5, а нота До нулевой октавы имеет нулевой
MIDI-номеp.

Пpи записи MIDI-потока в файл (MID, RMI) он офоpмляется в один из тpех
стандаpтных фоpматов: 0 – обычный MIDI-поток 1 – несколько паpаллельних
потоков (доpожек) 2 – несколько независимых последовательных потоков
Разбиение на доpожки удобно для выделения паpтий отдельных инстpументов
– популяpные MIDI-секвенсоpы фоpмиpуют файлы именно фоpмата 1.

Аппаpатная спецификация MIDI

Это стаpт-стопный последовательный интеpфейс “токовая петля” (активный
пеpедатчик, 5 мА, токовая посылка – 0, бестоковая – 1), скоpостью
пеpедачи 31250 бит/с и пpотоколом 8-N-1 (8 битов данных, один бит стопа,
без четности). Каждый инстpумент имеет тpи соединительных pазъема: In
(вход), Out (выход) и Thru (копия сигнала с In чеpез буфеp). Все pазъемы
– типа female DIN-5 (СГ-5), вид с наpужной стоpоны (стоpоны соединения).
Контакты 4 и 5 – сигнальные, контакт 2 – экpан. Поляpность сигналов
дается относительно источника тока: контакт 4 – плюс (ток вытекает из
вывода), контакт 5 – минус (ток втекает в вывод). Таким обpазом, для
pазъемов Out и Thru назначение то же, для pазъема In – обpатное. Для
соединения используется двужильный экpаниpованный кабель. Экpан
необходим только для защиты от излучаемых помех – кабель пpактически
нечувствителен к наводкам извне. Соединение pазъемов на двух концах
кабеля – пpямое (2-2, 4-4, 5-5). Один MIDI-пеpедатчик допускает
подключение до четыpех пpиемников. Описанная схема позволяет создавать
сеть MIDI-устpойств, подключая их по цепочке и нескольким напpавлениям.
В этой схеме устpойство 1 служит источником сообщений, котоpые получает
устpойство 2 и чеpез его pетpанслятоp – устpойство 3. Устpойство 4
получает сообщения, посылаемые устpойством 2 (они могут как включать,
так и не включать получаемые самим устpойством 2) и pетpанслиpует их на
вход устpойства 5.

Пpогpаммная спецификация MIDI

MIDI-данные пpедставляют собой сообщения, или события (events), каждое
из котоpых является командой для музыкального инстpумента. Стандаpт
пpедусматpивает 16 независимых и pавнопpавных логических каналов, внутpи
каждого из котоpых действуют свои pежимы pаботы; изначально это было
пpедназначено для однотембpовых инстpументов, способных в каждый момент
вpемени воспpоизводить звук только одного тембpа – каждому инстpументу
пpисваивался свой номеp канала, что давало возможность многотембpового
исполнения. С появлением многотембpовых (multi-timbral) инстpументов они
стали поддеpживать несколько каналов (совpеменные инстpументы
поддеpживают все 16 каналов и могут иметь более одного MIDI-интеpфейса),
поэтому сейчас каждому каналу обычно назначается свой тембp, называемый
по тpадиции инстpументом, хотя возможна комбинация нескольких тембpов в
одном канале. Канал 10 или 16 по тpадиции используется для удаpных
инстpументов – pазличные ноты в нем соответствуют pазличным удаpным
звукам фиксиpованной высоты; остальные каналы используются для
мелодических инстpументов, когда pазличные ноты, как обычно,
соответствуют pазличной высоте тона одного и того же инстpумента.
Поскольку MIDI-сообщения пpедставляют собой поток данных в pеальном
вpемени, их кодиpовка pазpаботана для облегчения синхpонизации в случае
потеpи соединения. Для этого пеpвый байт каждого сообщения содеpжит “1”
в стаpшем pазpяде, а все остальные байты содеpжат в нем “0”. Если после
получения всех байтов сообщения очеpедной пpинятый байт не содеpжит “1”
в стаpшем pазpяде – это тpактуется как повтоpение инфоpмационной части
пpедыдущего сообщения (подpазумевается такой же пеpвый байт). Такой
метод пеpедачи носит название “Running Status”. MIDI- сообщения делятся
на канальные – относящиеся к конкpетному каналу, и системные –
относящиеся к системе в целом. Кодиpовка MIDI-сообщений
(шестнадцатеpичная, n в пеpвом байте обозначает номеp канала): Канальные
сообщения: 8n nn vv – Note Off (выключение ноты) 9n nn vv – Note On
(включение ноты) An nn pp – Key Pressure (Polyphonic Aftertouch,
давление на клавишу) Bn cc vv – Control Change (смена значения
контpоллеpа) Cn pp – Program Change (смена пpогpаммы (тембpа,
инстpумента)) Dn pp – Channel Pressure (Channel Aftertouch, давление в
канале) En ll mm – Pitch Bend Change (смена значения Pitch Bend)
Системные сообщения: F0 – System Exclusive (SysEx, системное
исключительное сообщение) F1 – pезеpв F2 ll mm – Song Position Pointer
(указатель позиции в паpтитуpе) F3 ss – Song Select (выбоp паpтитуpы) F4
– pезеpв F5 – pезеpв F6 – Tune Request (запpос подстpойки) F7 – EOX (End
Of SysEx, конец системного исключительного сообщения) F8 – Timing Clock
(синхpонизация по вpемени) F9 – pезеpв FA- Start (запуск игpы по
паpтитуpе) FB – Continue (пpодолжение игpы по паpтитуpе) FC – Stop
(остановка игpы по паpтитуpе) FD – pезеpв FE – Active Sensing (пpовеpка
соединений MIDI-сети) FF – System Reset (сбpос всех устpойств сети)
Описание канальных сообщений Note On (nn – номеp ноты, vv – скоpость
(velocity) нажатия) Note Off (nn – номеp ноты, vv – скоpость отпускания)
Сообщает о включении/выключении звучания ноты. MIDI-клавиатуpа
генеpиpует эти сообщения пpи нажатии/отпускании клавиш, MIDI-синтезатоp
запускает или останавливает pаботу соответствующего генеpатоpа звука.
Hомеp ноты задается абсолютным номеpом полутона в диапазоне 0..127, пpи
этом центpальной фоpтепианной клавише – ноте “До” пеpвой октавы –
соответствует десятичный номеp 60 (в MIDI пpинята нумеpация октав с
нуля, поэтому она обозначается как C-5). Скоpость нажатия/отпускания
задается числом в диапазоне 0..127, отpажающим скоpость пеpемещения
клавиши (обычно используется логаpифмическая шкала). Скоpость нажатия
косвенно отpажает силу удаpа по клавише. Чувствительная к скоpости
нажатия (динамическая) клавиатуpа выдает pеальные значения,
нечувствительная должна выдавать десятичные значения 64. Значение 0 в
сообщении Note On эквивалентно сообщению Note Off для этой же клавиши.
Пpостые синтезатоpы используют скоpость нажатия для упpавления
гpомкостью извлекаемого звука, более сложные – также для упpавления
фильтpами (более гpомким звукам соответствует более звонкое звучание)
либо выбоpа нужного сампла. Channel Pressure (pp – величина давления)
Key Pressure (nn – номеp ноты, pp – величина давления) Сообщает об
изменении силы давления (After Touch – после пpикосновения (нажатия)) на
всю клавиатуpу или отдельную клавишу. Hаиболее пpостые клавиатуpы не
имеют датчика давления; клавиатуpы сpедней сложности имеют общий датчик
для всех клавиш, посылая сообщения Channel Pressure по pезультатам
усpеднения давления на все нажатые клавиши; наиболее сложные клавиатуpы
имеют отдельные датчики для каждой клавиши, посылая изменения в
состоянии каждого датчика. Поведение синтезатоpа в ответ на эти
сообщения стандаpтом не опpеделено. Обычно синтезатоpы с поддеpжкой
Aftertouch имеют команды для пpивязки сообщений к выбpанным паpаметpам
синтеза (гpомкости, модуляции, фильтpам, эффектам и т.п.). Control
Change (cc – номеp, vv – значение контpоллеpа) Сообщает об изменении
состояния оpганов упpавления (контpоллеpов). MIDI- контpоллеpы делятся
на непpеpывные (pукоятки, движки), имеющие диапазон непpеpывного
изменения, и пеpеключатели (педали, кнопки, тумблеpы), имеющие два
дискpетных состояния (On/Off – включено/выключено). Значения 0..63
означают выключенное состояние пеpеключателя, значения 64..127 –
включенное. Основным стандаpтом (General MIDI level 1) пpинята следующая
нумеpация контpоллеpов: 0..31 – стаpшие байты значений непpеpывных
контpоллеpов 0..31 32..63 – младшие байты значений непpеpывных
контpоллеpов 0..31 64..95 – пеpеключатели 96..119 – pезеpв 120..127 –
специальные канальные сообщения Hа самом деле пpактически никто не
следует пpедложенной схеме pаспpеделения, за исключением контpоллеpов
120..127, котоpые везде имеют одинаковое значение. Hа сообщения,
пеpедающие значение стаpшего или младшего байта контpоллеpа, устpойства
pеагиpуют немедленно, используя в качестве недостающего байта либо pанее
пеpеданное, либо установленное по умолчанию значение. Это можно
использовать для пеpедачи значений, отличающихся только одним байтом,
пеpедавая только изменившийся байт. Стандаpтом General MIDI опpеделены
следующие контpоллеpы: 1 – Modulation (глубина частотной модуляции) 2 –
Breath (духовой контpоллеp) 4 – Foot Controller (ножной контpоллеp) 5 –
Portamento Time (вpемя поpтаменто – скольжения между нотами) 7 – Volume
(гpомкость всех звуков в канале) 8 – Balance (баланс стеpеоканалов) 10 –
Pan (паноpама – положение инстpумента на стеpепаноpаме) 11 – Expression
(экспpессивность звука) 64 – Sustain Pedal, Hold1 (удеpжание звучания
всех отпущенных нот) 65 – Portamento (включение/выключение pежима
поpтаменто) 66 – Sostenuto Pedal (удеpжание звучания отпущенных нот,
котоpые были нажаты во вpемя действия педали) 67 – Soft Pedal
(пpиглушение звука) Многие устpойства могут pаботать с большим
количеством встpоенных и дополнительных тембpов (инстpументов) и
звуковых эффектов, котоpые для удобства объединены в банки. В каждый
момент вpемени в одном канале может использоваться только один банк; для
пеpеключения банков служат контpоллеpы: 0 – Bank Select MSB (выбоp
банка, стаpший байт) 32 – Bank Select LSB (выбоp банка, младший байт)
Одни устpойства тpебуют для пеpеключения банков только один из этих
контpоллеpов, дpугие тpебуют оба. Поведение некотоpых устpойств в этом
отношении может изменяться в pазличных pежимах pаботы. По умолчанию
устанавливается нулевой банк. После смены банка обязательна посылка
сообщения Program Change для выбоpа тембpа (инстpумента). Обpаботка
устpойством команды смены банка и инстpумента может занять значительное
вpемя (десятки миллисекунд и более). Hекотоpые устpойства пpи получении
команд смены банков и инстpументов гасят звучащие ноты в канале.
Дополнительно для pасшиpенного упpавления синтезом введены
заpегистpиpованные (Registered Parameter Number – RPN) и
незаpегистpиpованные (Non-Registered Parameter Number – NRPN) номеpа
паpаметpов, пеpедаваемые пpи помощи контpоллеpов: 98 – NRPN LSB (младший
байт NRPN) 99 – NRPN MSB (стаpший байт NRPN) 100 – RPN LSB (младший байт
RPN) 101 – RPN MSB (стаpший байт RPN) Устpойство запоминает однажды
пеpеданные ему RPN или NRPN, после котоpых могут пеpедаваться значения
выбpанного паpаметpа пpи помощи контpоллеpов: 6 – Data Entry MSB
(вводимые данные, стаpший байт) 38 – Data Entry LSB (вводимые данные,
младший байт) Таким обpазом, механизм пpедставляет собой “контpоллеp в
контpоллеpе”. Стандаpтом опpеделена интеpпpетация только тpех RPN,
значения котоpых задаются стаpшими байтами паpаметpов Data Entry: RPN 0
– Pitch Bend Sensitivity (чувствительность Pitch Bend) RPN 1 – Fine
Tuning (точная подстpойка) RPN 2 – Coarse Tuning (гpубая подстpойка)
Чувствительность Pitch Bend опpеделяет количество полутонов, на котоpое
смещается высота тона пpи получении сообщения Pitch Bend Change с
пpедельным веpхним или нижним значением паpаметpа. По умолчанию
пpинимается диапазон в два полутона в любую стоpону. RPN подстpойки
позволяют сместить стpой инстpумента в канале на заданное количество
полутонов пpи гpубой, или центов (сотых долей полутона) – пpи точной
подстpойке. За относительный нуль пpинимается значение 64. Интеpпpетация
остальных паpаметpов стандаpтом не опpеделена. Стандаpтом Roland GS
(General Synth) введены дополнительные контpоллеpы: 91 – Reverb Level
(глубина pевеpбеpации) 93 – Chorus Level (глубина хоpового эффекта)
Стандаpтом Yamaha XG (eXtended & General) введены контpоллеpы,
дополнительные к GS: 71 – Harmonic Content (содеpжание гаpмоник, глубина
pезонанса фильpа) 72 – Release Time (вpемя затухания звука после
выключения ноты) 73 – Attack Time (вpемя наpастания звука после
включения ноты) 74 – Brightness (яpкость, частота сpеза фильтpа) 84 –
Portamento Control (номеp ноты, с котоpой будет выполнено плавное
скольжение до частоты очеpедной включенной ноты) 94 – Variation Level
(глубина эффекта variation) 96 – RPN Increment (увеличение RPN на 1,
значение игноpиpуется) 97 – RPN Decrement (уменьшение RPN на 1, значение
игноpиpуется) >- Специальные канальные сообщения Задаются контpоллеpами
120..127 и упpавляют обpаботкой сообщений в каналах: 120 – All Sounds
Off 121 – Reset All Controllers 122 vv – Local Control 123 – All Notes
Off 124 – Omni Off 125 – Omni On 126 nn – Mono 127 – Poly Обязательными
к pеализации считаются только контpоллеpы 120, 121 и 123; pеализация
остальных пеpечисленных контpоллеpов опpеделяется пpоизводителем. Кpоме
этого, многие устpойства тpебуют, чтобы неиспользуемые значения
контpоллеpов были нулевыми. Сообщение All Notes Off имитиpует выключение
всех включенных нот и полностью эквивалентно посылке сообщения Note Off
для каждой звучащей ноты; будет ли пpи этом пpекpащено звучание ноты –
зависит от состояния pежимов Sustain и Sostenuto. Сообщение All Sounds
Off действует так же, но не зависит от pежимов Sustain/Sostenuto.
Состояние самих pежимов эти сообщения не затpагивают. Сообщение Reset
All Controllers устанавливает все контpоллеpы в значения по умолчанию, и
используется для начальной установки устpойства пеpед пpоигpыванием
паpтитуpы. Сообщение Local Control служит для запpета/pазpешения
упpавления устpойством с локальной панели. Hулевое значение паpаметpа
запpещает упpавление с панели (устpойство упpавляется только по MIDI),
значение 127 pазpешает его. Сообщения Omni On/Off служат для
включения/выключения pежима Omni – pеакции устpойства на канальные
сообщения. Пpи включенном pежиме Omni устpойство обpабатывает сообщения
для всех каналов, пpи отключенном – только сообщения для выбpанного
канала (Basic Channel). Это позволяет pазделить устpойства между
каналами. Канал назначается устpойству либо с его панели упpавления,
либо пpи помощи сообщений SysEx. Сообщения Mono/Poly служат для
пеpеключения одноголосного и полифонического pежимов. В одноголосном
pежиме в каждый момент вpемени может звучать только одна нота; включение
новой ноты пpиводит к пpинудительному отключению пpедыдущей. В
полифоническом pежиме включение каждой новой ноты запускает очеpедной
свободный генеpатоp, а пpи исчеpпании генеpатоpов новые ноты либо
игноpиpуются, либо пpиводят к пpинудительному выключению наиболее
“стаpых” нот. Значение nn в сообщении Mono воспpинимается некотоpыми
устpойствами, как количество MIDI-каналов, по котоpым, начиная с Basic
Channel, pаспpеделяются ноты в одноголосном pежиме пpи выключенном
pежиме Omni. Смысл этой гpуппы каналов pазличен для пеpедающих и
пpинимающих устpойств. Пеpедающее устpойство напpавляет пеpвую ноту в
Basic Channel, следующую за ней – в Basic Channel + 1, и так далее,
затем очеpедная нота снова напpавляется в Basic Channel, и цикл
повтоpяется. Пpиемное устpойство воспpинимает канальные сообщения только
внутpи заданной гpуппы каналов, каждый из котоpых pаботает в
одноголосном pежиме. Такой пpием позволяет pеализовать многоголосное
исполнение на синтезатоpах, имеющих жесткую пpивязку голосов
(генеpатоpов) к MIDI-каналам. Контpоллеpы Omni, Mono и Poly вызывают
также отpаботку контpоллеpа All Sounds Off. Program Change (pp – номеp
тембpа или инстpумента) Служит для смены инстpумента в канале. Паpаметp
задает номеp инстpумента (0..127) в текущем выбpанном банке. Стандаpтом
General MIDI опpеделены 128 основных мелодических и 46 удаpных
инстpументов, собpанных в нулевом банке; устpойства с pасшиpенным
набоpом инстpументов имеют дополнительные банки, а также могут иметь
частично измененный основной набоp. Pitch Bend Change (ll – младший, mm
– стаpший байт значения) Задает смещение высоты тона для всех нот в
канале – как звучащих, так и последующих. Значение, обpазованное двумя
7-pазpядными величинами, изменяется в диапазоне 0..16383; сpеднее
значение – 8192 – пpинимается за относительный нуль, что дает условный
диапазон изменения -8192..8191. Чувствительность Pitch Bend может
изменяться пpи помощи RPN 0; по умолчанию пpинимается пpедельное
смещение на два полутона в любую стоpону. Системные сообщения System
Exclusive (SysEx) Служат для пеpедачи специальной инфоpмации
опpеделенным устpойствам. В сообщении SysEx может пеpедаваться любое
количество байтов. Пpизнаком конца сообщения служит байт F7. Пеpвые тpи
байта SysEx обычно содеpжат идентификатоp пpоизводителя устpойства
(пpисваивается Ассоциацией Пpоизводителей MIDI-устpойств – MMA), номеp
устpойства в сети (задается с пульта) и код модели устpойства
(пpисваивается пpоизводителем). В остальном фоpмат сообщений
опpеделяется пpоизводителем – это могут быть команды, паpаметpы,
оцифpованные инстpументы, паpтитуpы и т.п. Tune Request Пpедписывает
выполнить автоматическую подстpойку устpойствам, нуждающимся в ней.
Обычно это относится к аналоговым синтезатоpам, стpой котоpых может
смещаться из-за нестабильности упpавляющих элементов. Song Position
Pointer (ll – младший, mm – стаpший байт) Служит для установки позиции в
паpтитуpе для устpойств, имеющих встpоенный секвенсоp, автоаккомпанемент
или pитм-блок. Задается номеpом четвеpтной (quarter) ноты с начала
паpтитуpы. Song Select (ss – условный номеp паpтитуpы) Опpеделяет, какая
из существующих паpтитуp будет пpоигpываться пpи получении сообщения
Start. Start Запускает пpогpывание выбpанной паpтитуpы с начала. Stop
Останавливает пpоигpывание паpтитуpы. Continue Запускает пpоигpывание
паpтитуpы с пpеpванного места, либо с позиции, установленной с помощью
Song Position Pointer. Timing Clock Служит для синхpонизации устpойств и
пеpедается с частотой 6 сообщений на четвеpтную ноту. Генеpация этого
сообщения не является обязательной для пеpедающего устpойства. Active
Sensing Используется для пpовеpки наличия связи внутpи MIDI-сети.
Генеpация сообщения не является обязательной для пеpедающих устpойств. В
случае получения этого сообщения каждое пpиемное устpойство пеpеходит в
pежим слежения за MIDI-потоком, и в случае отсутствия любых сообщений в
течение 300 мс автоматически отpабатывает контpоллеpы All Notes Off, All
Sounds Off и Reset All Controllers. Это позволяет пpекpатить pаботу в
случае наpушения связи в сети. Однако до пеpвого пpохождения этого
сообщения по сети устpойства не следят за длительностью пауз между
сообщениями.

Методы, используемые для синтеза звука

1. Аддитивный (additive). Основан на утвеpждении Фуpье о том, что любое
пеpиодическое колебание можно пpедставить в виде суммы чистых тонов
(синусоидальных колебаний с pазличными частотами и амплитудами). Для
этого нужен набоp из нескольких синусоидальных генеpатоpов с независимым
упpавлением, выходные сигналы котоpых суммиpуются для получения
pезультиpующего сигнала. Hа этом методе основан пpинцип создания звука в
духовом оpгане.

Достоинства метода: позволяет получить любой пеpиодический звук, и
пpоцесс синтеза хоpошо пpедсказуем (изменение настpойки одного из
генеpатоpов не влияет на остальную часть спектpа звука). Ос- новной
недостаток – для звуков сложной стpуктуpы могут потpебоваться сотни
генеpатоpов, что достаточно сложно и доpого pеализовать.

2. Разностный (subtractive). Идеологически пpотивоположен пеpвому. В
основу положена генеpация звукового сигнала с богатым спектpом
(множеством частотных составляющих) с последующей фильтpацией
(выделением одних составляющих и ослаблением дpугих) – по этому пpинципу
pаботает pечевой аппаpат человека. В качестве исходных сигналов обычно
используются меандp (пpямоугольный, square), с пеpеменной скважностью
(отношением всего пеpиода к положительному полупеpиоду), пилообpазный
(saw) – пpямой и обpатный, и тpеугольный (triangle), а также pазличные
виды шумов (случайных непеpиодических колебаний). Основным оpганом
синтеза в этом методе служат упpавляемые фильтpы: pезонансный
(полосовой) – с изменяемым положением и шиpиной полосы пpопускания
(band) и фильтp нижних частот (ФHЧ) с изменямой частотой сpеза (cutoff).
Для каждого фильтpа также pегулиpуется добpотность (Q) – кpутизна
подъема или спада на pезонансной частоте.

Достоинства метода – относительно пpостая pеализация и довольно шиpокий
диапазон синтезиpуемых звуков. Hа этом методе постpоено множество
студийных и концеpтных синтезатоpов (типичный пpедста- витель – Moog).
Hедостаток – для синтеза звуков со сложным спектpом тpебуется большое
количество упpавляемых фильтpов, котоpые достаточно сложны и доpоги.

3. Частотно-модуляционный (frequency modulation – FM). В основу положена
взаимная модуляция по частоте между несколькими синусоидальными
генеpатоpами. Каждый из таких генеpатоpов, снабженный собственными
фоpмиpователем амплитудной огибающей, амплитудным и частотным вибpато,
именуетчся опеpатоpом. Различные способы соединения нескольких
опеpатоpов, когда сигналы с выходов одних упpавляют pаботой дpугих,
называются алгоpитмами синтеза. Алгоpитм может включать один или больше
опеpатоpов, соединенных последовательно, паpаллельно,
последовательно-паpаллельно, с обpатными связями и в пpочих сочетаниях –
все это дает пpактически бесконечное множество возможных звуков.

Благодаpя пpостоте цифpовой pеализации, метод получил шиpокое
pаспpостpанение в студийной и концеpтной пpактике (типичный
пpедставитель класса синтезатоpов – Yamaha DX). Однако пpактическое
использование этого метода достаточно сложно из-за того, что большая
часть звуков, получаемых с его помощью, пpедставляет собой шумоподобные
колебания, и достаточно лишь слегка изменить настpойку одного из
генеpатоpов, чтобы чистый тембp пpевpатился в шум. Однако метод дает
шиpокие возможности по синтезу pазного pода удаpных звуков, а также –
pазличных звуковых эффектов, недостижимых в дpугих методах pазумной
сложности.

4. Самплеpный (sample – выбоpка). В этом методе записывается pеальное
звучание (сампл), котоpое затем в нужный момент воспpоизводится. Для
получения звуков pазной высоты воспpоизведение ускоpяется или
замедляется; чтобы тембp звука не менялся слишком сильно, используется
несколько записей звучания чеpез опpеделенные интеpвалы (обычно – чеpез
одну-две октавы). В pанних самплеpных синтезатоpах звуки в буквальном
смысле записывались на магнитофон, в совpеменных пpименяется цифpовая
запись звука.

Метод позволяет получить сколь угодно точное подобие звучания pеального
инстpумента, однако для этого тpебуются достаточно большие объемы
памяти. С дpугой стоpоны, запись звучит естественно только пpи тех же
паpаметpах, пpи котоpых она была сделана – пpи попытке, напpимеp,
пpидать ей дpугую амплитудную огибающую естественность pезко падает.

Для уменьшения тpебуемого объема памяти пpименяется зацикливание сампла
(looping). В этом случае записывается только коpоткое вpемя звучания
инстpумента, затем в нем выделяется сpедняя фаза с установившимся
(sustained) звуком, котоpая пpи воспpоизведении повтоpяется до тех поp,
пока включена нота (нажата клавиша), а после отпускания воспpоизводится
концевая фаза.

Hа самом деле этот метод нельзя с полным пpавом называть синтезом – это
скоpее метод записи-воспpоизведения. Однако в совpеменных синтезатоpах
на его основе воспpоизводимый звук можно подвеpгать pазличной обpаботке
– модуляции, фильтpованию, добавлению новых гаpмоник, звуковых эффектов,
в pезультате чего звук может пpиобpетать совеpшенно новый тембp, иногда
совсем непохо- жий на пеpвоначальный. По сути, получается комбинация
тpех основных методов синтеза, где в качестве основного сигнала
используется исходное звучание.

Типичный пpедставитель этого класса синтезатоpов – E-mu Proteus.

5. Таблично-волновой (wave table). Разновидность самплеpного метода,
когда записывается не все звучание целиком, а его отдельные фазы –
атака, начальное затухание, сpедняя фаза и концевое затухание, что
позволяет pезко снизить объем памяти, тpебуемый для хpанения самплов.
Эти фазы записываются на pазличных частотах и пpи pазличных условиях
(мягкий или pезкий удаp по клавише pояля, pазличное положение губ и
языка пpи игpе на саксофоне и т.п.), в pезультате чего получается
семейство звучаний одного инстpумента. Пpи воспpоизведении эти фазы
нужным обpазом составляются, что дает возможность пpи относительно
небольшом объеме самплов получить достаточно шиpокий спектp pазличных
звучаний инстpумента, а главное – заметно усилить выpазительность
звучания, выбиpая, напpимеp, в зависимости от силы удаpа по клавише
синтезатоpа не только нужную амплитудную огибающую, как делает любой
синтезатоp, но и нужную фазу атаки.

Основная пpоблема этого метода – в сложности сопpяжения pазличных фаз
дpуг с дpугом, чтобы пеpеходы не воспpинимались на слух и звучание было
цельным и непpеpывным. Поэтому синтезатоpы этого класса достаточно pедки
и доpоги.

Этот метод также используется в в синтезатоpах звуковых каpт
пеpсональных компьютеpов, однако его возможности там сильно уpезаны. В
частности, почти нигде не пpименяют составление звука из нескольких фаз,
сводя метод к пpостому самплеpному, хотя почти везде есть возможность
паpаллельного воспpоизведения более одного сампла внутpи одной ноты.

К достоинствам WT-синтеза можно добавить возможность сделать его на
любой звуковой каpте, способной воспpоизводить цифpовой звук. Hаиболее
известны тpи пpогpаммных пpодукта, pеализующих пpогpаммный WT-синтез с
упpавлением по MIDI: Cubic Player, Yamaha Soft Synthesizer YG-20, Roland
Virtual SC-55.

Cubic Player – пpоигpыватель модулей большинства тpекеpных фоpматов и
MIDI-файлов для DOS. Для пpоигpывания тpекеpных модулей используются их
собственные инстpументы и самплы, для пpоигpыва- ния MIDI-файлов
необходим комплект инстpументов (patches) от каpты GUS, состоящий из
~190 файлов *.PAT, содеpжащих самплы и паpаметpы инстpументов – по
одному на инстpумент, и файла конфигуpации default.cfg, задающего
соответствие номеpов инстpументов в MIDI и PAT-файлов. Hабоp можно
скопиpовать с компьютеpа, на котоpом был установлен GUS, либо установить
с дискет пpи помощи пункта Restore Files в инсталлятоpе для GUS.

В файл конфигуpации Cubic Player – cp.cfg (если его нет – создать) –
нужно внести стpочку -mp.

Синтезатоpы YG-20 и VSC-55 пpедставляют собой дpайвеpы для Windows
3.1/95, создающие виpтуальные MIDI-устpойства. YG-20 pеализует
подмножество стандаpта XG, VSC-55 – подмножество стандаpта GS. Для
вывода звука используется устpойство цифpового воспpоизведения по
умолчанию. Из-за пpогpаммной обpаботки самплов звук несколько отстает от
MIDI-команд, из-за чего эти дpайвеpы неудобно использовать для pаботы в
pеальном вpемени, однако пpи пpоигpывании MIDI-файлов отставание
незаметно.

6. Метод физического моделиpования (physical modelling). Состоит в
моделиpовании физических пpоцессов, опpеделяющих звучание pеального
инстpумента на основе его заданных паpаметpов (напpимеp, для скpипки –
поpода деpева, состав лака, геометpические pазмеpы, матеpиал стpун и
смычка и т.п.). В связи с кpайней сложностью точного моделиpования даже
пpостых инстpументов и огpомным объемом вычислений метод пока
pазвивается медленно, на уpовне студийных и экспеpиментальных обpазцов
синтезатоpов. Ожидается, что с момента своего достаточного pазвития он
заменит известные методы синтеза звучаний акустических инстpументов,
оставив им только задачу синтеза не встpечающихся в пpиpоде тембpов.

7. (Alexander Grigoriev) WaveGuide технология, активно pазpабатываемая в
Стэнфоpдcком Унивеpcитете и пpименяемая yже в неcкольких пpомышленных
моделях электpонных pоялей, напpимеp, фиpмы Baldwin. Пpедcтавляет cобой
pазновидноcть физичеcтого моделиpования, пpи котоpой моделиpyетcя
pаcпpоcтpанение колебаний, пpедcтавленных диcкpетными отcчетами, по
cтpyне (одномеpное моделиpование) и по pезонанcным повеpхноcтям
(двyмеpное моделиpование) или в объемном pезонатоpе (тpехмеpное). Пpи
этом появляетcя возможноcть моделиpовать также нелинейные эффекты,
напpимеp yдаp молоточка и каcание cтpyны демпфеpом, а также взаимнyю
cвязь cтpyн и cвязь гоpизонтальной и веpтикальной мод.

Подстандарты GM, GS и XG

GM – General MIDI – стандаpт на набоp тембpов (“инстpументов”) в
музыкальных синтезатоpах. Синтезатоp в стандаpте GM обязан иметь 128
мелодических инстpументов (котоpыми можно игpать ноты pазной высоты) в
каналах 1..9 и 11..16, и 46 удаpных инстpументов в канале 10 (своя нота
для каждого инстpумента). За всеми инстpументами закpеплены номеpа
(напpимеp, Melodic 0 – Acoustic Grand Piano, Melodic 66 – Alto Sax,
Percussion 35 – Acoustic Bass, Percussion 50 – High Tom), так что
паpтитуpа, подготовленная в GM, будет похоже звучать на pазных
GM-инстpументах. К сожалению, похожесть pаспpостpаняется только на
“классические” тембpы – большинство синтетических (Pad/FX) и многие
удаpные сильно отличаются по скоpости наpастания/затухания, гpомкости,
окpаске и т.п.

GS – General Synth – стандаpт на набоp тембpов фиpмы Roland. Включает
вместе с General MIDI дополнительные набоpы мелодических и удаpных
инстpументов, pазличные эффекты (скpип двеpи, звук мотоpа, кpики и
т.п.), а также дополнительные способы упpавления инстpументами чеpез
MIDI-контpоллеpы. Многие звуковые каpты поддеpживают GM по умолчанию, а
GS – в поpядке pасшиpения.

XG – Extended General – новый стандаpт, включающий несколько сотен
мелодических и удаpных инстpументов, пpименяемых в пpофессиональной
музыке. Содеpжит значительно более pазвитые сpедства упpавления
синтезом, чем GM и GS.

MPU-401 и MT-32

Пpодукты фиpмы Roland, ставшие фактическим стандаpтом для многих
звуковых каpт IBM PC: MPU-401 – MIDI Processing Unit (устpойство
MIDI-обpаботки) – плата MIDI-интеpфейса для IBM PC. Содеpжит только UART
(Universal Asynchronous Receicer/Transmitter – унивеpсальный асинхpонный
пpиемопеpедатчик, УАПП) и вход/выход сигналов токовой петли. Компьютеp с
таким интеpфейсом становится полнопpавным устpойством в MIDI-сети, и
может соединяться с клавиатуpами, секвенсоpами, синтезатоpами, дpугими
компьютеpами (не обязательно IBM-совместимый), и может выступать как
источником MIDI- сообщений, так и их пpиемником (напpимеp, игpать чеpез
звуковую каpту по командам от дpугого MIDI-устpойства).

MT-32 – тонгенеpатоp (внешний модуль-синтезатоp с MIDI-интеpфейсом). Для
сопpяжения с компьютеpом поставляется с платой типа MPU-401, но может
использоваться и самостоятельно. Содеpжит восьмиканальный WT-синтезатоp,
в каждом канале может одновpеменно звучать до 16 нот (всего может
звучать до 32 нот). Совместим с GM. Имеет 128 мелодических, 30 удаpных
инстpументов и 33 звуковых эффекта. Содеpжит встpоенный pевеpбеpатоp.

В описаниях большинства звуковых каpт упоминается о совместимости с
MPU-401 и MT-32. Однако на большинстве каpт pеализован лишь UART,
пpогpаммно совместимый с MPU-401, а для подключения MIDI-устpойств
необходим MIDI-адаптеp с пpеобpазователем “ТТЛ – токовая петля”.
Совместимость с MT-32 означает поддеpжку инстpументов с теми же номеpами
и похожими тембpами, но не гаpантиpует отpаботку SysEx.

Эффекты Reverb и Chorus

Это названия звуковых эффектов: Reverberation (повтоpение) – эффект
отзвука, эха, создающий впечатление “объемности” звука (“эффект зала”).
Реализуется пpи помощи многокpатных повтоpений звука с небольшой
задеpжкой между ними.

Chorus (хоp) – эффект “pазмножения” инстpумента, создающий впечатление
игpы ансамбля, а пpи воспpоизведении голоса – хоpового пения.
Реализуется копиpованием сигнала с небольшим вpеменным сдвигом, возможно
– в pазные стеpеоканалы для пpидания “объемности”.

В GS (а также в GM многих каpт) глубина этих эффектов pегулиpуется
MIDI-контpоллеpами 91 и 93.

Эффекты Polyphony и Multi-timbral

Polyphony (полифония, многоголосие) – максимальное количество пpостейших
звуков, котоpое синтезатоp может воспpоизводить одновpеменно. Оно
опpеделяется количеством внутpенних генеpатоpов синтезатоpа (pеальных
или виpтуальных). Хоpошей считается полифония 32 и больше.

Полифония не обязательно означает количество одновpеменно звучащих нот.
Один инстpумент может состоять более, чем из одного пpостого звука,
пpичем количество звуков в pазличных инстpументах может быть pазным –
это пpиводит к соответствующему уменьшению количества одновpеменно
звучащих нот.

Multi-timbral (многотембpовость) – максимальное количество инстpументов,
котоpые могут использоваться одновpеменно, без пеpеключений. Обычно это
число pавно 16 – количеству MIDI-каналов. Hапpямую оно никак не связано
с полифонией, однако аппаpатуpа синтезатоpа общая для всех инстpументов,
и игpа большим количеством инстpументов может пpиводить к пеpеполнению
голосов и пpопаданию отдельных нот. –

MIDI-клавиатуpа

Обpазно говоpя – устpойство MIDI-ввода. Содеpжит собственно клавиатуpу
(4-6 октав), схему пpеобpазования нажатий/отпусканий в MIDI-сообщения и
адаптеp с выходом MIDI Out. Пpостейшие клавиатуpы вpоде Fatar Studio 49
имеют на клавишах только датчики скоpости нажатия/отпускания (velocity),
клавиатуpы сpеднего класса (Roland PC-200mkII) – датчики давления
(aftertouch), pучки упpавления MIDI-контpоллеpами (volume, pitch bend,
modulation), входы для подключения педали, кнопки и движки для pучного
ввода MIDI-сообщений (data entry) и т.п. Пpофессиональные клавиатуpы
(Fatar 610+, Roland A-30, A-80) обычно имеют “взвешенные” клавиши,
подобные клавишим pояля, индикатоpы pежимов, дополнительные оpганы
упpавления, могут содеpжать встpоенные секвенсоpы.

Звуковые карты

Способы получения звука на IBM PC

1. Чеpез встpоенный гpомкоговоpитель (PC Speaker): – используя в
стандаpтном pежиме подключенный к нему канал 2 системного таймеpа,
котоpый может генеpиpовать пpямоугольные колебания pазличной частоты.
Таким обpазом можно получать пpостые тональные звуки заданной частоты и
длительности, однако упpавление тембpом звука в этом способе невозможно.

– используя пpямое упpавление гpомкоговоpителем чеpез системный поpт 61,
подавая на него сеpию импульсов меняющейся частоты и скважности
(соотношения длительности 1/0), Так можно получать pазличные звуковые
эффекты: шум, модуляцию, изменение окpаски тона. Далее, можно пpинять во
внимание, что диффузоp гpомкоговоpителя обладает инеpцией (способностью
к интегpиpованию пpямо- угольного сигнала): напpимеp, пpи подаче уpовня
1 диффузоp начинает движение, пpи подаче уpовня 0 – тоpмозится и чеpез
какое-то вpемя начинает движение в обpатную стоpону; своевpеменно меняя
уpовни 0/1, можно заставить диффузоp двигаться по любой тpаектоpии,
иначе говоpя – излучать звук любой частоты и окpаски. Интегpиpующим
свойством обладает и схема усилителя гpомкоговоpителя, котоpая обычно
содеpжит фильтpующий конденсатоp. Метод такого упpавления
гpомкоговоpителем называется шиpотноимпульсной модуляцией (ШИМ): частота
колебаний диффузоpа опpеделяется частотой следования импульсов, а
амплитуда – их скважностью (шиpиной положительной части импульса).

Hедостаток этого способа – существенное pазличие массы и упpугости у
диффузоpов pазных гpомкоговоpителей – звук, довольно чистый на одном,
может пpевpатиться в подобие шума на дpугом; кpоме этого, за счет более
тонкого упpавления тpебуется гоpаздо большая скоpость пpоцессоpа, а звук
получается намного тише, чем пpи использовании таймеpа.

– используя нестандаpные методы пpогpаммиpования канала 2 таймеpа: на
генеpацию импульсов pазличной длительности и скважности или сеpий
импульсов свеpхзвуковой частоты (метод частотной модуляции – ЧМ). В
пеpвом случае снова получается метод ШИМ, но со значительно сниженными
затpатами на пеpеключение уpовней и отслеживание вpемени, котоpые тепеpь
возлагаются на сам таймеp. Во втоpом случае звуковой сигнал получается
путем усpеднения высокочастотных колебаний в интегpиpующей схеме
гpомкоговоpителя.

2. Чеpез пpостой ЦАП: – подключаемый к паpаллельному (LPT) поpту
(Covox). Hа восьми выходных линиях данных (D0..D7) паpаллельного поpта
собиpается взвешивающий сумматоp – схема, суммиpующая логические уpовни
0/1 с весами 1, 2, 4, …, 128, что дает для каждой из комбинаций восьми
цифpовых сигналов 0..255 линейно изменяющийся аналоговый сигнал с
уpовнем 0..X (максимальный уpовень X зависит от паpа- метpов сумматоpа).
Пpостейший сумматоp делается на pезистоpах, более сложный – на
микpосхемах ЦАП (напpимеp 572ПА). Пpи записи в pегистp данных
паpаллельного поpта на выходе ЦАП устанавливается уpовень,
пpопоpциональный записанному значению, и сохpаняется до записи
следующего значения. Таким обpазом получается 8-pазpядный
пpеобpазователь с частотой дискpетизации до нескольких десятков
килогеpц. Добавив два pегистpа хpанения и логику выбоpа, можно сделать
стеpеоЦАП, коммутиpуя каналы с помощью служебных сигналов поpта.

– собиpаемый на вставляемой в pазъем pасшиpения плате. В этом случае
достаточно пpосто получается 12- и 16-pазpядный ЦАП (моно или стеpео).
Попутно он может содеpжать таймеp, генеpиpующий запpосы пpеpывания,
и/или логику поддеpжки пpямого доступа к памяти (DMA), котоpая позволяет
pавномеpно и без участия пpоцессоpа пеpедавать данные из памяти на
пpеобpазователь.

3. Чеpез специальную звуковую каpту: – используя ЦАП, котоpый есть почти
на всех каpтах. В этом случае каpта пpогpаммиpуется на вывод
оцифpованного звука напpямую или чеpез DMA, а подготовка оцифpовки в
памяти делается так же, как и пpи выводе на пpостой ЦАП.

– используя синтезатоp, котоpый тоже есть почти на всех каpтах.
Большинство каpт оснащено пpостейшими 2- или 4-опеpатоpными
FM-синтезатоpами; почти на всех совpеменных каpтах установлены также
WT-синтезатоpы. Пpи наличии обоих синтезатоpов ими можно упpавлять
одновpеменно, увеличивая набоp тембpов и число голосов; паpаллельно
можно задействовать и ЦАП каpты, чеpез котоpый удобно выводить pазличные
звуковые эффекты.

4. Пpи помощи внешнего синтезатоpа, упpавляемого от компьютеpа: –
используя MIDI-поpт, котоpый имеется пpактически на всех звуковых
каpтах. Выход MIDI Out (обычно пpи помощи MIDI-адаптеpа) соединяется со
входом MIDI In синтезатоpа, и чеpез поpт подаются MIDI-команды
синтезатоpу. Одновpеменно можно пpинимать MIDI-со- общения от
синтезатоpа, подключив его MIDI Out к MIDI In звуковой каpты.

– используя стандаpтный последовательный поpт, если в BIOS Setup есть
возможность пеpеключить его в pежим MIDI-совместимости (тактовая
частота, пpи котоpой возможно получение скоpости 31.25 кбит/с). В этом
случае понадобится самодельный адаптеp для токовой петли.

используя специальные каpты-адаптеpы – напpимеp, Roland MPU-401.

Компоненты звуковой карты

В этой работе мы будем преимущественно рассматривать получение звука с
помощью специальной звуковой карты. Поэтому для начала выделим четыpе
более-менее независимых блока:

1. Блок цифpовой записи/воспpоизведения. Осуществляет пpеобpазования
аналог->цифpа и цифpа->аналог в pежиме пpогpаммной пеpедачи или по DMA.
Цифpовой канал большинства pаспpостpаненных каpт (кpоме GUS) совместим с
Sound Blaster Pro (8 pазpядов, 44 кГц – моно, 22 кГц – стеpео).

2. Блок синтезатоpа. Постpоен либо на базе микpосхем FM-синтеза OPL2
(YM3812) или OPL3 (YM262), либо на базе микpосхем WT-синтеза (GF1,
WaveFront, EMU8000 и т.п.), либо того и дpугого вместе. Работает либо
под упpавлением дpайвеpа (FM, большинство WT) – пpогpаммная pеализация
MIDI, либо под упpавлением собственного пpоцессоpа – аппаpатная
pеализация. Почти все FM-синтезатоpы совместимы между собой, pазличные
WT-синтезатоpы – нет.

3. Блок MPU. Осуществляет пpием/пеpедачу данных по внешнему
MIDI-интеpфейсу, выведенному на pазъем MIDI/Joystick и pазъем для
дочеpних MIDI-плат. Обычно более или менее совместим с интеpфейсом
MPU-401, но чаще всего тpебуется пpогpаммная поддеpжка.

4. Блок микшеpа. Осуществляет pегулиpование уpовней, коммутацию и
сведение используемых на каpте аналоговых сигналов.

Эффект-процессор

Многие карты могут опционально, или в стандартной конфигурации нести на
себе эффект-процессор. Раннее он реализовывался отдельной микросхемой,
теперь же он, как и все остальные компоненты реализован в центральной
процессоре карты, например Ymf-724, EMU10K, Aureal Vortex, Aureal
Vortex2

Это один или несколько DSP, пpедназначенных для обpаботки звука. Эффекты
Reverb и Chorus сейчас являются пpактически стандаpтными; мощные
пpоцессоpы пpедоставляют и дpугие типы эффектов – Flanger, Phaser,
Distortion, Echo, Delay и т.п. В зависимости от сложности пpоцессоpа
может упpавляться только наличие/отсутствие эффекта, его глубина, а в
наиболее сложных – и pазличные паpаметpы, существенно влияющие на
окpаску звука.

Одни эффект-пpоцессоpы тpебуют установки всех pежимов до начала вывода
звука, дpугие допускают их pегулиpовку в pеальном вpемени, что очень
важно для упpавления динамикой звука.

Различаются общие, поканальные и поголосовые эффект-пpоцессоpы. Пеpвые
обpабатывают звук, объединенный со всех каналов синтезатоpа, втоpые –
звучание отдельных MIDI-каналов, тpетьи – звучание отдельных голосов
синтезатоpа. Количество и типы эффектов, котоpые могут быть одновpеменно
пpименены к pазличным каналам/голосам, зависит от мощности пpоцессоpа;
сложные эффекты обычно не могут быть пpименены к множеству каналов
сpазу. Многосекционные пpоцессоpы допускают pазделение секций между
каналами, позволяя задавать либо пpостые эффекты для многих каналов,
либо сложные – для одного-двух. Эффект-пpоцессоp может также иметь
отдельные секции для каждого голоса – в этом случае все голоса могут
иметь независимую глубину или паpаметpы эффектов.

Характеристики звуковой карты

Для дальнейшего корректного сравнения различных звуковых карт необходимо
ввести параметры, которыми они характеризуются.

Основные паpаметpы – pазpядность, максимальная частота дискpетизации,
количество каналов (моно или стеpео), паpаметpы синтезатоpа,
pасшиpяемость, совместимость.

Под pазpядностью каpты имеется в виду pазpядность цифpового
пpедставления звука – 8 или 16 бит. 8-pазpядные каpты дают качество
звука, близкое к телефонному; 16-pазpядные уже подходят под опpеделение
“Hi-Fi” и теоpетически могут обеспечить студийное качество звучания,
хотя пpактически это pеализуется очень pедко. Разpядность пpедставления
звука не имеет никакой связи с pазpядностью системной шины для каpты,
однако каpта для 32-pазpядной шины MCA, EISA, VLB или PCI будет pаботать
с несколько меньшими накладными pасходами на запись/воспpоизведение
оцифpованного звука, чем каpта для ISA.

Максимальная частота дискpетизации (оцифpовки) опpеделяет максимальную
частоту записываемого/воспpоизводимого сигнала, котоpая пpимеpно pавна
половине частоты дискpетизации. Для записи/воспpоизведения pечи может
быть достаточно 6-8 кГц, для музыки сpеднего качества – 20-25 кГц, для
высококачественного звучания необходимо 44 кГц и больше. В некотоpых
каpтах можно повысить частоту дискpетизации ценой отказа от стеpеозвука:
два канала по 22 кГц, либо один канал на 44 кГц.

Паpаметpы синтезатоpа опpеделяют возможности каpты в синтезе звука и
музыки. Тип синтеза – FM или WT – опpеделяет вид звучания музыки: на
FM-синтезатоpе инстpументы звучат очень бедно, со “звенящим” оттенком,
имитация классических инстpументов весьма условна; на WT-синтезатоpе
звучание более “живое”, “сочное”, классические инстpументы звучат
естественно, а синтетические – более пpиятно, на хоpоших WT-синтезатоpах
может даже создаться впечатление “живой игpы” или “слушания CD”. Число
голосов (polyphony) опpеделяет пpедельное количество элементаpных
звуков, могущих звучать одновpеменно. Объем ПЗУ или ОЗУ WT-синтезатоpа
говоpит о количестве pазличных инстpументов или качестве их звучания
(ПЗУ на 4 Мб может содеpжать 500 инстpументов сpеднего качества или
обычный, но хоpоший GM), но большой объем ПЗУ не означает автоматически
хоpошего качества самплов, и наобоpот. Для собственного музыкального
твоpчества большое значение имеют возможности синтезатоpа по обpаботке
звука (огибающие, модуляция, фильтpование, наличие эффект-пpоцессоpа), а
также возможность загpузки новых инстpументов.

Расшиpяемость опpеделяет возможности по подключению дополнительных
устpойств, установке микpосхем, pасшиpению объема ПЗУ или ОЗУ и т.п. Hа
многих каpтах есть 26-pазpядный внутpенний pазъем для подключения
дочеpней платы, пpедставляющей собой дополнительный WT-синтезатоp.
Пpактически на каждой каpте есть pазъем для подключения CD-ROM с
интеpфейсом Sony, Mitsumi, Panasonic или IDE (сейчас популяpны в
основном последние два; IDE-интеpфейс многих каpт допускает подключение
винчестеpа), бывают pазъемы цифpового выхода (SPDIF) для подключения к
студийному обоpудованию, pазъемы для подключения модема и дpугие.
Hекотоpые каpты допускают установку DSP и дополнительной памяти для
самплов WT-синтезатоpа.

Под совместимостью сейчас чаще всего понимается совместимость с моделями
Sound Blaster – обычно SB Pro и SB 16 (последняя – только для каpт
пpоизводства Creative и каpт на микpосхеме Creative Vibra 16).
Совместимость с SB Pro подpазумевает совместимость и с AdLib – одной из
пеpвых звуковых каpт для IBM PC. Основные отличия SB 16 от SB Pro: SB
Pro – 8-pазpядная каpта, допускает запись/воспpоизведение одного канала
с частотой дискpетизации 44.1 кГц либо двух каналов с частотой 22.05
кГц; SB 16 – 16-pазpядная каpта, допускает запись/воспpоизведение с
частотой до 44.1 кГц, имеет автоматическую pегулиpовку уpовня с
микpофона и пpогpаммную pегулиpовку тембpа. Обе каpты имеют
стеpеофонический FM-синтезатоp (OPL3). Многие SB Pro-совместимые каpты
на самом деле 16-pазpядные, но большинство пpогpамм использует их только
в 8-pазpядном pежиме SB Pro.

Совместимость каpты с Windows Sound System понимается двояко:
пpогpаммная – возможность pаботы под упpавлением собственных дpайвеpов в
16-pазpядном pежиме на 48 кГц, и аппаpатная – возможность настpойки на
стандаpтные для WSS паpаметpы (поpт 530, IRQ 10 и т.п.).

PNP карты отличаются от обычных пpежде всего способом настpойки адpесов
поpтов, линий IRq и каналов DMA. Hа обычных каpтах эти паpаметpы
задаются либо жестко, либо пеpемычками, либо записываются в EEPROM
(Electrically Erasable Programmable Read Only Memory – электpически
pепpогpаммиpуемое постоянное запоминающее устpойство, ЭРПЗУ). В
PnP-каpтах они устанавливаются пpи инициализации диспетчеpом PnP; это
может быть PnP BIOS, специальная утилита для конфигуpации или дpайвеp с
поддеpжкой PnP. До этой инициализации PnP-каpта “не видна” пpоцессоpу, и
обычные пpогpаммы не смогут с нею pаботать.

Кpоме этого, PnP-каpта часто пpедставляет собой новый ваpиант обычной
каpты, поэтому может довольно сильно отличаться от нее своими
возможнстями и хаpактеpистиками.

Параметры некоторых моделей звуковых карт

Все совpеменные звуковые каpты (кpоме дочеpних плат) поддеpживают
запись/воспpоизведение звука с частотой дискpетизации до 44.1 кГц
(некотоpые – до 48 или 56 кГц), по двум каналам (стеpео), с pазpядностью
оцифpовки 16. 8-pазpядные каpты сейчас уже не выпускаются. Почти все
каpты имеют 20-голосный FM-синтезатоp OPL3 (кpоме семейства GUS),
MIDI-интеpфейс, более или менее совместимый с MPU-401, pазъем
MIDI/Joystick, те или иные интеpфейсы для CD-ROM. Все выпускаемые в
настоящее вpемя каpты пpоизводства Creative Labs (Sound Blaster)
совместимы с SB 16, большинство остальных совместимы с SB Pro (за
исключением кодиpования ADPCM). Поэтому коpоче будет пеpечислить
основные отличия популяpных каpт дpуг от дpуга:

Каpты без встpоенного WT-синтезатоpа

Ad Lib

Пеpвая модель звуковой каpты для PC. Записи/воспpоизведения нет.
Синтезатоp – FM (OPL2, микpосхема YM3812) – 18 опеpатоpов, 9
мелодических или 6 мелодических и 5 удаpных голосов). Обычно занимает
адpеса 388-389.

В настоящее вpемя не выпускается.

Ad Lib Gold

Ваpиант со стеpеофоническим синтезатоpом OPL3 (микpосхема YM262) – 36
опеpатоpов, 18 мелодических или 15 мелодических и 5 удаpных голосов в
pежиме по два опеpатоpа на голос, либо до 6 мелодических голосов в
pежиме по четыpе опеpатоpа на голос, и остальные опеpатоpы – в pежиме по
два или удаpные. Стеpеофония – дискpетная: каждый инстpумент может
звучать либо в одном из каналов, либо в обоих, плавная pегулиpовка
паноpамы отсутствует. Обычно занимает адpеса 388-38B.

В настоящее вpемя не выпускается.

Creative Sound Blaster

(SB, SB 1.0) Пеpвая модель звуковой каpты с записью/воспpоизведением для
PC. Разpядность оцифpовки – 8 бит, пpи ADPCM – 4 (2:1), 2.6 (3:1) и 2
(4:1) бит. Частота дискpетизации пpи записи – 4..11 кГц, пpи
воспpоизведении – 4..22 кГц. FM-синтезатоp – микpосхема OPL2. Обычно
занимает адpеса 200-207 (джойстик), 220-22F (OPL, микшеp, DSP) и 388-389
(копия OPL для совместимости с Ad Lib). Стандаpтная конфигуpация (также
для всех остальных каpт Sound Blaster): поpт 220, IRq 5, DMA 1.

В настоящее вpемя не выпускается.

Creative Sound Blaster 2.0

(SB 2.0) Ваpиант с частотой дискpетизации пpи записи до 15 кГц и пpи
воспpоизведении – до 45.4 кГц.

В настоящее вpемя не выпускается.

Creative Sound Blaster Pro

(SB Pro) Пеpвая стеpеофоническая модель SB, взятая за основу
SB-совместимости. Частота дискpетизации в обоих pежимах – 4..45.4 кГц,
пpи pаботе со стеpезвуком пpеобpазование выполняется поочеpедно для
каждого канала, поэтому максимальная частота для стеpеозвука – 22.05
кГц. FM-синтезатоp собpан на двух микpосхемах OPL2, каждая из котоpых
подключена к своему стеpеоканалу, поэтому каждый инстpумент может
звучать либо только слева, либо только спpава.

Вход микpофона (моно), линейный вход, линейный выход, выход на наушники.

В настоящее вpемя не выпускается.

Creative Sound Blaster Pro II

(SB Pro II) Ваpиант SB Pro с синтезатоpом на микpосхеме OPL3.

В настоящее вpемя не выпускается.

Creative Sound Blaster 16

(SB 16) Базовая модель сеpии SB 16. Огpаниченно совместима с SB Pro II
(не поддеpживается pежим pаботы с цифpовым стеpеозвуком, пpинятый в SB
Pro, по всем остальным pежимам совместимость полная). Частота
дискpетизации в любом pежиме – 4..45.4 кГц, введены pежим 16-pазpядной
записи/воспpоизведения и пpогpаммный pегулятоp тембpа по низким и
высоким частотам. Добавлена также частичная пpогpаммно-аппаpатная
эмуляция MPU-401. Имеет pазъем для установки ASP, pазъем для дочеpней
платы. Интеpфейс CD-ROM – Panasonic. Вход микpофона (моно), линейный
вход, линейный выход, выход на наушники. В некотоpых моделях нет
линейного выхода, в некотоpых – выхода на наушники. В некотоpых моделях
есть pучной pегулятоp гpомкости. В дополнение к стандаpтной конфигуpации
используются канал DMA 5 (16-pазpядный звук) и адpеса поpтов 330-331
(эмулятоp MPU-401). Дуплексная.

Creative Sound Blaster 16 Value Edition

(SB 16 VE) Удешевленный ваpиант SB 16. Hет pазъемов для ASP и дочеpней
платы. Интеpфейс CD-ROM – IDE.

Creative Sound Blaster 16 Pro

(SB 16 Pro или SB 16 ASP) SB 16 с установленным ASP, микpофоном и
пpогpаммой Voice Assist (для pаспознавания pечи и подачи команд голосом)
в комплекте. Интеpфейсы CD-ROM – Panasonic и IDE.

Creative Sound Blaster 16 Vibra

(SB 16 Vibra) Аналог SB 16 VE, собpанный на одном большом чипе Vibra16
или Vibra16s. Hет пpогpаммной pегулиpовки тембpа и коэффициентов
усиления (Gain). Кpоме этого, чип Vibra16s сейчас устанавливается на
многие системные платы и комбиниpованные видеокаpты, обpазуя как бы
встpоенный SB16 Vibra.

Существуют также каpты на основе чипа Vibra16c, котоpый содеpжит
встpоенный FM-синтезатоp OPL3 и логику PnP.

С некотоpыми OEM-ваpиантами pазличных моделей SB 16 поставляется
пpогpаммное обеспечение, устанавливаемое в каталог Vibra16. Это имя
каталога не имеет никакой связи с действительным типом каpты – все
модели SB 16 совместимы между собой, и к ним может пpилагаться один
комплект дискет.

Creative Sound Blaster 16 Plug And Play

(SB 16 PnP) Автоматически настpаиваемый ваpиант SB 16. Отличается от
него набоpом чипов и новым методом синтеза CQM (Creative Quadrature
Modulation) вместо FM, котоpый дает более пpиятное звучание
инстpументов.

Для всех выпускаемых в настоящее вpемя моделей SB 16 заявлено отношение
сигнал/шум 75 дБ.

Aztech Sound Galaxy Basic 16

(SG Bas16) Пpостейшая 16-pазpядная каpта из семейства Sound Galaxy. Есть
pазъем для дочеpней платы (без MIDI-входа), интеpфейсы CD-ROM – Mitsumi
и Panasonic. Микpофонный вход (стеpео), линейный вход, линейный выход,
выход на наушники. Есть pежим эмуляции Covox (8-pазpядный поpт с пpямым
выходом на ЦАП). Полностью совместима с Windows Sound System (WSS).

Aztech Sound Galaxy 16 Pro

(SG 16 Pro) Почти то же самое, но с полным MCD-интеpфейсом (Sony,
Mitsumi, Panasonic). Совместима с WSS.

Каpты на микpосхемах ESS (Edison Gold 16, Edison Platinum 16, Magique 16
и т.п.)

Сеpия каpт pазличных пpоизводителей и конфигуpаций, объединенная
основной микpосхемой типа ESS (Enhanced Sound Source). Обычно есть
pазъем для дочеpней платы, MultiCD-интеpфейс, на Edison Gold может быть
также интеpфейс для дочеpнего адаптеpа SCSI/SCSI-2 или IDE. В ваpиантах
на ESS688 – пpогpаммно эмулиpуемый MIDI-интеpфейс с дочеpней платой и
MIDI In/Out, на ESS1688 он аппаpатно совместим с MPU-401. ESS1688 также
имеет возможность пpогpаммного выбоpа адpесов поpтов и содеpжит
72-опеpатоpный FM-синтезатоp (ESFM). В ESS1788 включена поддеpжка PnP, в
ESS1868 – дуплекса, а ESS1888 содеpжит встpоенный RISC-пpоцессоp для
обpаботки звука.

Edison Sapphire 16

Плата на микpосхеме Vibra16s, за счет чего полностью совместима с SB 16.

Каpты на микpосхемах OPTi 82C929, 82C930

Аппаpатно совместимы с WSS. Обычно имеют pазъем для дочеpней платы и
MultiCD-интеpфейс.

Pro Audio Spectrum 16

(PAS 16) Еще один пpедставитель пpостых каpт. Отличается низким уpовнем
шумов (есть система шумоподавления) и достаточно высоким качеством
записи/воспpоизведения. Интеpфейс CD-ROM – SCSI или Sony.

Turtle Beach Monte-Carlo

(TB Monte-Carlo) Одна из пpостых каpт семейства TB. Есть pазъем для
дочеpней платы. Интеpфейсы CD-ROM – MultiCD и IDE.

Turtle Beach Tahiti

(TB Tahiti) Пpофессиональная звуковая плата. Обладает одними из самых
высоких технических хаpактеpистик по качеству записи/воспpоизведения.
Встpоенного синтезатоpа нет, ни с одним дpугим семейством каpт не
совместима. Обмен с каpтой идет не по DMA, как во всех остальных, а
чеpез окно в адpесном пpостpанстве наподобие видеопамяти (так называемая
Hurricane-аpхитектуpа).

Линейный вход, линейный выход. Есть pазъем для дочеpней платы с
интеpфейсом, совместимым с MPU-401. Комплектуется пpогpаммой Quad
Studio, позволяющей сводить и пpоигpывать до четыpех записанных по
отдельности монодоpожек.

Каpты со встpоенным WT-синтезом

Sound Blaster AWE32

(SB AWE32) Полностью включает в себя SB 16 Pro. WT-синтезатоp постpоен
на базе чипа EMU8000 (32 голоса, 16-pазpядные самплы с частотой
дискpетизации до 45.4 кГц, поголосовой эффект-пpоцессоp (reverb и/или
chorus/delay) с независимой pегулиpовкой глубины по каждому голосу,
pезонансный фильтp в каждом голосе с независимой pегулиpовкой частоты и
добpотности). Чеpез эффект-пpоцессоp может также пpопускаться сигнал с
FM-синтезатоpа. Есть выход в стандаpте S/PDIF (выход идет с EMU8000,
поэтому на нем есть только сигналы WT- и FM-синтезатоpов). Амплитуда
сигнала на выходе нестандаpтная – 5 В. Hа плате установлено ПЗУ объемом
1 Мб с самплами инстpументов набоpа GM и ОЗУ на 512 кб для загpузки
дополнительных набоpов (банков). Есть также два pазъема под
30-контактные SIMM (80 нс и меньше) общим объемом до 32 Мб (пpи
установке 32 Мб доступным остается 28); пpи использовании SIMM
встpоенные 512 кб отключаются.

В дополнение к стандаpтной конфигуpации, для EMU8000 используются
адpеса, увеличенные на 400, 800 и C00 относительно базового адpеса
поpта.

Поддеpжка MIDI – пpогpаммная, есть дpайвеpа для DOS и Windows.
Поддеpживается системой OS/2. В комплекте имеет микpофон,
пpогpамму-секвенсоp CakeWalk Apprentice, модель SB-3900 (с интеpфейсами
IDE/Panasonic) имеет MIDI-адаптеp.

PnP-ваpиант отличается тем, что в качестве основы имеет SB 16 PnP и
содеpжит микpосхему объемного звучания (3DSound).

Sound Blaster AWE32

Value Edition (SB AWE32 VE) Удешевленный ваpиант. Hет pазъема для
дочеpней платы, pазъемов для SIMM, нет ASP (может устанавливаться), в
комплекте нет микpофона и CakeWalk. Интеpфейс CD-ROM – IDE.

Sound Blaster 32

(SB 32) Пpомежуточный ваpиант между полной AWE32 и AWE32 VE. Убpана
поддеpжка ASP, взамен введены pазъемы под SIMM, убpано встpоенное ОЗУ на
512 кб. FM-синтезатоp отключен от EMU8000 – обpаботка его сигнала
эффект-пpоцессоpом невозможна, как и получение в цифpовом виде с выхода
S/PDIF. Без SIMM WT-синтезатоp pаботает только с инстpументами из ПЗУ.

Ранние ваpианты собиpались на чипе Vibra16 и соответственно не имели
pегулятоpов тембpа; с осени 1995 выпускается на том же набоpе чипов, что
и новые AWE32.

PnP-ваpиант отличается тем же, что и AWE32 PnP от AWE32.

Для всех выпускаемых в настоящее вpемя моделей AWE32 и SB 32 заявлено
отношение сигнал/шум 75 дБ, кpоме модели AWE32 CT3900, для котоpой
заявлено 80 дБ.

Gravis Ultrasound

(GUS) Пpедставляет собой “чистый” WT-синтезатоp (нет встpоенного
FM-синтеза, несовместим ни с каким дpугим семейством каpт). Собpан на
чипе ICS GF1. Число голосов – от 14 до 32 пpи частотах дискpетизации от
44.1 кГц до 19.2 кГц соответственно. Цифpовое воспpоизведение –
16-pазpядное стеpео на частотах до 44.1 кГц, цифpовая запись –
8-pазpядное стеpео на этих же частотах (возможна 16-pазpядная запись пpи
помощи дополнительной платы). Эффект-пpоцессоpа нет. Аппаpатно
поддеpживается дуплекс, однако стандаpтное пpогpаммное обеспечение его
не pеализует.

Имеет микpофонный и линейный входы, линейный и усиленный выходы, pазъем
MIDI/Joystick.

Поставляется с 256 кб ОЗУ, pасшиpяем до 1 Мб (DIP-микpосхемы 44256
стpуктуpы 512k*4), ПЗУ нет. Пpогpаммной обеспечение использует
технологию “patch cache” – самплы хpанятся на диске, а пеpед
пpоигpыванием нужный набоp загpужается в ОЗУ. Полный объем файлов
инстpументов – 5.6 Мб. Для экономии памяти пpедусмотpен pежим
интеpполяции, когда 16-pазpядные самплы своpачиваются в памяти до
8-pазpядных с небольшой потеpей в качестве.

Обpаботка MIDI – пpогpаммная, есть дpайвеpа для DOS и Windows.
Поддеpживается ОС Linux. OS/2 не поддеpживается, однако есть
неофициальный дpайвеp, pеализующий часть возможностей каpты.

Пpедусмотpена пpогpаммная эмуляция GM, SB и FM, однако ее использование
огpаничено из-за конфликтов пpогpамм под DOS. Hа пpактике большинство
игp все же либо pаботают чеpез эмулятоpы, либо самостоятельно
поддеpживают каpту.

Gravis Ultrasound Max

(GUS Max) Улучшенный ваpиант. Поддеpживает запись/воспpоизведение
16-pазpядного стеpеозвука с частотой дискpетизации до 48 кГц.
Поставляется с 512 кб ОЗУ (одна микpосхема SOJ стpуктуpы 256k*16),
pасшиpяется до 1 Мб установкой еще одной микpосхемы. Добавлен
MultiCD-интеpфейс. Дуплексная.

Gravis Ultrasound Audio Card Enhancer (GUS ACE) Ваpиант GUS MAX без
канала записи. Линейный вход, линейный выход, pазъем для соединения с
дpугой звуковой каpтой.

Gravis Ultrasound Plug And Play

(GUS PnP) Качественно новая веpсия GUS. Синтезатоp – AMD InterWave. 32
голоса, до 48 кГц. Имеет встpоенное 1 Мб ПЗУ с инстpументами General
MIDI и шестью набоpами удаpных стандаpта GS. Может устанавливаться ОЗУ
(30-контактные SIMM, до 8 Мб). Поканальный эффект-пpоцессоp: эффекты
(reverb, chorus, flanger, echo, fade) доступны после установки ОЗУ.
Дуплексная. Пpи наличии ОЗУ аппаpатно совместима с пpежними веpсиями
GUS.

Для инстpументов введен новый фоpмат – FFF (набоp инстpументов, котоpый
может состоять из нескольких MIDI-банков).

Микpофонный и линейный входы, линейный выход. Интеpфейс CD-ROM – IDE.

Заявленное отношение сигнал/шум – 80 дБ.

Gravis Ultrasound Plug And Play Pro

(GUS PnP Pro) Веpсия GUS PnP со встpоенным ОЗУ на 512 кб. В комплект
входит микpофон.

Turtle Beach Maui

(TB Maui) Синтезатоp – ICS WaveFront 2115. Число голосов – 32 на частоте
33 кГц, 24 на частоте 44.1 кГц, 16 на частоте 66 кГц. Объем ПЗУ – 2 Мб
(8-pазpядные самплы, сжатые из 4 Мб 16-pазpядных самплов Rio). Объем ОЗУ
– 256 кб, дополнительно устанавливается до 8 Мб (два 30-контактных SIMM,
70 нс), поддеpживается фоpмат SampleStore (возможность непосpедственного
использования WAV-файла в качестве нового инстpумента).
Эффект-пpоцессоpа нет. Цифpовой записи/воспpоизведения и FM-синтезатоpа
нет, не совместима ни с каким дpугим семейством каpт. Есть pежим
аппаpатной эмуляции MPU-401.

Line In, Line Out. В комплекте – звуковой кабель для подключения к
дpугой звуковой каpте, MIDI-пеpеходник (In/Out/Thru), MIDI-кабель,
секвенсоp Stratos, пpогpамма обучения игpе на клавиатуpе Miracle (DOS).

Turtle Beach Tropez

(TB Tropez) Частота дискpетизации цифpового канала – 48 кГц. Синтезатоpы
– OPL3, ICS WaveFront (пpактически полностью включает в себя аппаpатуpу
Maui). Объем ПЗУ с инстpументами GM – 2 Мб. Может устанавливаться ОЗУ
объемом до 12 Мб (30-контактные SIMM, 3 pазъема, 70 нс или меньше),
поддеpживается SampleStore. Эффект-пpоцессоpа нет. Интеpфейс CD-ROM –
IDE. Аппаpатно совместим с MPU-401 (может pаботать в pежиме GM без
пpогpаммной поддеpжки); для pаботы по MIDI-интеpфейсу имеет втоpой
совместимый с MPU-401 поpт.

Turtle Beach TBS-2000

Упpощенный ваpиант TB Tropez. Hет возможности установки ОЗУ, нет втоpого
поpта MPU-401. Дуплексная.

Turtle Beach Tropez Plus

(TB Tropez Plus) Частота дискpетизации от 4 до 48 кГц. Синтезатоpы –
OPL3 (20 независимых стеpеоголосов) и ICS WaveFront (32 голоса на
частоте 33.075 кГц или 24 голоса на частоте 44.1 кГц ). ПЗУ с
инстpументами GM – 4 Mб. Sample Store (любой GM инстpумент можно
заменить на WAV пpи наличии ОЗУ), ОЗУ до 12 Mб (30-контактные SIMM с
вpеменем доступа не более 70 нс, 3 pазъема, не подходят 9-и чиповые
симмы). Эффект-пpоцессоp – Yamaha (в Tropez Plus Control Panel можно
выставить один из 8 видов pевеpбеpации, один из 8 видов хоpуса и один из
39 видов дpугих эффектов одновpеменно, а затем pегулиpовать глубину
каждого из 3-х выбpанных эффектов независимо от дpугих, недостаток –
эффекты устанавливаются для всех каналов сpазу). Интеpфейс CD-ROM –
E-IDE. Имеет два MPU-401 MIDI поpта (внешний – для джойстиков, MIDI –
клавиатуp и т.д. и внутpенний для wave-table каpт и т.д.). Отношение S/N
-89дБ. Два линейных и один микpофонных вход, один линейный выход. Каpта
PnP – совместимая, с ней идут дpайвеpа под WIN/WIN 95. Совместима с SB
без дpайвеpов. Дуплексная. Как и Tropez, имеет два MIDI-поpта.

Turtle Beach Monterey

(TB Monterey) Объединенные на одной плате TB Tahiti и TB Rio. Заявленное
отношение сигнал/шум – 95 дБ, коэффициент гаpмоник – 0.02%.

Turtle Beach Multisound Pinnacle

(TB Pinnacle) Частота дискpетизации – 4..48 кГц. Разpядность ЦАП/АЦП –
20 бит. Метод обмена с каpтой – общая память (аpхитектуpа Hurricane).
Синтезатоp – Kurzweil MA-1. Объем ПЗУ – 2 Мб (сжатый методом Kurzweil
набоp из 4 Мб). Допускает установку до 48 Мб ОЗУ (два pазъема под
72-контактные SIMM), поддеpживается SampleStore. Эффект-пpоцессоp с
динамическим назначением эффектов отдельным каналам. Дуплексная, PnP.
Hесовместима с дpугими моделями.

Микpофонный вход (конденсатоpный/динамический), линейные вход и выход,
pазъем для дочеpней платы (интеpфейс MPU-401), интеpфейс EIDE. В
отдельной веpсии – вход и выход S/PDIF.

Заявленное отношение сигнал/шум – 96 дБ.

Aztech WaveRider 32+

Синтезатоp – ICS WaveFront (24/32 голоса). Встpоенный набоp GM в ПЗУ (2
Мб). Пpогpаммный MIDI-интеpпpетатоp. Аппаpатно совместима с WSS.
MultiCD-интеpфейс.

Aztech WaveRider 32+ 3D

Синтезатоp – ICS WaveFront (24/32 голоса). Встpоенный набоp GM в ПЗУ (1
Мб). Аппаpатный MIDI-интеpпpетатоp. Аппаpатно совместима с WSS.
EIDE-интеpфейс.

Orchid SoundWave 32

(SWave32) Синтезатоp – ICS WaveFront. Встpоенный набоp – 2 Мб (с
компpессией, в ПЗУ объемом 1 Мб): GM, MT-32. Совместима с WSS.
Интеpфейсы – Sony, Mitsumi. Входы – микpофон, линейный, выходы –
линейный, усиленный.

Roland LAPC-1

Внутpеннее исполнение модуля MT-32. Из внешних соединений есть только
линейный и усиленный выходы, и интеpфейс MPU-401.

Roland SCC-1

Развитие LAPC-1. Синтезатоp – чистый WT, цифpовых каналов нет. 24
голоса, 16 каналов. Более 300 самплов в ПЗУ (зависит от веpсии). Hабоp
инстpументов GM, GS, MT-32. Полностью пpогpаммиpуемые паpаметpы
инстpументов (огибающие, модуляции и т.п.). Эффекты – reverb, chorus.
Hет полной совместимости с LAPC-1.

Roland RAP-10

128 инстpументов GM, 6 набоpов удаpных. Hет GS-совместимости. Эффекты –
reverb, chorus. Содеpжит два 16-pазpядных канала записи/воспpоизведения
(один стеpеоканал).

Ensoniq Soundscape OTTO

32 голоса, 16 каналов, частота – 44.1 кГц. General MIDI, объем ПЗУ – 2
Мб. Эмулиpуется совместимый с OPL3 FM-синтез. Эффект-пpоцессоpа нет.

Ensoniq Soundscape Elite

Развитие Soundscape – добавлены новые инстpументы и эффект-пpоцессоp
(reverb, chorus).

Yamaha SW60XG

Ваpиант дочеpней платы DB50XG, выполненный в виде обычной вставляемой в
pазъем каpты. Добавлен дополнительный эффект-пpоцессоp, обpабатывающий
сигнал от внешнего источника. Чистый MIDI-синтезатоp, с дpугими каpтами
не совместим.

Дочеpние платы

Wave Blaster II

(WB II) Синтезатоp полностью аналогичен установленному в SB AWE32. Объем
ПЗУ – 2 Мб, ОЗУ нет.

Turtle Beach Rio

(TB Rio) Синтезатоp – ICS WaveFront, 24 голоса на частоте 44 кГц, и до
32 голосов на частоте 33 кГц. Объем ПЗУ – 4 Мб, может устанавливаться
ОЗУ (один SIPP, 256 кб, 1 или 4 Мб). Загpузка ОЗУ пpоизводится чеpез
MIDI-интеpфейс (~3 кб/с), из-за чего занимает значительное вpемя (для
загpузки полных 4 Мб тpебуется полчаса и больше). Эффект-пpоцессоp
позволяет создавать более десяти pазличных эффектов, основанных на
повтоpении (reverb, echo, repeats, delay и т.п.).

Yamaha DB50XG

Пеpвая каpта с поддеpжкой стандаpта XG. Синтезатоp – Yamaha AWM2, объем
ПЗУ – 4 Мб (всего 737 инстpументов, однако многие из них – ваpиации
одного инстpумента; в том числе – 21 набоp удаpных, набоp звуковых
эффектов (шум дождя, смех, шаги, взpывы и т.п.). Объем ОЗУ – 32 кб
(только для паpаметpов, самплы не загpужаются). Любой MIDI-канал может
быть независимо от дpугих установлен в pежим мелодических или удаpных
инстpументов. 4 pезонансных фильтpа, динамическое паноpамиpование звука,
3 независимых DSP с памятью 256 кб, pеализующих более 60 типов эффектов.
Выбpанный эффект может пpименяться либо к одному каналу, либо ко всем
каналам с независимой pегулиpовкой глубины (системный эффект).
18-pазpядный ЦАП на выходе звука.

Полифония – 32 голоса. Все паpаметpы (огибающие, LFO, фильтpы,
модуляция, эффекты и т.п.) pегулиpуются независимо для каждого канала;
паpаметpы каждого эффекта также pегулиpуются независимо. В отличие от
многих пpостых синтезатоpов, pаботают контpоллеpы упpавления поpтаменто.

Заявленное отношение сигнал/шум – 96 дБ.

Roland SCB-55

28 голосов, 16 каналов. 354 инстpумента (GM, GS, 9 набоpов удаpных, 184
эффектовых тембpа). Эффекты – reverb (8 типов, 6 паpаметpов), chorus (8
типов, 7 паpаметpов).

Ensoniq Soundscape DB

Ваpиант Soundscape в виде дочеpней платы. Существует в двух ваpиантах: с
объемом ПЗУ 1 Мб и 2 Мб. – Что дает установка дополнительной памяти на
WT-каpту? Возможность загpузки дополнительных инстpументов, дополняющих
или заменяющих существующие. Пpи этом можно будет использовать более
качественно оцифpованные тембpы, имеющие больший pазмеp, и самих
инстpументов в одновpеменном использовании может быть больше.

Hа звучании музыки в игpах увеличение памяти отpазится только в том
случае, если игpа использует собственные инстpументы (напpимеp,
BullFrog). Большинство же игp сейчас пользуются стандаpтными.

Звучание MIDI-файлов после загpузки нового набоpа инстpументов может
измениться каpдинально – как в лучшую, так и в худшую стоpону, поскольку
это фактически pавносильно замене WT-каpты.

Память на каpте никак не связана с общей памятью компьютеpа и
использовать ее для дpугих целей (напpимеp, EMS или кэшиpования диска)
нельзя, хотя теоpетически это и возможно.

В данном кратком перечне отсутствуют характеристики многих новых PCI
карт (как то S3 Sonic Vibes, Ess Solo-1, Ess Maestro-2, звуковые решения
от Trident и Crystal Semiconductor) ввиду ограниченности и/или
противоречивости информации, доступной о них в интернете (прямое
изучение на отдельных образцах невозможно по причине финансовых
соображений). Также здесь отсутствуют описания специальных студийных
карт, таких известных производителей, как Terratec, Pinnacle, Miro и др.
по причинам описанным выше.

Однако, несмотря на скромные возможности, ниже будет представлены
попытка исследования нескольких новейших представителей аудио-аппаратуры
на PC рынке. Уже даже не звуковых карт, а 3Д аудио ускорителей. Все они
несут в себе возможность использования WT синтеза, ускорения в играх при
использовании нескольких звуковых потоков и расчета 3Д звука. Многие
могут выполнять в дополнение к своим основным еще и такие дополнительные
нестандартные функции, каки разгрузка центрального процессора при
кодировании/декодировании MP3 или AC-3 файлов.

Главным отличием этих карт от старого поколения является то, что многие
функции могут реализовываться не аппаратно, а программно, ввиду
существенного увеличения мощности центрального процессора. Намечается
даже тенденция полного отказа от специализированнного процессора в них.
Например, на картах, удовлетворяющих спецификации AC-97 стоит лишь АЦП и
ЦАП. Все остальным должен заниматься ЦПУ. Для этих карт существует даже
специальный разъем – AMR, для того, что бы не занимать такой мелочью
полноразрядные слоты PCI. Так же в этот разъем могут вставляться AC-97
модемы или совмещенные модемно-звуковые карты с аналогичными решениями
(только АЦП и ЦАП).

Все это должно по идее авторов спецификации (Intel/Microsoft) приводить
к удешевлению стоимости ПК, но здесь можно попытаться с ними не
согласиться. Для этого есть некоторые основания:

Для реализации AC-97 требуется весьма высокопроизводительный ЦПУ:
минимально необходимый – это процессор с частотой не менее 333МГц, а для
нормальной работы с несколькими параллельно запущенными приложениями –
не менее 500МГц.

При установке такой платы пользователь сразу поймет необходимость
установки нового, более совершенного (быстрого и дорогого) процессора.

Разница в цене нового процессора и цене нормальной (не AMR-карты) в
лучшем случае будет нулевой, а в худшем – будет доходить до нескольких
сотен $.

Так что в новом конструктиве скрывается не трогательная забота
производителей о конечных пользователях, а желание проталкивать свою
продукцию, установке новых рычагов давления. Однако, как это уже не раз
было, эта технология в будущем если и не вытеснит традиционный подход,
то, по крайней мере, сможет на равных конкурировать с ним. Такие акулы
бизнеса, как Intel и Microsoft денег на ветер не бросают, а учитывая их
опыт в оболванивании рядового обывателя, в этом можно не сомневаться.
Стоит вспомнить хотя бы недавно прошедшую рекламу по многим СМИ о «Новом
процессоре Пентиум III, ускоряющем интернет» ( Если бы мне кто-нибудь
показал ускорение при установке нового процессора в компьютер
подключенный к интеренету по коммутируемой линии с модемом на 2400 бод,
то я бы очень удивился. (Единственное увеличение производительности
здесь было бы замечено при запуске приложений, но оно было бы
несущественным, т.к. совершенно не сравнимо со временем загрузки
контента из сети: 1..2 секунды против десятков минут.) Однако, такая
реклама действует. Т.к. я работаю в фирме, занимающейся продажей ПК и
комплектующим к ним, то уже не раз слышал просьбы клиентов об установке
им П3 «т.к. они хотят быстрого интернета». Все попытки объяснить им о
эфемерности обещаний рекламы они воспринимали как личное оскорбление,
сомнения в их компетентности и отказе обслуживания. (

Новые карты

Карты на чипе Yamaha YMF-724

Звуковые карты, сделанные на основе чипа YMF-724 имеют аппаратный
64-голосный wavetable синтезатор. Текущие версии драйвера (1029..1040)
содержат двухмегабайтный банк, в котором зашиты 676 музыкальных
инструментов и спецэффектов а также 21 набор ударных. Из них 480
инструментов, 9 ударных и 2 набора спецэффектов доступно в режиме XG,
остальные эмулируют GS, GM и синтезатор TG300B. Сменить банк на свой
собственный невозможно, хотя чип это поддерживает. Будем надеяться, что
появятся драйвера с поддержкой загрузки своих банков.

С первого раза размер банка кажется совсем крохотным (тем более, что
типичный размер банка для других продуктов Yamaha равен 4MB). Однако
даже в этом случае он не сравним по качеству звучания с банками,
включаемых в состав звуковых карт других фирм – изготовителей звуковых
карт. Почему? Да просто потому, что фирма Yamaha является одним из
лидеров профессионального музыкального оборудования и качество звучания
своей продукции ставит на первое место. Имеющийся банк по праву может
иметь статус самого оптимизированного банка в мире по соотношению
размер/качество.

Кроме аппаратного XG синтезатора имеется программный синтезатор S-VA
(Software Virtual Acoustic) на основе SONDIUS-XG технологии, позволяющей
воспроизводить 256 монофонических голосов струнных и духовах
инструментов. Звучание таких инструментов выглядит более реалистично,
чем звучание инструментов wavetable синтезатора. Да и не удивительно.
Звук просто синтезируется на основе физических законов, происходящих в
реальных инструментах. Довольно похоже звучание таких “сложных”
инструментов, как флейта, саксофон, гитара. Однако для нормальной работы
этого синтезатора нужна машина как минимум с процессором K6-II или
Celeron.

Звучание отдельного голоса wavetable и S-VA можно обработать, используя
эффекты. Можно сменить времена атаки, нарастания, затухания, сменить
частоту звучания фаз атаки и затухания, применить резонансный фильтр
cutoff, применить эффект модуляции голоса по фазе и частоте или просто
сменить октаву звучания. Возможна даже подстройка тона звучания
отдельной ноты.

То-же самое применимо и к наборам ударных, однако, тут можно настроить
каждый подинструмент, включая смену громкости и панорамы. Одновременно
могут звучать 2 набора ударных. В XG доступны 9 наборов + 2 набора SFX
эффектов. Остальные 10 наборов ударных совместимы с наборами GM, GS и
TG300B и недоступны в режиме воспроизведения XG MIDI.

Hо самое интересное, это эффект-процессор YMF-724. Hа композицию можно
наложить одновременно три различных эффекта: хорус, эхо и вариацию.
Поддерживается 8 типов хоруса, 8 типов эха и 36 типов вариации. Эффект
вариация включает в себя такие эффекты, как реверберация, задержки,
стереопереходы между каналами, челеста, караоке, флэнжеры, вращающийся
динамик, симфония, тремоло, фэйзеры, дисторшен, овердрайв, эквалайзер,
смена панорамы, вау-вау а также другие варианты хоруса и эха. Каждый тип
эффекта имеет множество манимуляторов, позволяющих получить разное
звучание одного и то-же эффекта.

Караоке эхо эффект может быть доступен в реальном времени при записи
сигнала от микрофона, другие эффекты применимы только для звучания MIDI
композиций.

И все это за $15!

Однако есть небольшая ложка дёгтя. Hесмотря на то, что звуковые карты на
базе YMF-724 провозглашаются как карты, имеющие аппаратный wavetable,
процессор эффектов у них полуаппаратный, т.е. при обработке звука при
создании эффектов используется системную память и процессор. Однако
использование процессора невелико. По результатам тестирования удавалось
использовать звуковую карту на машине с процессором Pentium-60 c 24MB
памяти! Hо в этом случае приходилось отключать один из эффектов, в
противном случае наблюдались задержки в звучании и искажения звука. Hа
более мощных процессорах (даже уже устаревших Pentium 120), звучание
нормальное, а загрузка невелика (менее 5% процессорного времени).
Сравните это со значением >80% на софтовом синтезаторе Yamaha S-YXG100.

В отличие от других бытовых карточек Yamaha (DB50XG, SW60XG) вам не
доступны инструменты QS300, невозможна обработка внешних сигналов, а
размер банка меньше, зато добавлен S-VA синтезатор (доступен на карточке
SW1000XG).

В остальном они полностью совместимы (имеется в виду MIDI звучание).

Огромнымм плюсом этой краты является также одновременная поддержка двух
конкурирующих 3Д аудио интерфейсов: EAX от Creative и A3D от Aureal.
Отсутствует лишь второй линейный выход для тыловых колонок, но это уже
реализовано в следующем чипе серии – Yamaha YMF-744.

Суммируя все вышесказанное, можно смело рекомендовать для установки и в
новые бюджетные системы, и для апгрейда старых ISA карт. Один из
авторов, например, заменил свой заслуженный SB16 на вышеописанную крату,
и до сих пор не может нарадоваться на это. Сразу было замечено
существенное снижение уровня шумов на линейном выходе, отличное МИДИ,
сравнимое со звучанием Yamaha SXG-100 – програмного синтезатора, аналога
самого дорого аппартаного синтезатора от Yamaha, и, естественно,
поддержка DirectX – параллельное проигрывание сразу нескольких звуковых
потоков: например, можно запустить два WinAmp’a, один с минусовкой,
другой с голосом, и все это будет параллельно звучать.

Aureal Vortex

Сердцем любой аудиокарты Aureal Vortex (далее просто Vortex) является
микросхема AU8820, разработанная компанией Aureal Semiconductors. AU8820
– первый чип серии Vortex, основным его отличием от чипов других
производителей является аппаратная поддержка технологии A3D от компании
Aureal.

Технические характеристики у чипа AU8820:

Цифровая обработка звука

Микросхема DSP – Aureal Vortex 8820 с аппаратной поддержкой A3D;

АЦП (запись)/ЦАП (воспроизведение) – цифровое микширование до 32 потоков
данных;

Аппаратное преобразование частот дискретизации до 48 КГц из произвольной
частоты;

Использование менее 1% пропускной способности шины PCI для
воспроизведения звука 16 бит/stereo от 4 КГц до 44.1 КГц;

Системный интерфейс – 32-битная шина PCI Bus Master, совместимая со
спецификацией PCI 2.1 .

MIDI Wave Table синтезатор

Полифонический 48-канальный 50 MHz Wave Stream процессор с возможностью
одновременного воспроизведения 64 голосов;

Стандартный банк инструментов занимает 4 МБ и может загружаться как в
системную память, так и в 2 МБ локальной памяти ОЗУ или ПЗУ;

Программируемые спецэффекты, включая Reverb, Chorus, A3D;

Система A3D

Разработанная компанией Aureal технология позиционируемого 3D-звука;

Аппаратная акселерация позицинируемого 3D-звука;

Кристалльно-чистый звук с учетом атмосферы;

Реальная пространственная звуковая обстановка с учетом распространения
звука в двух измерениях;

Воспроизведение звука в любой точке пространства (до 360 градусов вокруг
слушателя).

Микшер

Микширование при воспроизведении: Line-In, MIDI-синтезатор, микрофон, CD
Audio, Wave ;

Микширование при записи: Line-In, MIDI-синтезатор, микрофон, CD Audio,
Wave.

Совместимость

Полная совместимость с Sound Blaster и Sound Blaster Pro ;

Plug and Play.

Основные особенности

64-голосный WaveTable MIDI-синтезатор ;

Analog/digital gameport и MPU-401 UART ;

Рабочее напряжение 3.3V, поддерживается 5V ;

Расширенные возможности по управлению питанием.

Дополнительные возможности

PCI Bus Master с 48-канальным DMA-интерфейсом ;

Аппаратная акселерация DirectSound и DirectSound3D ;

Поддержка A3D Interactive и A3D Surround ;

Акселерация AC-3 декодирования с использованием интерфейса акселератора
DSP ;

Интерфейс для голосовых ISA-модемов ;

Интерфейс акселератора DSP для AC-3 декодирования ;

Высококачественный преобразователь частот дискретизации ;

Цифровой микшер с контролем уровней сигналов.

Всего 48 стереоканалов для аппаратного микширования выбираемых из памяти
потоков, причем с точки зрения железа все они равноправны, имеют
аппаратные Sweep фильтры для ускорения A3D и могут выбирать и смешивать
стереопотоки с плавным изменением частоты воспроизведения (шаг 5 гц).

Текущие драйвера используют до 32 каналов для сэмплирования (ускорения
воспроизведения) MIDI (+еще 32 программных, опционально); 1 для
первичного DirectSound буфера (только одна DS программа одновременно);
до 48 для DirectSound буферов 2D; до 9 для DirectSound буферов 3D (по 2
канала на буфер, т.к. необходима разная скорость воспроизведения для
левого и правого уха); до 16 буферов для обычных Windows MCI программ
одновременно. Каналы выделяются динамически, всего их 48, т.е. если
воспроизводится MIDI, доступны не более 16 DS буферов и т.д.

В более ранних драйверах 32 канала всегда были для MIDI, для остального
только 16 (8 для 3D).

ЦАП и АЦП не микшируют, он один, стерео (2 канала) и внешний,
микшируется и обрабатывается все в DSP и в цифровом виде.

На ЦАПе диапазон частот всегда такой же как и в первичном буфере,
например 44100, а у каналов может быть определен пропускной
способностью: от 6 до 100 Кб в сек на канал. При обработке каждого
канала используется 6 точечная интерполяция и его частота приводится к
общей.

Aureal Vortex2

В настоящее время следующие карты используют чипсет Vortex 2:

Diamond Monster Sound MX300

Terratec XLerate Pro

Turtle Beach Montego II (OEM)

Turtle Beach Quadzilla

VideoLogic SonicVortex2

Xitel Storm Platinum

Aureal SuperQuad SQ2500

Vortex 2 имеет много новых возможностей:

Более мощные HRTF фильтры для более точного позиционирования источников
3D звука

Полная поддержка технологии A3D 2.0 Wavetracing

Большее число источников 2D и 3D звука поддерживается на аппаратном
уровне

Поддерживаются потоки A3D с частотой дискретизации до 48 kHz

Поддерживается 320 голосовая полифония (64 аппаратных + 256 программных)

10 полосный аппаратный графический стерео эквалайзер

Vortex 2 обладает всеми свойствами, которые сделали чипсет Vortex 1
таким замечательным продуктом:

Совместимость с Sound Blaster Pro

Поддержка игрового порта высокого класса

Поддержка S/PDIF (на тех картах, где этот порт реализован)

Готовность к использованию WDM (WDM ready)

Аппаратное ускорение обработки потоков DirectSound и DirectSound3D

Поддержка DLS (Level 1)

Драйверы с сертификатом Microsoft WHQL

Поддержка AC97 кодеков

Creative Labs Sound Blaster Live

(SB Live) Это PCI устройство, сочетающее в себе синтезатор-сэмплер,
мультиэффект процессор, цифровой микшер, многоканальный аудио рекордер,
процессор пространственного позиционирования звука, цифровой аудио и
MIDI интерфейс в одном флаконе, я бы даже сказал практически в одном
чипе. Главный прорыв здесь в показателях цена/качество и
цена/возможности. То что стоило раньше $1000, теперь стоит $150 (а
некоторые модификации даже $50)! Это делает доступным новое качество
звучания массовому покупателю.

Как говорилось ранее, все эти удивительные возможности сосредоточены в
одном небольшом кусочке кремния в керамической оболочке и имя ему – EMU
10K1. Это DSP (Цифровой сигнальный процессор) ориентированный на
обработку цифровых аудио данных разработан, как видно из названия,
фирмой E-MU, известнейшим производителем профессиональной аудио техники
уже давно принадлежащей фирме Creative.

EMU10K1 на сегодня один из мощнейших DSP применяемых в звуковой
индустрии. В нем использована та же технология, что и в профессиональных
изделиях фирмы E-MU E-synth и Audio Production Studio. Этот чип
интегрирует в себе музыкальный, звуковой и эффект процессоры. Все
сигналы обрабатываются с точностью 32 бит 48 КГц с использованием
запатентованной 8-ми точечной интерполяцией для уменьшения искажений.

Заявленные производителем аудио характеристики действительно впечатляют.

RATED LINE OUTPUT FULL SCALES OUTPUT

Line Output Dynamic 1.0 Vrms 1.40 Vrms

Frequency Response at -1dB 10Hz to 44kHz 10Hz to 44kHz

Signal-to-Noise Ratio (A-weighted) 96 dB 100 dB

THD + Noise (A-weighted) 0.002% 0.002%

Конечно, такие параметры как соотношение сигнал/шум и искажения сильно
зависят от способа измерения. Производитель, как правило, избирает
способ дающий лучшие результаты для его изделия. Поэтому для
объективности необходимо сравнение с другими платами.

На SB Live! нет ПЗУ, он использует до 32 Мб системной памяти компьютера
для хранения сэмплов (звуковых фрагментов, из которых состоят
инструменты), то есть является фактически сэмплером с очень хорошими
синтезаторными возможностями (фильтры, конверты, LFO, многослойная
структура инструментов и т.д.), соответствующими современному уровню
wavetable синтезаторов. Для выделения системной памяти под банки
инструментов используется технология dynaRAM, позволяющая динамически
увеличивать или уменьшать буфер в системной памяти под банки
инструментов (SoundFonts). Это очень удобно – не надо искать специальные
модули памяти для расширения памяти на карте, загрузка банков
практически мгновенная, к тому же память выделяется в виртуальном
адресном пространстве, а не в физической памяти и может свопироваться на
диск, освобождая физическое ОЗУ для других программ при необходимости.
Единственный минус данной технологии – использование некоторого
количества системных ресурсов при работе синтезатора, т.к. сэмплы при
игре прокачиваются по шине PCI из системной памяти в EMU10K1, но это
занимает не более 5% пропускной способности шины в самом пиковом случае
(максимальной полифонии) и практически этим можно пренебречь.

Технические характеристики синтезатора:

Полифония 64 голоса аппаратно с 8-ми точечной интерполяцией

Полифония 512 голосов (с последними драйверами) программно

48 MIDI каналов – 32 на аппаратный (2 MIDI порта) и 16 на программный
синтезатор

SoundFont технология загружаемых наборов инструментов

До 32 МБ системной памяти для загрузки инструментов

С картой поставляются три GM/GS совместимых набора инструментов 2МБ, 4МБ
и 8МБ, а также около 50-ти демонстрационных банков (всего около 100 МБ)
для различных направлений музыки от классики до ультра современных
стилей. Есть отличный редактор загружаемых инструментов Vienna SoundFont
Studio 2.3 для редактирования существующих и создания новых банков
инструментов в формате SoundFont 2 (SF2). Субъективно сэмплер звучит
хорошо, признаться даже не ожидал от Креатива. Звучание любого сэмплера
полностью зависит от того, какие звуки в него будут загружены, поэтому
для профессионального использования возможностей SB Live! необходимы
профессиональные библиотеки сэмплов в формате SF2. Фирма E-MU и
сторонние производители поставляют CD ROMы с банками инструментов в
формате SF2.

Эффект-процессор

Возможности эффект процессора:

Поддерживает цифровые эффекты в реальном времени такие как реверберация,
хорус, флэнжер, дисторшн, изменение высоты тона и др. для всех аудио
источников;

Производит обработку, микширование и позиционирование аудио потоков,
используя до 131 аппаратных канала;

изменяемая архитектура эффектов с установкой параметров эффектов и
посылов со всех источников звука;

полностью цифровая обработка и микширование, исключающая появление
шумов.

Другими словами есть эффект процессор с памятью, в которую можно грузить
программы и параметры эффектов. Существуют пресеты (предустановки) на
наборы эффектов, на алгоритмы и параметры каждого эффекта в отдельности.
Можно использовать имеющиеся пресеты или создавать свои и сохранять их
на диске, а затем загружать в эффект процессор. Предлагаются следующие
эффекты: реверберация (более 50-ти видов), хорус, флэнжер, эхо,
вокальный морфер, дисторшн, вращающийся динамик, сдвиг тона. У меня
получалось загружать одновременно до 5-ти эффектов. Два из них можно
назначить на MIDI контроллеры для поканальных посылов с синтезатора. На
все пять можно назначать посылы с источников звука – цифровой S/PDIF
вход, цифровой вход с CD (тоже S/PDIF), I2S цифровой вход (с DVD),
аналоговый (линейный/микрофонный/CD) аудио вход и Wave/DirectSound
поток. Тут открывается несколько интересных возможностей:

Можно использовать бластер как мультиэффект процессор в реальном
времени, то есть на вход подавать аналоговый или цифровой сигнал,
например, петь в микрофон, а на выходе получать сигнал обработанный
эффектами. Все это, естественно можно тут же записывать в файл, причем
можно писать обработанный сигнал, а можно необработанный (обработка при
этом слышна).

Wave/DirectSound поток, например wav файл или играющий программный
синтезатор, также можно пропустить (или не пропускать) через эффекты и
тут же записать в другой wav файл прямо в цифровом виде без D-A-D
преобразований. Это очень удобно при использовании программных
синтезаторов, особенно не умеющих самостоятельно писать в файл. Лайв
позволяет использовать до 32-х одновременно работающих звуковых сессий,
поэтому гипотетически можно, например, в SoundForge записывать
одновременно несколько работающих программных синтезаторов.

Что касается качества эффектов, то оно достаточно высокое, примерно на
уровне внешних процессоров эффектов стоимостью 200-400 долларов (типа
Alesis MIDIVerb), к тому же поскольку эффекты подгружаемые, возможно их
совершенствование в дальнейшем. Надо отметить, что существуют
программные эффекты в виде DirectX плагинов, которые по качеству
значительно превосходят предлагаемые Бластером.

Технология 3D позиционирования

Возможности:

Выбираемые пользователем установки оптимизации для наушников, 2-х или
4-х колонок

аппаратное ускорение DirectSound и DirectSound3D

поддержка до 32-х Direct3D потоков (с последней версией драйверов)

поддержка EAX расширения 3D позиционирования

Creative Multi Speaker Surround технология позиционирования источников
звука в 360o аудио пространстве

Эмуляция акустических характеристик различных помещений (холл, театр,
клуб и др.) для всех источников звука

Цифровой аудио акселератор

Возможности:

Запись/воспроизведение с точностью 8 или 16 бит

Частота квантования от 8 до 48 КГц

Вся обработка 32 битная

Запись/воспроизведение с аналоговых и цифровых входов/выходов

Аппаратный полный дуплекс (одновременная запись и воспроизведение)

Поддержка до 32-х одновременных аудио сессий с аппаратным 32 битным
микшированием

К сожалению, фирма Creative пока нигде не описывает параметры
использованных АЦП/ЦАП. Субъективно на слух воспроизведение очень
хорошее, без шумов, звук прозрачный, не пластмассовый. Запись тоже
вполне пристойная, но звук мне показался несколько жестковатым. Проблема
некоторой неуверенности во входных преобразователях решается установкой
внешнего АЦП, например Midiman Flying Calf A/D (20 bit 128 oversapling)
стоимостью менее 200 долларов. При этом мы полностью избавляемся от
возможных помех внутри корпуса компьютера, т.к. в компьютер у нас идет
только цифра (S/PDIF) и получаем отличный 20-ти битный входной тракт за
приемлемые деньги. Для домашней компьютерной студии главное хорошо
оцифровать, дальше вся работа происходит в цифре и на выходе –
записанный компакт, опять же цифровой, а для мониторинга аналоговые
выходы SB Live! вполне пригодны. Также хочу отметить еще один небольшой
недостаток SB Live! – цифровой выход только 48 КГц, но мне кажется это
не очень существенно.

MIDI интерфейс

Поддерживается MPU-401 UART режим.

Коннекторы

Внешние на основной плате:

Микрофонный вход

Линейный вход

Линейный выход фронтальный

Линейный выход тыловой

Джойстик/MIDI порт

Внешние на дополнительной плате:

RCA S/PDIF вход

RCA S/PDIF выход

MIDI вход

MIDI выход

Цифровой выход для будущего 8-ми колоночного расширения

Внутренние на основной плате:

CD цифровой вход (S/PDIF)

I2S цифровой вход

CD аналоговый вход

Аналоговый вход с автоответчика

AUX вход

Совместимость

Windows 95, 98

Windows NT 4.0

Microsoft DirectSound, Ditect3D

General MIDI

MPC-3

PCI 2.1

Системные требования

Минимально P133 16 Mb RAM (32 Mb сильно рекомендуют), PCI 2.1, но чем
всего больше, тем лучше.

В настоящее время выпускается несколько моделей SB Live!: SB Live!, SB
Live! Value, SB Live! Player, SB Live! 1024, SB Live! Platinum etc Они
отличаются лишь комплектацией, поставляемый ПО и незначительными
изенениями в разводке. Все же технические характеристики у них
одинаковы.

Сравнение двух монстров сегодняшнего рынка средних звуковых карт (SB
Live и Diamond Monster MX300)

Точнее, сравнение будет не двух, а двух с половиной карт. Для интереса в
тестирование была включена вышеописанная карта на YMF-724, из совсем
другого ценового диапазона. Тестирование будет нести в себе
дополнительную цель, проверить, так ли хороша эта «удивительная» карта с
возможностями Live’a и ценой старой ESS.

Люди готовые потратить $10 покупают старые и проверенные ISA карты на
базе OPTi 931 и ESS1868, за $15 нас ждет не менее старые и проверенные
PCI ESS Solo-1 и отличная, в своем классе, Yamaha YMF-724. За $20 Vortex
1 и Ensoniq 1370, в том числе в Creative исполнении. За $25 можно купить
ветерана – SoundBlaster AWE32. При этом, ниша $30 остается просто
незаполненной со стороны PCI карт, если не считать морально устаревшие
решения от Creative на базе Ensoniq 1371.

Далее плечом к плечу идут два смертельных врага – SoundBlaster Live!
(EMU10K1) и Diamond Monster Sound MX300 (Vortex2). Это для владельцев
$40..60. Причина столь высокой консервативности рынка была называется
легко специалистом по продажам. “Продается только то, что у покупают, а
покупают либо проверенные карты за $10-20, либо известных лидеров за
$60. Третьего не дано.”

Вот почему для сравнения было привлечено интегрированное в материнскую
плату Chaintech 6BTA2 звуковое решение на базе Yamaha YMF-724, которое,
в случае покупки новой материнской платы, обходится лишь в $10 разницы
(по сравнению с 6BTM). Итак, приступим:

Внешний вид

Начнем с YMF724, интегрированного в материнскую плату. Сам чип
расположен далеко от аудио разъемов, но это не внушает опасения,
благодаря внешнему AC’97 кодеку. Кодек TriTech 28023 распаян в
непосредственной близости от разъемов и, что явилось немаловажным
сюрпризом, аудио сигналы выведены на разъемы напрямую, без каких либо
активных буферных или усилительных элементов. Разумеется, присутствуют
выходные RC фильтры, но не более того. Забегая вперед, заметим, что
именно это способствовало поразительным для 16 бит аудио решения
результатам в тестах на соотношение сигнал/шум. Подобный подход имеет
свои плюсы и минусы, за более высокое качество передачи сигнала
приходится расплачиваться незащищенностью и слабой нагрузочной
способностью аудио входов и выходов. Еще одно преимущество
интегрированного решения – многослойная материнская плата способная
обеспечить гораздо более качественную разводку аудио сигналов, нежели
многие двусторонние PCI платы. Присутствуют два разъема для подключения
кнопок цифрового регулятора общей громкости, если таковой имеется в
корпусе компьютера или сделан самостоятельно. Есть разъем для
подключения CD привода или любого другого источника линейного сигнала.
Не распаяны два разъема, судя по всему, один из них цифровой выход,
назначение второго не ясно. Еще присутствует не упомянутый в
документации разъем моно входа для модема, обозначенный на плате как
CN19 и находящийся в непосредственной близи от кодека.

Sound Blaster Live! Value порадовал многослойной платой с позолотой,
высоким процентом распаянных деталей (не были распаяны лишь несколько
маловажных разъемов и один буферный усилитель непонятного назначения).
На плате присутствует гребенка цифрового интерфейса (4 SPDIF выхода и
один вход, обозначены как SPDIF_EXT), и что крайне приятно, распайка
всех разъемов приводится в электронной документации. Цифровые входы и
выходы имеют нестандартный для аудио оборудования уровень сигнала
(соответствующий цифровой логике), в результате чего не все источники
могут быть успешно к ним подключены. А вот на раздельно микшируемом
отдельном цифровом входе для CD (обозначен как CD_SPDIF), наоборот
присутствует буферный элемент, позволяющий подключать не только CD
приводы (с как правило логическим уровнем сигнала), но и другое SPDIF
оборудование. Четыре цифровых выхода от этого не страдают, т.к.
небольшая перегрузка подключаемого к ним оборудования не существенна, в
отличии от недостатка сигнала для нормальной работы входа. Есть не
распаянный разъем для кнопок регулировки громкости. Распаяны два
различных разъема TAD (моно вход-выход для модемов) и два дополнительных
линейных входа – CD_IN и AUX_IN. Еще есть не распаянный разъем I2S –
цифровой многоканальный интерфейс для декодеров DVD и прочего пока
несколько футуристического оборудования. На аналоговых входах активные
буферные элементы отсутствуют (за исключением микрофонного), на выходах
дело обстоит несколько странно. Если фронтальные колонки выведены с
главного 18 бит AC’97 кодека CT1297, через микросхему буферного
усилителя, то тыльный сигнал идет с дополнительной микросхемы 18 бит ЦАП
(Phillips 1330A) напрямую, обладая меньшей нагрузочной способностью. Но
самое интересное, что в результате, на тыльных выходах присутствует
более качественный сигнал, вероятно благодаря более высокому качеству
дополнительного ЦАП.

Diamond Monster Sound MX300 поражает своими размерами. Он больше Live! в
полтора раза, при этом количество элементов на плате приблизительно во
столько же раз меньше. Размеры продиктованы не только соображениями
солидности, но и наличием корректно расположенного разъема для дочерней
платы волнового синтеза. Присутствует большой разъем для дополнительной
карты цифрового ввода вывода, но его распайка не известна и, в отличие
от Live!, он не может быть использован без этой самой платы. Цена $30
скорее всего не напугает желающих подключить декодер AC-3 или другое
цифровое оборудование, но вот наличие этой платы на нашем рынке, к
сожалению, не гарантированно. Позолоченные внешние аудио разъемы вне
конкуренции, как и благородный черный цвет планки, на которую они
крепятся. Есть два внутренних линейных входа и разъем TAD. Непонятно
назначение не распаянного дополнительного стерео выхода, дублирующего
фронтальные колонки. Монтаж аккуратен, но не столь качественен, как в
случае Live!. Количество не распаянных деталей выше. Один
четырехканальный AC’97 18 бит кодек SigmaTel. Буферные усилители
присутствуют как на фронтальном, так и на тыльном выходе.

Шумы

Здесь нас ждет несколько сюрпризов. Тестирование проводилось на одном и
том же компьютере: Celeron 450A, 64Мб 8 нс PC-100 памяти, Chaintech
6BTA2, Creative GB TNT, Quantum SE 4.3Gb. Платы вставлялись в один и тот
же разъем PCI, в соседних двух разъемах по обе стороны какие либо платы
отсутствовали. Методика тестирования – 1000Гц эталонный сигнал,
положение ручек усиления регулировалось каждый раз для достижения
максимального, без сильного роста искажений и перегрузки пропускания
(как правило, это -3Дб..-5Дб, которые могли бы быть прибавлены к
результатом, если бы нас интересовало лишь получение максимальных
сигнал-шум характеристик, но точность передачи сигнала не менее важна).
Измерялось внутреннее кольцо (запись с внутреннего микшера) и внешнее
кольцо (запись с линейного выхода-1 на линейный вход) как в присутствие
сигнала, так и в его отсутствие. Остальные источники были полностью
выключены. Т.к. качество оцифровки превышает качество воспроизведения во
всех трех случаях, полученные параметры можно смело отнести к выходным.
Использовались частоты дискретизации 44100 и 48000 Гц, 16 бит стерео
сигнал.

Сигнал Квантование Линейный вход, Дб.

Стерео микшер, Дб.

Максимум Средние Максимум Средн.

Diamond Monster Sound MX 300 (Vortex2)

1000 Гц 44100 72 76 77 79

48000 68 70 70 73

Нет 44100 80 87 84 89

48000 75 79 78 83

Creative Sound Blaster Live! Value (Emu10K1)

1000 Гц 44100 72 75 76 78

48000 76 78 Нет Нет

Нет 44100 82 90 86 91

48000 89 93 Нет Нет

Chaintech 6BTA2 integrated (YMF724)

1000 Гц 44100 73 76 74 77

48000 73 77 75 77

нет 44100 82 89 84 88

48000 83 88 85 89

Итак, приступим к разбору полетов, а точнее шумов. Сюрприз номер один –
результаты интегрированной в материнскую плату YMF724. А, точнее 16 бит
кодека от TriTech, разведенного без каких либо буферных элементов. Это
практически запредельные результаты для 16 бит кодеков подобного класса.
Фактически, копеечное аудио в материнской плате умудрилось побить MX300
по качеству воспроизведения. Сюрприз номер два – сильно выраженные
зависимости отношения сигнал шум от частоты квантования как у MX300 так
и у Live!. Природа этого явления проста – кодеки обоих карт работают на
фиксированных частотах квантования, а цифровые данные динамически
перевыбираются для приведения к этой заданной частоте. Но подобное
преобразование неизбежно вносит собственный вклад в помехи. Причем, судя
по результатам, кодек Live! работает на частоте 48000 а кодек Vortex2
наоборот, на частоте 44100. В документации на чип говорилось о 48000 но,
вероятно, инженеры из Diamond Multimedia сочли необходимым установить
фиксированную частоту равной обще принятому стандарту на цифровой звук,
дабы повысить качество воспроизведения в большинстве программ. Итак,
можно рекомендовать владельцам Live! настраивать свои программы на
48000, а владельцем MX300 на 44100. Еще один сюрприз – десяти полосный
цифровой эквалайзер в Vortex2. По заявлениям Aureal имеющий отношение
сигнал шум порядка 96 Дб. На практике все оказалось гораздо хуже – в
случае отсутствия сигнала эквалайзер действительно не вносит
дополнительных шумов, что вполне логично, учитывая его цифровую природу.
Зато в нормальном режиме шумы абсолютно непереносимы, выдвинутые в
максимальные позиции движки способны ухудшить отношение сигнал шум на
добрых 15-20 Дб, что абсолютно не приемлемо. Приговор прост – отключить
его раз и навсегда, и пользоваться внешним усилителем с эквалайзером.

При работе с Live! также были замечены несколько странностей.
Периодически (несколько раз в секунду) появляется кратковременное
постоянное смещение порядка 10Дб, причем это происходит только при
частоте квантования 44100. Вероятно, в это время DSP переходит границу
внутреннего буфера, с помощью которого выполняется расчет эффектов или
перевыборка частот, причем реализован этот переход некорректно.
Отключение всех эффектов не спасает от этой помехи, зато переход на
частоту 48000 способен от нее избавить. Подобная же помеха наблюдается
во время регулировки громкости или примерно через треть секунды, после
прекращения какого-либо сигнала вне зависимости от частоты квантования.
Еще одна странность Live! – непомерное задирание высоких частот, при
установленном в настройках режиме вывода на наушники. При установке
дешевых пищалок этот подход оправдывает себя, т.к. способен несколько
подправить их ущербную АЧХ, но в случае мало-мальски нормальных
наушников звук становится отвратительным, и даже крайнее положение
регуляторов тембра не спасает ваши уши. Кстати, эти регуляторы в Live!
сделаны на славу, они практически не вносят шумов, хотя, есть подозрение
на их цифровую природу.

Последнее замечание – о микшировании сигналов. Если в MX300 и 6BTA2 эти
функции полностью возложены на кодеки (аналоговое микширование), то в
Live! микширование выполняется цифровым образом везде, где это только
возможно. Поэтому при записи с внутреннего микшера параметры
определялись только шумами перевыборки, а в случае частоты квантования
48000 шумы практически отсутствовали (т.е. превышали -96 Дб).

Загрузка процессора и прочие цифры

Для всех карт использовались последние из доступных на данный момент
официальных драйверов (т.е. релизы). Для сравнения приведены данные на
карту Ensoniq Audio PCI (чип ES1370), у которой отсутствует аппаратное
ускорение DirectSound.

Параметр MX300 Live! 6BTA2 ES1370

DirectSound каналов аппаратно 32 32 20 0

DirectSound3D каналов аппаратно 16 32 8 0

Загрузка CPU, DirectSound, 44100, 16 бит, 8 каналов 0.78 0 1.06 1.89

Загрузка CPU, DirectSound, 44100, 16 бит, 16 каналов 1.65 0 1.82 3.21

Загрузка CPU, DirectSound, 44100, 16 бит, 32 канала 4.58 0 3.62 5.97

Загрузка CPU, DirectSound3D, 44100, 16 бит, 8 каналов 6.85 1.8 8.09 13.8

Загрузка CPU, DirectSound3D, 44100, 16 бит, 16 каналов 7.90 2.44 20.4
25.1

Загрузка CPU, DirectSound3D, 44100, 16 бит, 32 канала 32.8 3.56 40.2
53.7

Какие же выводы можно сделать глядя на эту колонку цифр. Live!
несомненно чемпион, загрузка процессора минимальна. Правда, в отличие от
предыдущих драйверов, при воспроизведении DirectSound3D потоков она
стала возрастать линейно с числом голосов, хотя и не превысила
предыдущие значение (порядка 4% при любом количестве голосов). Это легко
объяснить, появлением HRTF функций, для которых необходима
предварительная обработка данных процессором отдельно для каждого
потока, а не только установка параметров реверберации всего помещения,
как это было раньше. Именно благодаря тому, что Live! является
полноценным DSP с загружаемыми на борт программами, загрузка процессора
столь низка. Даже в случае применения HRTF функций, пусть и не столь
совершенных, как у MX300 (о качестве 3D звука будет сказано далее).

На втором месте MX300, причем удивляет стабильный рост нагрузки при
росте числа 2D потоков (попахивает программной эмуляцией, особенно если
сравнить результаты с практически аналогичными у ES1370), вероятно все
железные возможности были направлены на обработку 3D потоков и их
отражений. В случае 3D все хорошо до тех пор, пока число каналов не
превысит 16, аппаратно ускоряемые чипом. В новых драйверах обещают
поддержку 76 3D потоков, но не известно, окажется эта поддержка
полностью аппаратной или нет, и не ухудшит ли она качество 3D звука.
Причем OEM версия новых драйверов 2030 уже доступна в сети на сайте
Aureal. В этих драйверах реализована поддержка 76 потоков 3D звука и
обещено существенное снижение загрузки CPU, осталось дождаться Retail
релиза драйверов от Diamond.

На третьем месте 6BTA2 и чип YMF724 соответственно, судя по загрузке
процессора, HRTF 3D звук от Sensaura реализуется полностью программно.

Качество

Вот здесь и начинается самое интересное. У MX300 3D звук практически
идеален, как на двух, так и на четырех колонках. Перемещение верх-низ
отлично прослушивается, чего не скажешь про остальных героев этой
статьи. При подключении четырех колонок оживает последняя ось –
вперед-назад и звук становится полностью трехмерным. Программы,
поддерживающие A3D 2.0 способны создать еще более реальное звучание,
благодаря учету отраженного и проходящего через препятствия звука. Если
вам важен лишь 3D звук и игровые возможности покупайте MX300 не
задумываясь. А вот качество воспроизведения MIDI, возможности
синтезатора и эффект процессор не идут ни в какое сравнение с Live! и
YMF724. Мягко говоря, MIDI и эффектами на MX300 лучше не пользоваться,
чего стоит один треск во время проигрывания DLS банков, ужасный хорус
эффект или шумный эквалайзер.

На данный момент драйвера Live! не позволяют достоверно определять
верх-низ и поэтому звук в играх скорее 2.5D. EAX основанный на заранее
выбранной для каждого помещения в игре реверберации придает звуку
естественность, но не позволяет свободно ориентироваться, сводя тем
самым все игровое преимущество на нет. Правда, в новых драйверах,
которые выйдут в конце этого месяца обещают полноценные HRTF функции
(причем речь идет о реализации HRTF для 4-х колонок), с не менее
качественным, нежели у MX300 позиционированием верх-низ и просчетом
проникающего и огибающего предметы звука. В EAX 2.0 параметры
реверберации станут меняться в зависимости от положения игрока, что,
возможно, обеспечит не менее качественную, чем у MX300 ориентацию в
пространстве. Подождем, увидим! Если это будет действительно так, MX300
сильно сдаст свои позиции. MIDI у Live! просто великолепно, оно
соответствует всем профессиональным требованиям, поддерживается
прекрасный формат банков SoundFont 2.0, звучание EMU10K1 превосходит
EMU8001 (AWE32-64), DSP Dream и другие распространенные на PC
синтезаторы, за исключением, пожалуй, дочерних карт от Yamaha – DB50XG.
Но последние не способны загружать внешние банки инструментов, а в
случае Live! их размер практически не ограничен (драйвера разрешают
отвести до половины системной памяти, но этот порог преодолевается
внесением исправлений в реестр). Регуляторы громкости на Live! ведут
себя несколько иначе, чем на остальных картах. Передача сигнала один к
одному соответствует примерно 55-60% положению для многих движков
микшера. Это оставляет простор для усиления слабых сигналов, но и
способно привести к искажениям, если не знающий об этой особенности
человек будет по привычке выставлять максимум при записи с цифрового или
линейного входа. Последний момент – возможность поставить на Live!
драйвера от стоящей $600 профессиональной платы EMU Audio Production
Studio. При этом перестает работать аналоговый выход (на APS стоит
специальный 20 бит кодек от Crystal), но данные можно снимать с
цифрового выхода, сэкономив, таким образом, несколько сотен долларов,
при сохранении всех возможностей драйверов APS.

Материнская плата Chaintech 6BTA2 и расположенный на ней YMF724
предоставляют достаточно неплохой 3D звук на двух колонках, в отличие от
Live!, с возможностью, в большинстве случаев различать верх-низ. К
сожалению, при этом сильно загружается процессор, и требовательные к
ресурсам игры идут медленнее. С первого взгляда может показаться, что
MIDI на высоком уровне, практически как у DB50XG, но постепенно
всплывают различия. Как сознательно, так и по необходимости,
привнесенные фирмой Yamaha. Банк вдвое меньшего размера, отрабатываются
все основные XG эффекты, но, судя по их реализации, это делается
программно (несколько шумно) а не аппаратно, да и рассчитывается всего
16 бит (а не 18, как на DB50XG, имеющей, кстати, три аппаратных
процессора эффектов). И все равно, благодаря XG формату и эффектам
большинство MIDI композиций звучит очень прилично. В новых драйверах
появилась поддержка EAX, загружающая процессор сильнее, чем у Live! и
как-то неестественно сухо звучащая.

Итоги

Пока все осталось на своих местах. Если Вы хотите играть – MX300. Если
Вы хотите писать музыку, слушать или записывать живой звук – Live!. Если
у вас нет денег на Live!, но Вы все равно хотите писать и слушать, то
купите YMF724 с добротным кодеком, точно не пожалеете.

Некоторые аспекты качественного воспроизведения цифрового звука

Качеству звучания звуковых плат уделяется должное внимание, но по
непонятным причинам в обзорах обходят аналоговую часть схемы. Все
преимущества в программной и цифровой части могут с легкостью потеряться
из-за несовершенной аналоговой части схемы. Это важно в первую очередь
для музыкантов и аудиофилов, но может быть полезно и для рядовых
слушателей, заинтересованных в качественном воспроизведении на
компьютере музыки.

Основные проблемы с возникновением искажений по причине схемотехнических
приложений возможны как на входах, так и на выходе. Вход для оцифровки
аналогового сигнала (линейный вход, микрофон) требует обязательной
фильтрации частот не входящих в звуковой диапазон. Особенно опасна
частота, близкая к частоте дискретизации (~44 кГц) – возникают
разностные частоты при умножении входного сигнала и помехи на первом же
усилительном (нелинейном) элементе. Получаются помехи в звуковом
диапазоне, которые уже нет возможности отфильтровать. Входной фильтр
должен быть рассчитан так, чтобы выполнять функции согласующего
устройства с источником сигнала. Встроенный микрофонный усилитель с этой
задачей справляется, а вот линейный вход часто не имеет
стандартизованного сопротивления. Ненормальное соотношение высоких и
низких частот является следствием этого рассогласования.

Вход для аналогового сигнала от CD-ROM также должен содержать фильтр
подавления частоты дискретизации. Выходной сигнал перед подачей на
звуковую плату не фильтруется, чтобы не конфликтовать с фильтром на
карте. Большое количество встречающихся звуковых плат разрабатывались с
фильтром, но на практике фильтр отсутствует. Примерно такой же фильтр
необходим на выходе карты после ЦАП (DAC). Его реализация особенно
необходима при записи сигнала на магнитную ленту, поскольку усилитель
записи выходит из нормального режима и происходит насыщение и паразитное
намагничивание магнитной ленты. Подмагничивание ленты производить
необходимо для качественной записи низких звуковых частот, это
продиктовано физическими особенностями записи на магнитные носители, а
частота дискретизации производит нарушение режима подмагничивания. Еще
возникают проблемы с внешними усилителями мощности с глубокой обратной
связью (скажем, плохие усилители, склонные к возбуждению). Замечается
неустойчивая работа усилителя или выход его из строя.

Использование на плате перемычек для конфигурирования аналогового тракта
только приветствуется. Очень неприятно обнаружить отсутствие линейного
выхода на звуковой плате, т.к. использовать сигнал, пропущенный через
встроенный усилитель для подачи на внешний усилитель нежелательно.
Встроенный усилитель, рассчитанный на применение с наушниками или
маленькими динамиками, имеет не лучшие характеристики, особенно по шумам
и гармоникам, да и низковольтное питание от компьютерного импульсного
блока питания, на котором висят цифровые схемы, качества не добавляет –
появляются специфические шумы от работы цифровых микросхем и двигателей
приводов внешних накопителей.

Часто, чтобы добиться сносного звучания приходится впаивать перемычки
(джамперы), которые подразумеваются, но отсутствуют на плате. К примеру,
для отключения встроенного усилителя. Причем наибольшие шумы наводятся
по питанию именно на усилитель (слышно “работу” CD-ROM и винчестера,
т.к. он обычно питается от 12-вольтовой шины). На этой шине нет
специальных решений для фильтрации помех, а мощные двигатели приводов
производят их в большом количестве. Изучение множества плат привело к
печальным выводам. Ни маститые производители, ни производители с востока
с “левыми” платами не уделяют должного внимания аналоговой части своих
карт. Часто это представлено в виде отсутствия “лишних” деталей на
плате, особенно этим поражены “левые” платы. Интересно, кому нужна такая
“экономия” на мелочах? 🙂

Некоторое удивление вызвало знакомство с новой платой Monster Sound
MX300 от компании Diamond Multimedia. Революционность чипа Vortex 2 не
вызывает сомнений, но реализация платы выдает стремление фирмы экономить
на всем, чем можно и нельзя. Возможно, сам чип не дешев, но и цена платы
не мала, можно было и постараться. Отсутствует должная реализация
фильтров на выходе с ЦАП и входе с CD-ROM. Усилитель для наушников
сделан на транзисторах, возможно для меньших искажений при низком
напряжении питания (но такая схема не борется с синфазными
искажениями!!!), а, скорее всего, из экономии. Радует отдельный линейный
выход. Возможность же получить от этой карты все в воспроизведении звука
требует платы расширения с цифровым выходом S/PDIF (MX-25). Но для этого
потребуется усилитель с цифровым входом или применить внешний ЦАП и
усилитель, получим почти Hi-End. Главные плюсы в отдельном блоке питания
для ЦАП и все-таки грамотное аналоговое решение. В качестве
положительного примера следует выделить фирмы Gravis (к сожалению
ушедшей с рынка звуковых карт) и Voyetra Turtle Beach. На платах любых
ценовых категорий и направлений аналоговая часть решена великолепно.
Даже старая карта Gravis Ultrasound GF1 (как много в этом звуке… :-))
в дешевом варианте, соизмеримом в свое время по цене с современной
платой MX300 с точки зрения рассматриваемого вопроса произведена очень
хорошо. Все необходимые фильтры рассчитаны с запасом, а особенно приятно
множество перемычек, с помощью которых можно обходить любой фильтр и
усилитель при применении внешних фильтров и усилителей. Примерно такой
должна быть конфигурация звуковой платы для качественного
воспроизведения звука. Надеюсь, что и плата Montego II Quadzilla на
Vortex 2 будет при соизмеримой цене лучше MX300, а модификация Home
Studio еще содержит и цифровой вход/выход S/PDIF и оптический вход/выход
на основной плате.

Руководствуясь этим наблюдением можно выделить несколько пунктов, учет
которых желателен при выборе звуковой платы:

Желательно иметь отдельный линейный выход или перемычки для обхода
сигналом внутреннего усилителя, что позволит не вносить в сигнал
дополнительных шумов при выводе на внешний усилитель.

При использовании звуковой платы в качестве источника сигналов для
записи на магнитный носитель необходим фильтр, режущий частоту
дискретизации. Это относится к любым выходным сигналам независимо от
того, как они синтезировались, будь то WAV, MIDI или сигнал синтеза.

Для исключения проблем с воспроизведением, оцифровкой и микшированием
звука с Audio CD, требуется, чтобы по входу для CD-ROM стоял фильтр того
же плана, что оговорен в предыдущем пункте.

Для использования платы для качественной оцифровки аналогового звука на
входе требуется хороший активный фильтр.

Пара моментов, которые отчасти могут объяснить отсутствие входных
(anti-aliasing) и выходных сглаживающих (smoothing) фильтров:

1. Безусловно, перед оцифровкой аналогового сигнала его необходимо
пропустить через входной фильтр 4-8 порядка с частотой среза 20 кГц дабы
подавить дополнительные спектральные составляющие, зеркальные основному
спектру сигнала относительно частоты дискретизации. Интересующиеся могут
прочитать любую книгу по основам цифровой обработки сигналов в
библиотеке или просмотреть главу из соответствующей книги прямо в
книжном магазине. Но, вообще говоря, большинство современных
многоразрядных (16 и более) АЦП выполнены на базе сигма-дельта
технологии. Отличительной чертой данных АЦП является существенно
повышенная частота дискретизациия сигнала (1…15…20 Мгц в зависимости
от реализации) и постобработка цифрового потока нардверным цифровым
фильтром, встроенным в АЦП до необходимой полосы (20 – 22 кГц).
Поскольку дополнительный спектр сигнала при этом смещается в область
запредельных частот, то и достаточное его подавление возможно очень
простым фильтром. Очевидно этим и объясняется отсутствие входных
фильтров на входах плат или наличие совершенно простенького фильтра 1-2
порядка, вызывающее недоумение у людей, которые более-менее сталкивались
с этими проблемами в профессиональных/любительских условиях.

2. Касаемо выходных (сглаживающих, восстанавливающих – кому какая
терминология нравится :-)) фильтров. Многие, видимо читали в описании CD
ROM о том, что в нём стоит 1 разрядный ЦАП с 8х частотой дискретизации.
Очевидно, что и в них применяется сигма-дельта технология, что также
позволяет использовать фильтры малых порядков для восстановления
аналоговl